hive环境配置好了, 那我们就开始玩hive吧.
Hive的数据类型
1 | 基本数据类型 |
1 | 复杂数据类型: |
1 | 时间类型: Date和Timestamp |
Hive数据存储
1 | Hive的数据都是保存在HDFS上的. |
Table内部表
1 | create table t1(tid int, tname string, age int); |
Partition分区表
1 | 概念: |
External Table外部表
1 | 指向已经在hdfs中存在的数据, 可以创建分区表 |
Bucket Table表
1 | 经过hash取值, 然后数据打散掉, 最后存在文件中. 将相同的hash值放到一个桶中, 然后提高查询效率. |
视图
1 | 视图是一个虚表, 他是一个逻辑概念的表. 可以跨越多张表. |