hive 创建一个简单外联表
hdfs 创建目录
首先需要在hdfs上创建一个目录,用于存放hive表得数据。
1 | hdfs dfs -mkdir /tmp/yarn-count-application |
hive 创建表
这时候可以再hive上创建外联表了。
1 | create external table op_count_yarn( |
location 指向 hdfs 上创建的目录就可以了
产生数据
把你需要的数据放在hdfs得目录下
1 | hdfs dfs -put hour_all_count.txt /tmp/yarn-count-application/ |
查询数据
这时候就可以用hive还查询数据量
1 | hive> select * from op_count_yarn; |
1 | hive> select sum(num) from op_count_yarn where dt like "2018-12-20-%"; |
查看分区
1 | show partitions op_yarn_job; |
添加分区
1 | alter table default.op_yarn_job ADD if NOT exists partition(dt='$YY-$MM-$DD'); |
删除分区
1 | ALTER TABLE table_name DROP PARTITION (day='20140722'); |
查看是内部表还是外部表
1 | describe extended tablename; |