hive增加自动合并小文件配置以及在map阶段将多个小文件合并成一个计算。可以提高资源的利用率。
比如由于小文件原先需要启动10个map,现在只需要启动2个map。
hadoop hive 环境: hadoop2.6+hive1.2.1 lzo压缩
hive-site.xml 配置
hive增加自动合并小文件配置以及在map阶段将多个小文件合并成一个计算。可以提高资源的利用率。
比如由于小文件原先需要启动10个map,现在只需要启动2个map。
hadoop hive 环境: hadoop2.6+hive1.2.1 lzo压缩
hive-site.xml 配置