hive on tez的调优《数据仓库》
原创
©著作权归作者所有:来自51CTO博客作者liuyunshengsir的原创作品,请联系作者获取转载授权,否则将追究法律责任
1.常遇到的问题
insert overwrite table dwd_user
select xh,name from ods_user
- 1.2 hive查询语句涉及到需要mapreduce处理的也报错
2.关联关系

3.调优实践
假如我们使用的节点资源如上图所示,根据hive解析sql提交给tez,tez任务提交给yarn,所以内存大小配置一定不要超出容器的大小:
3.1 配置yarn
yarn.nodemanager.resource.memory-mb =300G
yarn.scheduler.minimum-allocation-mb =4G
yarn.scheduler.maximum-allocation-mb = 20G
3.2 配置tez
tez.am.resource.memory.mb =2G
tez.runtime.io.sort.mb =3G
3.3 配置hive
hive.tez.container.size = 3.2G
参考了国外的文档,国内资料都不靠谱https://community.cloudera.com/t5/Community-Articles/Demystify-Apache-Tez-Memory-Tuning-Step-by-Step/ta-p/245279