Hive优化——CBO优化


发布于 2017-04-02 / 38 阅读 / 0 评论 /
CBO全称为Cost Based Optimizer,基于计算成本的优化。

在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、HDFS IO、网络IO等方面。Hive会计算同一SQL语句的不同执行计划的计算成本,并选出成本最低的执行计划。目前CBO在hive的MR引擎下主要用于join的优化,例如多表join的join顺序。

相关参数有1个:

(1)set hive.cbo.enable=true;——启用cbo优化。

官方文档请查看:https://cwiki.apache.org/confluence/display/Hive/Cost-based+optimization+in+Hive