在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、HDFS IO、网络IO等方面。Hive会计算同一SQL语句的不同执行计划的计算成本,并选出成本最低的执行计划。目前CBO在hive的MR引擎下主要用于join的优化,例如多表join的join顺序。
相关参数有1个:
(1)set hive.cbo.enable=true;——启用cbo优化。
官方文档请查看:https://cwiki.apache.org/confluence/display/Hive/Cost-based+optimization+in+Hive