Hive优化——本地模式优化

发布于 2017-04-09 / 103 阅读 / 0 评论 /

本地模式优化主要适应输入数据集比较小的场景。

大多数的Hadoop Job是需要Hadoop提供完整的可扩展性来处理大数据集的。不过，有时hive的输入数据量是非常小的。在这种情况下，为查询出发执行任务消耗的时间可能会比job的执行时间要多得多。对于大多数这种情况，hive可以通过本地模式在单台机器上处理所有的任务。对于小数据集，执行时间明显被缩短。