Hive文件存储格式——AVRO

Avro是一个数据序列化系统,设计用于支持大批量数据交换的应用。

nieo nieo 发布于 2017-04-23

Hive文件存储格式——SequenceFile

SequenceFile是Hadoop提供的一种二进制文件支持,具有使用方便、可分割、可压缩的特点。

nieo nieo 发布于 2017-04-22

Hive文件存储格式

Hive存储格式表示表数据在文件中的组织形式。

nieo nieo 发布于 2017-04-19

Hive压缩格式

Hive压缩格式也压缩算法

nieo nieo 发布于 2017-04-16

Hive优化——严格模式优化

严格模式主要是保证任务的执行完去按照我们的设计来完成,不出纰漏。

nieo nieo 发布于 2017-04-15

Hive优化——并行执行优化

Hive中可同时执行多个Stage,这就是并行执行优化。

nieo nieo 发布于 2017-04-12

Hive优化——本地模式优化

本地模式优化主要适应输入数据集比较小的场景。

nieo nieo 发布于 2017-04-09

Hive优化——Fetch抓取优化

Hive在一些简单的Select查询时,可以使用Fetch抓取优化。

nieo nieo 发布于 2017-04-09

Hive优化——矢量化查询优化

在特殊场景下,通过矢量查询能更快得到结果。

nieo nieo 发布于 2017-04-08

Hive优化——谓词下推优化

谓词相当于Hive SQL中的过滤条件,下推表示前移。

nieo nieo 发布于 2017-04-05