Hive事务设计和实现
这是2021年某公司的真实案例。随着业务的发展,Hive Metastore可能称为性能瓶颈,纵向扩容只能解决一时的问题,横向扩容才能永久地解决问题。
通过wagger-dance来实现hive联邦查询方案
大数据生产实践中,偶尔会遇到Hive迁移和备份的场景,下面我们看下Hive的迁移方案是怎么样的
Hive各发布版本的时间
Hive存储处理器的实现,本文基于Hive-4.0.0
Java Demo访问Kerberos认证的Hive
不同的Hive文件存储格式与压缩算法组合之后的计算效率压缩性能有较大差异。
Parquet是一种新型列式存储格式。
ORC全称为Optimized Row Columnar,优化列式存储。