服务设计的5A标准中,可授权(Authorization)和可审计(auditable)是重要的组成部分。Kafka中,authorizer和audit是相互关联的。
kafka允许使用SSL来加密传输的数据和认证信息。默认情况下是不使用SSL的,可在需要时开启SSL。
Kafka0.11.0.0版本内容和发布时间
为了解决方案二的两个问题,kafka进行了新一轮的Rebalance方案优化
方案二就是GroupCoordinator方案
Kafka Consumer Group Rebalance是分配topic的各个分区由哪些consumer进行消费的一种策略。在Kafka的演进过程中,Rebalance历经过多次设计改版,下面是第一版。
Yarn运行日志管理主要是NodeManager中Executor任务执行日志的管理。
Yarn设计有一种分布式缓存机制,把资源文件缓存到NodeManager,可以加速任务启动过程。
不同的Hive文件存储格式与压缩算法组合之后的计算效率压缩性能有较大差异。
Parquet是一种新型列式存储格式。