Yarn是Hadoop的资源管理器,提交任务和任务执行是Yarn最基本的流程。 本文基于Hadoop3.3.4版本
探索Spark Executor在任务执行过程中的状态传递
Elasticsearch发布版本内容和发布时间
分层存储是Kafka3.6.0实现的新特性,用于解决数据日益增长后的扩展性、效率和可操作性的问题。
本文基于kafka3.6.0源码,描述kafka日志段的清理机制
本文基于kakfa1.0.0,从源码层面解析Kafka分区副本的同步机制
Kafka ListOffsets请求和处理过程,本文基于kafka2.8.0版本
HTAP在设计实现中的关键技术解读
Pipeline 是一种执行引擎模型,是通过将复杂的计算链路拆分成多个小部分,通过各种手段来执行 Pipeline 中的任务完成高效率的计算。
本文基于Doris3.0.0版本,参考官方文档https://doris.apache.org/zh-CN/docs/get-starting/what-is-apache-doris