Pulsar在商业化场景中是如何使用的
当前Pulsar的特性说明
Pulsar发布版本的内容和发布时间
SparkSQL中的DDL语句的执行主要通过对应的catalog元数据管理器来完成。
SparkSQL中,我们可以通过SHOW来查看table、database、namespace、catalog的列表。
本文基于kafka3.6.0源码,从源码级别解析Kafka消息消费过程
基于kafka3.6.0源码,解析KafkaProducer生产消息过程
本文基于Hadoop-3.5.0,解读Yarn的状态机
Knox代理Spark History WebUI的问题
通过Yarn Client模式提交Spark任务,任务结束后,driver进程无法结束,一直阻塞。如果大量提交Spark任务,服务器中就会有大量的SparkSubmit进程,最终导致机器内存溢出。