個人信息
北京 - 北京市 這位同學很懶,木有簽名的說~
成長數據

spark streaming源碼解讀之job動態生成和深度思考

貫通Spark Streaming JobScheduler內幕實現和深入思考

Spark Streaming源碼解讀之數據清理內幕徹底解密

Hive擴展功能(四)--HiveServer2服務

Hive擴展功能(五)--HiveServer2服務高可用

Hive擴展功能(六)--HPL/SQL(可使用存儲過程)

spark RDD 編程

深入理解Spark 2.1 Core (十):Shuffle Map 端的原理與源碼分析

深入理解Spark 2.1 Core (十一):Shuffle Reduce 端的原理與源碼分析

Spark Multi Tenancy系列 - 3 項目簡介

Spark Multi Tenancy系列 - 4 異常處理:初始化HiveSessionState失敗

Spark MLlib機器學習開發指南(3)--Pipelines

[spark] 內存管理 MemoryManager 解析

遠程通過jupyter(ipython) notebook調用服務器環境運行Spark(pyspark+scala方式)

[spark streaming] DStream 和 DStreamGraph 解析

Spark源碼編譯

Spark版本升級二三事

Spark SQL中的Encoder

Spark Streaming 數據接收優化

Spark Streaming Direct Approach (No Receivers) 分析