簡介:本課程會依次向大家介紹中臺的誕生背景、數據中臺的架構以及如何進行合理得技術選型,并結合一個通用的關系型數據庫同步至HDFS的工具套件實現,帶大家拓展了基于Spark的多源異構數據同步工具的設計思路。
第1章 中臺的前世今生
本章中會依次向大家介紹,中臺的系統架構是如何誕生的、各類型架構的特點和存在的問題、數據中臺架構是如何解決這些問題的,以及中臺的演進過程,幫助大家對中臺有初步得了解。
第2章 數據中臺體系
在本章中,首先會從數據應用的角度帶大家回顧數據中臺的誕生過程;然后介紹一個成熟的數據中臺應該具備的核心能力,并對數據中臺的架構按照模塊進行分解,介紹每個模塊的功能,以及各自得技術選型。
第3章 基于Spark的多源異構數據同步套件
本章中會依次介紹數據采集、匯聚的技術架構;一個成熟的數據同步套件的架構以及具備的功能,并帶領大家實現一個具備完整功能的關系型數據庫同步至HDFS的工具套件,拓展基于Spark的通用的數據同步套件的設計思路。
- 視頻: 3-1 數據采集、匯聚的技術架構 (10:40)
- 視頻: 3-2 構建異構數據源的同步套件 (05:29)
- 視頻: 3-3 DataX數據同步案例 (15:30)
- 視頻: 3-4 移植DataX的配置管理功能 (07:30)
- 視頻: 3-5 配置管理的功能點代碼演示 (09:32)
- 視頻: 3-6 關系型數據庫同步至HDFS的功能開發 (07:44)
- 視頻: 3-7 同步流程抽象為三大模塊 (06:04)
- 視頻: 3-8 三大模塊的整體架構實現 (11:02)
- 視頻: 3-9 三大模塊的具體功能實現 (10:29)
- 視頻: 3-10 數據轉換模塊的插件化管理 (12:37)
- 視頻: 3-11 基于Spark的數據同步套件設計思路 (04:33)
- 視頻: 3-12 本章總結 (02:35)
解鎖即可觀看《大數據工程師》完整課程視頻
大數據工程師
硬核技能帶你攻克熱點商業項目,從入門直達中級工程師水平,掌握DT時代淘金利器!
【第1周】學好大數據先攻克Linux
【第2周】大數據起源之初識Hadoop
【第3周】Hadoop之HDFS的使用
【第4周】Hadoop之HDFS核心進程剖析
【第5周】Hadoop之初識MR
【第6周】拿來就用的企業級解決方案
【第7周】Flume從0到高手一站式養成記
【第8周】數據倉庫Hive從入門到小牛
【第9周】Hive擴展內容
【第10周】快速上手NoSQL數據庫HBase
【第11周】數據分析引擎之Impala
【第12周】7天極速掌握Scala語言
【第13周】Spark快速上手
【第14周】Spark性能優化的道與術
【第15周】Spark3.x擴展內容
【第16周】綜合項目:電商數據倉庫之用戶行為數倉
【第17周】綜合項目:電商數據倉庫之商品訂單數倉
【第18周】消息隊列之Kafka從入門到小牛
【第19周】極速上手內存數據庫Redis
【第20周】Flink快速上手篇
【第21周】Flink高級進階之路
【第22周】Flink1.15新特性及狀態的使用
【第23周】Flink1.15之狀態的容錯與一致性
【第24周】FlinkSQL(1.15)快速上手
【第25周】FlinkSQL雙流JOIN詳解
【第26周】全文檢索引擎Elasticsearch
【第27周】Es+HBase仿百度搜索引擎項目
【第28周】直播平臺三度關系推薦V1.0
【第29周】直播平臺三度關系推薦V2.0
【第30周】數據中臺大屏
【第31周】實時OLAP引擎之ClickHouse
【第32周】實時數倉-Kafka Eagle+DS
【第33周】實時數倉-Flink CDC數據采集
【第34周】實時數倉-Paimon(數據湖)快速上手
【第35周】實時數倉-Paimon(數據湖)高級進階
【第36周】實時數倉-湖倉一體項目
【第37周】一站式流式開發平臺StreamPark
【第38周】大數據分布式SQL網關Kyuubi