講師回答 / 徐老師
針對你提的這個疑問:【如果集群規模比較大時,要在每一個節點上面啟動 jobhistorysever豈不是很麻煩?】在生產環境下搭建大數據集群的時候,建議使用CDH或者HDP進行搭建,方便運維管理,主需要通過頁面操作就可以實現hadoop集群的搭建,這些進程也都會自動啟動,不需要單獨手工操作。
2020-10-26
講師回答 / 徐老師
針對你說的這種場景,會出現這種結果:有2個節點讀取本地節點中的數據進行本地計算,另外2個節點上沒有數據的,則會跨節點拉取數據進行計算。默認情況下會優先讀取本節點的數據,這是最優的策略,如果由于各種原因無法滿足這種策略,會退而求其次,進行跨節點數據傳輸
2020-10-26
講師回答 / 徐老師
官網下載地址:https://archive.apache.org/dist/hadoop/common/hadoop-3.2.0/hadoop-3.2.0.tar.gz
2020-09-09
已采納回答 / 徐老師
你現在的情況是hdfs的服務都起來了,所以訪問192.168.100.10:9870是可以的而NodeManager 和 ResourceManager進程沒起來,說明YARN服務沒有起來,應該是YARN的相關配置文件修改的有問題你在啟動的時候控制臺有沒有顯示錯誤問題?如果沒有的話到hadoop的logs目錄下(/data/hadoop_repo/logs/hadoop這個目錄下)看一下這個日志hadoop-root-resourcemanager-bigdata01.log,這里面會顯示Resource...
2020-07-20
講師回答 / 徐老師
sqoop1.4.7 下載地址? 請查收?https://downloads.apache.org/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
2020-07-09
講師回答 / 徐老師
一般出現這種情況是因為依賴包沒有下載成功,你可以到你本地的maven倉庫中確認一下對應的jar包是否成功下載或者嘗試重新強制下載依賴,使用命令 mvn clean compile
2020-06-24
講師回答 / 徐老師
我之前寫的有一篇博客講如何在docker中安裝hadoop集群,是16年的時候寫的,hadooop的版本用的是2.4的,你可以參考下,最近我抽時間看看最新版本的再寫一篇博客https://blog.csdn.net/xu470438000/article/details/50512442
2020-06-21