講師回答 / 徐老師
針對你提的這個疑問:【如果集群規模比較大時,要在每一個節點上面啟動 jobhistorysever豈不是很麻煩?】在生產環境下搭建大數據集群的時候,建議使用CDH或者HDP進行搭建,方便運維管理,主需要通過頁面操作就可以實現hadoop集群的搭建,這些進程也都會自動啟動,不需要單獨手工操作。
2020-10-26
講師回答 / 徐老師
針對你說的這種場景,會出現這種結果:有2個節點讀取本地節點中的數據進行本地計算,另外2個節點上沒有數據的,則會跨節點拉取數據進行計算。默認情況下會優先讀取本節點的數據,這是最優的策略,如果由于各種原因無法滿足這種策略,會退而求其次,進行跨節點數據傳輸
2020-10-26
講師回答 / 徐老師
官網下載地址:https://archive.apache.org/dist/hadoop/common/hadoop-3.2.0/hadoop-3.2.0.tar.gz
2020-09-09
已采納回答 / 徐老師
json數據的資料、sqoop相關的資料已經上傳到這個網盤鏈接中了鏈接:https://pan.baidu.com/s/1AhKOkvsob_ugADZaQc6RlQ?提取碼:dy6j
2020-08-12
已采納回答 / 徐老師
應該是resourcemanager相關的進程沒有啟動成功,需要查看一下集群中resourcemanager進程的啟動日志如果按照視頻中的目錄進行配置的話,日志是在/data/hadoop_repo/logs/hadoop這個目錄下hadoop-root-resourcemanager-bigdata01.log我估計很大概率是yarn-site.xml配置的有問題,具體的可以看看這個日志文件,如果解決不了的話,把這個日志文件里面的錯誤信息貼出來我看看
2020-08-09
已采納回答 / 徐老師
你現在的情況是hdfs的服務都起來了,所以訪問192.168.100.10:9870是可以的而NodeManager 和 ResourceManager進程沒起來,說明YARN服務沒有起來,應該是YARN的相關配置文件修改的有問題你在啟動的時候控制臺有沒有顯示錯誤問題?如果沒有的話到hadoop的logs目錄下(/data/hadoop_repo/logs/hadoop這個目錄下)看一下這個日志hadoop-root-resourcemanager-bigdata01.log,這里面會顯示Resource...
2020-07-20
講師回答 / 徐老師
sqoop1.4.7 下載地址? 請查收?https://downloads.apache.org/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
2020-07-09
講師回答 / 徐老師
一般出現這種情況是因為依賴包沒有下載成功,你可以到你本地的maven倉庫中確認一下對應的jar包是否成功下載或者嘗試重新強制下載依賴,使用命令 mvn clean compile
2020-06-24