需要什么基礎呢,怎么開始著手呢,求老司機帶路。
大數據該怎么開始學習
慕萊塢9220042
2016-04-08 14:41:05
TA貢獻2條經驗 獲得超1個贊
今年六月份畢業的,畢業設計的題目是:基于Hadoop的醫療數,據統計分析系統設計。之前對于hadoop也是無限憧憬,才在去年選題的時候,選了大數據相關的課題。今年三月份,催著交開題報告、中期檢查表和各種資料了,才開始著手hadoop的研究。和之前的答主說的一樣,選擇了Tom White的《Hadoop:The Definitive Guide 》,e,好吧,是中文第三版??戳讼聲r間,和提問時間是差不多的,只是我不常用imooc
雖然說,畢業設計順利完成了,但是項目中并沒有使用HBase、Hive等數據庫,而是將txt的病歷信息文件直接存在HDFS中,過程中,印象最深刻的就是hadoop集群環境的搭建了,偽分布式、完全分布式都嘗試了一遍,這里又要說了,因為被催著交資料,我是參照著書籍、大神們的博客先搭建好了集群環境,才細看了各個配置參數的意義,然后才研究了HDFS和MapReduce,Yarn。
回答這個問題的,其實也是希望題主 給介紹下,你之前的Hadoop學習經歷。
舉報