1 回答

TA貢獻1785條經驗 獲得超4個贊
首先,你說到你剛接觸大數據,你要明白大數據范圍超級廣,你具體想要學習哪個方向呢?數據挖掘?還是機器學習深度學習?亦或nlp(自然語言處理)?(我主要學數據挖掘,嗚啦啦啦)
我給所有問我大數據該怎么入門的人都會有如下建議:學好數學!學好數學!學好數學!重要的事說三遍,不然你怎么理解各種模型的構建?所以從理解算法開始,什么svn啦,knn啦,k means啦,總之各種聚類分類的算法,把它搞懂,絕對有用。
扯遠了,不好意思…言歸正傳,回到語言的選擇問題。java和python這兩個語言,我給你從這幾個方面解釋一下:
1. python是腳本語言,無需編譯,java則是需要編譯的語言
2. 我在letitcode(大概是這么拼)上測試過好多次,同一個功能的程序竟然是java性能好很多
3. 平時我們做項目,都是用python寫個demo去測試,真正發行的版本,是用java寫的
4. 許多大數據平臺(如spark),都提供多種語言的接口,所以你不用擔心學一種語言沒處用的問題
看到了吧?python和java的地位差別在企業中就是一個低一個高,氮素!以我個人的觀點來看,我還是建議你先學python。
為啥膩?我可不是要坑你,而是因為:
1. 很多java中幾行的代碼,python中一行就搞定,學會了python,還怕學不會java?
2. python上手快,簡潔事兒少
3. (個人經驗)我學數據挖掘入門是用的scikit-learn(一個python庫),當時用的超爽的好吧!幾分鐘搞個模型出來。當然現在看來那不算什么啦,可當時真的體驗很好,特有成就感。相反拿java寫程序我就各種別扭,總覺得啰嗦得很
4. 其實,我覺得scala更適合大數據…linkedin后臺好像就是它寫的,但是我覺得scala難,再加上種種原因,一直沒來得及學
以上就是我的看法。
最后給你推薦個小工具:jupyter notebook,一個在線交互式編譯器,不但支持python在線編譯,還支持matplotlib及各種繪圖庫哦!在你前期做數據清洗和特征提取的時候很有用。
- 1 回答
- 0 關注
- 1068 瀏覽
添加回答
舉報