亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何在線學習數據分析?

如何在線學習數據分析?

如何在線學習數據分析
查看完整描述

1 回答

?
慕沐林林

TA貢獻2016條經驗 獲得超9個贊

數據科學并沒有一個獨立的學科體系,統計學,機器學習,數據挖掘,數據庫,分布式計算,云計算,信息可視化等技術或方法來對付數據。但從狹義上來看,孫大圣威客認為數據科學就是解決三個問題:
1. data pre-processing;
2. data interpretation;
3.data modeling and analysis.
這也就是我們做數據工作的三個大步驟:
1、原始數據要經過一連串收集、提取、清洗、整理等等的預處理過程,才能形成高質量的數據;
2、我們想看看數據“長什么樣”,有什么特點和規律;
3、按照自己的需要,比如要對數據貼標簽分類,或者預測,或者想要從大量復雜的數據中提取有價值的且不易發現的信息,都要對數據建模,得到output。
這三個步驟未必嚴謹,每個大步驟下面可能依問題的不同也會有不同的小步驟,但按我這幾年的經驗來看,按照這個大思路走,數據一般不會做跑偏。

這樣看來,數據科學其實就是門復合型的技術,既然是技術就從編程語言談起吧,為了簡練,只說說R和Python。但既然是薦數據科學方面的書,我這里就不提R/Python編程基礎之類的書了,直接上跟數據科學相關的。

R programming

如果只是想初步了解一下R語言已經R在數據分析方面的應用,那不妨就看看這兩本:

R in action:我的R語言大數據101。其實對于一個沒有任何編程基礎的人來說,一開始就學這本書,學習曲線可能會比較陡峭。但如果配合上一些輔助材料,如官方發布的R basics,stackoverflow上有tag-R的問題集(Newest 'r' Questions),遇到復雜的問題可在上面搜索,總會找到解決方案的。這樣一來,用這本書拿來入門學習也問題不大。而且這本書作者寫得也比較輕松,緊貼實戰。

Data analysis and graphics using R:使用R語言做數據分析的入門書。這本書的特點也是緊貼實戰,沒有過多地講解統計學理論,所以喜歡通過情境應用來學習的人應該會喜歡這本入門書。而且這本書可讀性比較強,也就是說哪怕你手頭沒電腦寫不了代碼,有事沒事拿出這本書翻一翻,也能讀得進去。

但如果你先用R來從事實實在在的數據工作,那么上面兩本恐怕不夠,還需要這些:

Modern applied statistics with S:這本書里統計學的理論就講得比較多了,好處就是你可以用一本書既復習了統計學,又學了R語言。(S/Splus和R的關系就類似于Unix和Linux,所以用S教程學習R,一點問題都沒有)

Data manipulation with R:這本書實務性很強,它教給你怎么從不同格式的原始數據文件里讀取、清洗、轉換、整合成高質量的數據。當然和任何一本注重實戰的書一樣,本書也有豐富的真實數據或模擬數據供你練習。對于真正從事數據處理工作的人來說,這本書的內容非常重要,因為對于任何研究,一項熟練的數據預處理技能可以幫你節省大量的時間和精力。否則,你的研究總是要等待你的數據。

R Graphics Cookbook:想用R做可視化,就用這本書吧。150多個recipes,足以幫你應付絕大多數類型的數據。以我現在極業余的可視化操作水平來看,R是最容易做出最漂亮的圖表的工具了。

An introduction to statistical learning with application in R:這本書算是著名的the element of statistical learning的姊妹篇,后者更注重統計(機器)學習的模型和算法,而前者所涉及的模型和算法原沒有后者全面或深入,但卻是用R來學習和應用機器學習的很好的入口。

A handbook of statistical analysis using R:這本書內容同樣非常扎實,很多統計學的學生就是用這本書來學習用R來進行統計建模的。

查看完整回答
反對 回復 2018-10-06
  • 1 回答
  • 0 關注
  • 1726 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號