最基本的sql + python + (R or spss )
最基本的sql會就行,什么join啊什么的都不用管,能select * from xxx limit n啥的就足夠了。做到能批量把要用到的原始數據下載下來
python5分鐘就能上手寫,1周就能熟練的處理各種原始數據到你想要輸入給下一步的軟件的格式上。
然后用R或者spss來畫圖或者做跑各種高大上的統計模型
然后根據不同的業務自己去想挖掘的方法,什么回歸啊,什么SVM,什么決策樹啊,這些東西都是工具,不是目的
至于如何有好的挖掘的idea,似乎沒有好書推薦,在工作中學吧。