-
機器學習解決問題的框架:確定目標、業務需求、數據、特征工程
查看全部 -
機器學習算法分類
算法分類(1):有監督學習、無監督學習、半監督學習
算法分類(2):分類與回歸、聚類、標注
(重要)算法分類(3):生成模型、判別模型
查看全部 -
交易型數據(跟錢有關系的操作數據)使用關系型數據庫(MySQL SQLSEVER)
行為型數據使用NOSQL
查看全部 -
什么是機器學習:
利用計算機從歷史數據中找出規律,并把這些規律用到對未來不確定場景的決策
查看全部 -
機器學習解決問題的框架:
二、訓練模型
STEP1:定義模型(形成目標公式)
STEP2:定義損失函數(數學的方式定義預測值與現實值的差異)
STEP3:優化算法(尋找確定損失函數極小值)
三、模型評估(標準)
STEP1:交叉驗證
STEP2:效果評估
訓練模型
(1)定義模型:確定模型,訓練出模型的參數
(2)定義損失函數(定義偏差的大?。涸u價真實結果與模型的預測結果的相似程度和差異度。?機器學習解決的問題,有時不能得到精確解只能尋找近似解。 偏差最小的函數,針對很大的數據集,就是損失函數。 讓損失函數求最小,就是優化算法。對于線性回歸模型,計算預測結果與實際結果的差值;對于分類模型,則需要定義自己的損失函數
(3)優化算法:對算法進行優化,使損失函數取極小值,如梯度下降法......
查看全部 -
機器學習借鑒問題的框架
查看全部 -
機器學習常見算法
查看全部 -
機器學習常見算法
查看全部 -
機器學習算法分類
查看全部 -
機器學習算法分類
查看全部 -
算法分類:
1、監督學習:分類算法、回歸算法
2、無監督學習:聚類
3、半監督學習:主要考慮如何利用少量的標注樣本和大量的未標注樣本進行訓練和分類的問題。主要分為半監督分類,半監督回歸,半監督聚類和半監督降維算法。
查看全部 -
機器學習算法分類
算法分類1:
有監督學習:提供了Y值(分類)的分類算法和提供了Y值(數字)的回歸算法
無監督學習:無Y值,聚類算法
半監督學習:先給一部分Y值,以達到訓練的越來越好的目的
算法分類2:
分類與回歸
聚類
標注
算法分類3:(重要、直指算法的本質)
生成模型(告訴你屬于每一類的概率)
判別模型(給你一個函數,你把數據丟給函數,他返回給你一個結果就告訴你是哪一類)
查看全部 -
二、解決業務問題不同
機器學習:預測未來事件(未來趨勢)
數據分析:報告過去事件(歷史總結)
三、技術手段、方法不同
機器學習:數據挖掘;數據(算法)驅動;規模大
數據分析:OLAP;用戶驅動(企業數據分析師的經驗等);規模小;交互式分析
缺點:受限于分析師的經驗,分類的多樣化受限制
四、參與(驅動)者不同
機器學習:數據+算法,數據質量決定結果
數據分析:數據分析師,能力&經驗決定結果
五、服務用戶不同
機器學習:個體用戶
數據分析:公司高層
查看全部 -
機器學習和數據分析的區別:
一、數據特點不同(數據類別、數據量、數據分析方法)
機器學習:行為數據(如搜索歷史、瀏覽歷史、點擊歷史、評論等);海量分析,一致性要求相對不高;全量分析
數據分析:交易數據(與錢相關,如用戶訂單、存取款賬單、話費賬單等)少量數據,一致性要求嚴格(如銀行存取款,數據精準);采樣分析
數據的特點:
交易數據vs行為數據
少量數據vs海量數據
采樣分析vs全量分析
交易數據要求數據一致性高(事務保證)。
NoSQL 適合存儲行為數據(一致性差)
關系型的 適合存儲交易數據(一致性高)查看全部 -
機器學習更多應用
查看全部
舉報