亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

初識機器學習-理論篇

stonedog 全棧工程師
難度入門
時長 1小時48分
學習人數
綜合評分9.57
290人評價 查看評價
9.5 內容實用
9.6 簡潔易懂
9.6 邏輯清晰
  • 機器學習算法分類

    算法分類1:有監督學習、無監督學習、半監督學(強化學習,舉例:小孩學走路,一開始走不穩,隨著數據量的增大,走的越來越熟練。);

    算法分類2: 分類與回歸、聚類、標注;

    算法分類2:生成模型、判別模型。

    查看全部
  • 機器學習由數據質量決定結果,算法往往差距不大。

    查看全部
  • 機器學習的定義:利用計算機從歷史數據中找出規律,并把這些規律用到對未來不確定場景的決策。

    查看全部
  • 2024.12.02 02:37
    聽完第一遍!機器學習課。
    查看全部

  • https://img1.sycdn.imooc.com/674c20dd0001af9e15650831.jpgRT.

    查看全部
  • 1. 決策樹算法(C4.5, CART)

    ????無監督學習:實際上,決策樹通常用于有監督學習,因為它依賴于標注數據進行訓練。可以根據特征來劃分數據,進行分類或回歸。

    ????C4.5和CART:雖然這兩者在過去很常見,但如今更先進的算法(如XGBoost)已取代它們??梢钥紤]添加對這些新算法的簡要介紹。

    2. K-Means(無監督學習)

    ????聚類算法非常適合于無監督學習。K-Means通過最小化每個點到質心的距離來分組,適用于大多數情況下數據分布較為均勻的情況。

    3. SVM(支持向量機)

    ????支持向量機是一個非常強大的分類與回歸算法,尤其適用于高維數據。盡管深度學習在某些任務中已超越它,SVM仍然是經典的高效分類算法之一。

    4. Apriori

    ????已淘汰的算法,確實因其計算復雜度和多次掃描數據庫的需求而受到批評。FP-Growth是更高效的替代者,它通過樹形結構減少了對數據庫的訪問次數。

    5. EM算法

    ????作為一種統計學習方法,EM算法的理解確實有一定的門檻,適用于混合模型或缺失數據處理等問題。

    6. PageRank

    ????雖然PageRank仍然廣泛應用于搜索引擎中,但其具體實現細節已經有許多創新和優化,尤其是在大規模圖數據的處理上。

    7. AdaBoost

    ????這是一種集成學習方法,可以與弱分類器(如決策樹)結合,通過加權的方式提高整體分類準確率。它在圖像識別中有廣泛應用。

    8. kNN(k-近鄰)

    ????與K-Means的不同之處在于,kNN是基于距離的分類方法。它簡單易懂,但對于大數據集來說計算復雜度較高。

    9. Naive Bayes

    ????適用于分類任務,特別是在文本分類中,如垃圾郵件檢測。其假設特征之間相互獨立,這在實際數據中可能不完全成立,但通常仍能獲得不錯的效果。

    高級算法:

    ????FP-Growth

    ????????在Apriori的基礎上優化了計算效率,尤其適用于關聯規則挖掘。

    ????邏輯回歸

    ????????非常重要且廣泛使用,尤其是在二分類問題和概率預測中。

    ????隨機森林(RF)和GBDT

    ????????兩者都是決策樹的集成算法,廣泛用于分類與回歸問題。GBDT在處理非線性問題時表現尤為出色。

    ????推薦算法

    ????????推薦系統廣泛應用于電商、社交平臺中,有很多優化方法,如協同過濾、內容推薦等。

    ????LDA(潛在狄利克雷分配)

    ????????主要用于主題模型,在文本挖掘中有重要應用。

    ????Word2Vec

    ????????用于將詞語轉化為向量表示,是文本數據處理中的一個重要技術。

    ????HMM與CRF

    ????????隱馬爾可夫模型與條件隨機場都廣泛應用于序列數據建模,如語音識別、自然語言處理。

    ????深度學習

    ????????包括CNN、RNN等深度神經網絡,是目前處理大規模復雜數據(如圖像、語音、文本)最前沿的技術。

    查看全部
  • 機器學習算法分類(1): 通過模型判斷Y和X的關系

    ????有監督學習:分類算法——Y類:垃圾郵件

    ????????????????????????????????????????????????X類:正常郵件

    ????????????????????? ? ? 回歸算法

    ????無監督學習: 聚類? ?(無Y類)

    ????????????????????????? ? ?

    ? ? 半監督學習:強化學習

    機器學習算法分類(2):

    ????分類與回歸

    ????聚類

    ????標注,給每一個對象打上標簽,如句子的主謂賓切割?

    機器學習算法分類(3)【重要】

    ????生成模型:(陪審團)屬于某類的可能性。

    ????判別模型:? (法官)直接給函數,定結果。

    查看全部
  • 什么是機器學習

    生活中的機器學習

    數據分析和機器學習

    常用算法

    框架

    demo

    查看全部
  • 重新開始學習一遍吧。


    674a2be400019c4c11200630.jpg
    查看全部
  • 機器學習與數據分析?


    674a2b880001a23511200630.jpg
    查看全部
  • 機器學習常見算法(1)ICDM
    1.分類---C4.5使用決策樹算法,可以解決【分類】&【回歸】問題;
    2.聚類---K-Means算法,屬于無監督方法,解決電信用戶分類問題;
    3.統計學習---SVM(支持向量機)可以解決分類(主)和回歸問題,有很好的表現和深厚的數學理論支撐,曾經被認為是最好的分類算法?,F在光芒被【深度學習】掩蓋了。有一定的數學門檻,面試中經常被問。
    4.關聯分析---Apriori應用于“尿片和紙尿褲”案例,最早解決了頻繁項集問題。由于需要頻繁訪問數據庫,已被淘汰。取代它的是華人開的【FP-Growth】算法。應用:電商的推薦系統,但目前有更好的替代方法。
    5.統計分析---EM算法是一個算法框架,用于解決一系列問題。
    6.連接挖掘---PageRank。Google使用的網頁排序算法,很著名。
    7.集裝與推進---AdaBoosts算法,應用于人臉識別,本質為改進的決策樹算法,屬于有監督的分類算法。
    8.分類---kNN。相對簡單的分類算法,有監督。
    9.分類---Naive Bayes樸素貝葉斯算法,用于識別垃圾郵件。
    目前不常用的算法:Apriori和CART。


    https://img1.sycdn.imooc.com/6739b5a900010dff09560542.jpg

    查看全部
  • 機器學習解決問題的框架
    1)預測問題:
    1.1分類:離散型變量
    1.2回歸:連續性變量
    2)聚類問題:
    3)確定目標:
    業務需求-數據-特征工程(數據預處理,70%,最重要)


    https://img1.sycdn.imooc.com/6739b2bb000122c810960704.jpg


    查看全部
  • 算法分類1:根據數據有無標簽Y進行分類

    對樣本數據進行一些訓練,得到模型,通過模型判斷X與Y的關系。

    ? ? 有監督學習:訓練數據中已經明確給出了該數據的Y,給數據打上了標簽。如:已對郵件打上了“垃圾郵件”、“正常郵件”的標簽。包括:分類算法、回歸算法。

    ? ? 無監督學習:訓練數據并沒有Y,數據沒有任何標簽。典型算法:聚類。

    ? ? 半監督學習:也叫強化學習,數據越多,模型越好。

    算法分類2:根據解決問題進行分類

    ? ? 分類與回歸、聚類、標注

    算法分類3(重要,直指本質)

    ? ? 生成模型:用來說明分類問題。返回的是屬于各個類的概率。

    ? ? 判別模型:用來說明分類問題。直接給一個函數,數據輸入到函數中,直接返回類別。


    https://img1.sycdn.imooc.com/6739b1fe00015e9e12000684.jpg


    https://img1.sycdn.imooc.com/6739b21b0001edcf10960690.jpg


    https://img1.sycdn.imooc.com/6739b20b0001a0b910320646.jpg


    https://img1.sycdn.imooc.com/6739b1f80001e26b08960604.jpg

    查看全部
  • 2、解決業務問題不同
    數據分析,報告歷史上發生的事情。
    機器學習:通過歷史上發生的事情,來預測未來的事情。
    3、技術手段不同
    數據分析:分析方式是用戶(數據分析師)驅動的,交互式分析。分析能力受限于數據分析師的能力,數據屬性和維度很有限。
    機器學習:分析方式是數據驅動的,自動進行知識發現。分析能力不受限于人,數據屬性和維度數量級很大。
    4、參與者不同
    數據分析,分析師能力決定結果,目標用戶是公司管理決策層。
    機器學習,數據質量決定結果,目標用戶是個體。

    https://img1.sycdn.imooc.com/6739ae460001814211500772.jpg

    https://img1.sycdn.imooc.com/6739ae120001de6d11860674.jpg

    查看全部
  • 機器學習與數據分析的區別

    1. 處理的數據類型和特點

      1. 交易數據 vS 行為數據

      2. 少量數據 vs 海量數據

      3. 采樣分析 vs 全量分析

    數據分析:

    數據類型:主要處理交易數據,例如電商網站用戶下單、銀行存取款賬單等。

    數據量:通常涉及的數據量較少。

    數據分析方法:傾向于采用采樣分析,因為數據量不大,可以對樣本進行深入分析。

    數據一致性:對數據一致性要求嚴格,尤其是在金融交易等場景中,數據的準確性至關重要。

    數據庫使用:因此,數據分析通常使用關系型數據庫,如SQL Server、MySQL、Oracle等,這些數據庫能夠保證事務的ACID屬性(原子性、一致性、隔離性、持久性),確保數據的準確性和一致性。

    機器學習:

    數據類型:主要處理行為數據,例如用戶的搜索歷史、瀏覽歷史、點擊歷史、評論等。

    數據量:涉及的數據量龐大,通常需要處理海量數據。

    數據分析方法:傾向于進行全量分析,以捕捉數據中的所有模式和趨勢。

    數據一致性:對數據一致性的要求相對較低,更注重數據吞吐量和處理速度。

    數據庫使用:因此,機器學習通常使用NoSQL數據庫(如MongoDB)和分布式數據分析平臺(如Hadoop、Spark),這些技術能夠處理大規模數據集,并且具有高吞吐量和靈活性。

    2. 數據處理方法和工具

    數據分析:

    側重于使用統計方法和查詢語言(如SQL)來分析數據,以支持決策制定。

    工具和語言包括Excel、R、Python(Pandas庫)等。

    機器學習:

    側重于使用算法和模型來從數據中學習模式,并進行預測或分類。

    工具和框架包括TensorFlow、PyTorch、Scikit-learn等。



    https://img1.sycdn.imooc.com/67395edf0001fdce10660436.jpg

    https://img1.sycdn.imooc.com/67395f030001999609020568.jpg



    https://img1.sycdn.imooc.com/67395f0e0001a4cb10840674.jpg



    -----

    https://img1.sycdn.imooc.com/67395f560001657509160650.jpg





    用 Nosql 處理行為數據,跟錢相關的數據,是不會用 nosql 去處理的。https://img1.sycdn.imooc.com/67395fa3000170c209900594.jpg

    查看全部
  • 什么是機器學習?

    1. ? 利用計算機從歷史數據中找出規律;并把這些規律用到對未來不定場景的決策

    ?機器學習的典型應用

    1. ? 關聯規則:啤酒+紙尿片,購物籃分析

    2. ? 聚類:用戶細分精準營銷

    3. ? 樸素貝葉斯:垃圾郵件檢測

    4. ? 決策樹:風險識別

    5. ? ctr預估:互聯網廣告:百度的前多少個詞條(商業廣告)(按照點擊率排序)

    6. ? 協同過濾:推薦系統(電商購物車推薦,應用市場下載應用后的推薦等等)

    7. ? 自然語言處理:情感分析(對文本抓關鍵情感詞),實體識別(提取文本主要數據,人名等)

    8. ? 深度學習:圖像識別

    9. ? 更多應用:語音識別,人臉識別,手勢控制,智慧機器人,實時翻譯

    https://img1.sycdn.imooc.com/67395d5f0001fc4311960656.jpg



    https://img1.sycdn.imooc.com/67395da20001a49710920746.jpg


    https://img1.sycdn.imooc.com/67395dbb0001f86810260700.jpg


    https://img1.sycdn.imooc.com/67395dd300016e6813080666.jpg

    查看全部
  • 機器學習的典型應用:

    1. 購物籃分析——美國超市啤酒和紙尿褲——關聯規則

    2. 用戶細分精準營銷—— 中國移動全球通、動感地帶、神州行——聚類

    3. 垃圾郵件識別——樸素貝葉斯

    4. 信用卡欺詐——決策樹


    https://img1.sycdn.imooc.com/67395bc000018ca511620664.jpg


    ?https://img1.sycdn.imooc.com/67395bcf0001c39212100640.jpg

    查看全部
  • 機器學習的典型應用


    用戶細分精準營銷


    ? 聚類? 用機器對用戶群體分類,判斷用戶具體需要什么。

    https://img1.sycdn.imooc.com/67395a9c000195b311360666.jpg

    查看全部
    0 采集 收起 來源:典型應用-聚類

    2024-11-17

  • 購物籃分析
    ?
    ?關聯算法,紙尿褲和啤酒


    https://img1.sycdn.imooc.com/67395a670001bb7317581006.jpg

    查看全部
  • 業務系統發展的歷史


    1. 基于專家經驗

    2. 基于統計——分緯度統計

    3. 機器學習——在線學習

    https://img1.sycdn.imooc.com/673959c10001e25409840520.jpg

    機器學習兩種使用場景?離線學習和在線學習。

    1. 離線學習:批處理的方式,對以前的數據進行學習,從而運用到后面的指導中

    2. 在線學習:對實時產生的數據進行學習,再對實時得業務進行指導

    兩種場景使用的算法都是一樣的。

    查看全部
  • 機器學習發展的原動力

    1. 從歷史數據中找出規律,把這些規律用到對未來自動作出決定。

    2. 用數據代替expert

    3. 經濟驅動,數據變現

    4. https://img1.sycdn.imooc.com/6739551c0001281112500574.jpg

    查看全部
    • 《概率論》《數據統計》是機器學習的基石

    https://img1.sycdn.imooc.com/6739523600015c9211160694.jpg

    • 傳統的統計學,受運算能力的限制,所以是用抽樣的方式, 抽取一定量的樣本然后進行概率統計,然后得到結論之后進行假設檢驗

    • 統計學受限于計算能力,依賴于采樣的方法,再反作用于原來的數據。步驟:抽樣-->描述統計-->結論-->假設檢驗。

    • 現在無需考慮數據量的問題,無需抽樣技術,直接全樣。可利用可視化技術來觀察數據。要進行數據分析,需要先進行量化,用模型擬合規律,函數-->函數曲線-->擬合。高維度時很難用可視化的方法,只能用數學運算。

    https://img1.sycdn.imooc.com/673953b60001cd6712220626.jpg

    查看全部
    • 什么是機器學習?

      • 利用計算機從歷史數據中找出規律,并把這些規律用到對未來不確定場景的決策?

    • 判斷、決策
      主體的不同:計算機--機器學習、人--數據分析。
      • 數據分析是依靠人從歷史數據中找到規,學習效果很大程度以來于人的經驗與知識水平,

      • 機器學習就是想要拋棄對人的依賴,靠機器來挖掘規律。
        數據:機器學習只是解決問題的框架、算法,需要數據,數據量越大越準確。
        規律:通過機器學習不同的算法去找規律,不同的算法結果不同。

      • https://img1.sycdn.imooc.com/67395144000100ab10580702.jpg


    查看全部
  • 一、 demo - 圖片按照色彩聚類

    查看全部
  • 一、機器學習解決問題的框架

    1. 訓練模型

      1. 定義模型

      2. 定義損失函數

      3. 優化算法

    2. 模型評估

      1. 交叉驗證

        1. 多個算法分別帶入同一類數據,驗證效果

      2. 效果評估

        1. 評估多個算法間的差異

    查看全部
  • 一、機器學習解決問題的框架

    1. 聚類問題

    2. 預測問題


    二、各個算法共同的思想

    1. 機器學習 —— 確定目標

      1. 業務需求

      2. 數據

      3. 特征工程(數據預處理)


    查看全部
  • 一、機器學習算法

    SVM:支持向量機

    關聯分析: FP-Growth

    AdaBoot:? 有監督學習,人臉識別


    二、常用算法

    1. FP-Growth

    2. 邏輯回歸

      1. 搜索結果的排序等

    3. RF、GBDT

      1. 決策樹的改進

    4. 推薦算法

      1. 各個推薦系統的算法

    5. LDA

      1. 自然語言處理算法

    6. Word2Vetor

      1. 文本挖掘

    7. HMM、CRF

      1. 文本挖掘

    8. 深度學習

      1. 圖像識別等

    查看全部
  • 一、機器學習算法分類

    1. 有監督學習

      1. 分類算法

      2. 回歸算法

    2. 無監督學習

      1. 聚類

    3. 半監督學習(強化學習)

    4. 其他

      1. 標注

      2. 生成模型(屬于各個類的概率)

      3. 判別模型 (分類)

    查看全部
首頁上一頁1234567下一頁尾頁

舉報

0/150
提交
取消
課程須知
1、有一定數據分析經驗。 2、對機器學習有熱情的同學。
老師告訴你能學到什么?
1.什么是機器學習 2.機器學習的典型行業案例 3.機器學習和傳統數據分析的區別 4.機器學習的經典算法

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!