亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

寫文章

首頁手記機器學習教程之半監督學習...

機器學習教程之半監督學習 Tri-training方法 (論文、數據集、代碼)

標簽：

大數據機器學習數據分析&挖掘

收藏

最近因为项目需要研究了一下半监督学习，稍经了解以后发现当存在大量未标签数据时，这确实是一种非常好用的方法，可以很好的提升分类精度。这里介绍一下周志华教授的Tri-triaining方法，在实现上非常的简单好用，在文末会有代码、数据集的链接
原文在这里
Tri-training: exploiting unlabeled data using three classifiers

一、Tri-training

Tri-traing 是对 co-training （协同训练）的一种改进，它也是一种基于分歧的方法。简单来说，Tri-training 的训练过程分为以下几步

利用bootstrap方法从有标签数据集里采样三个子数据集。利用三个子数据集训练三个有差异的基分类器
对于其中一个分类器i，另外两个分类器预测所有未标注数据集，挑选出其中预测结果相同的样本，作为新的有标签数据，加入到分类器i的训练集中
为三个分类器分别执行步骤2，并利用三个扩增的数据集更新分类器
重复执行2，3，直到模型收敛

在为无标签数据贴上伪标签的过程中，是有可能贴错标签，即在数据集中增加噪声的。但是周教授在论文中证明了，当新增加的数据足够多时，噪声带来的影响是可以被抵消的。Tri-trianing的理论基础其实是相当坚实的，详细的可以具体见论文

二、Implementation

代码数据集等 https://github.com/LiangjunFeng/Tri-training （写博客不容易，欢迎点赞关注，感谢支持）

點擊查看更多內容

1人點贊

評論

評論

共同學習，寫下你的評論

評論加載中...

作者其他優質文章

正在加載中

算法工程師

手記

篇

粉絲

6

獲贊與收藏

15

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節 32265 361

網絡編程入門教程

20個小節 13309 251

Pandas 入門教程

25個小節 19960 374

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

掃描二維碼
關注慕課網微信公眾號

舉報

0/150

提交

取消

<del id="jqhuz"></del>

<td id="jqhuz"></td>