亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

機器學習-kNN實現簡單的手寫數字識別系統

功能


利用k-邻近算法,实现识别数字0到9

开发环境


数据集和项目源代码


Github:https://github.com/jiangkang/KMachineLearning.git

数据集


下面是32*32的黑白图像

https://img1.sycdn.imooc.com//5d53fdb00001bd7008140729.jpg

32* 32像素数据集

为了方便处理,提供了文本文件

https://img1.sycdn.imooc.com//5d53fdb30001d65b05670894.jpg

文本数据

数据集分为训练集和测试集,其中训练集是已经分类好的数据,测试集是用来测试算法。

将数据转换为特征向量


从上图可知,拿到的是32*32的的矩阵,每一个点是一个像素值,将这1024(32
32)个数值,转换成(1,1024)的向量。

https://img1.sycdn.imooc.com//5d53fdb80001120908870351.jpg

数据转换为特征向量

KNN分类器


参考这篇文章机器学习-从kNN开始

https://img1.sycdn.imooc.com//5d53fdbd0001339908910302.jpg

kNN分类器

输入测试集,测试算法


https://img1.sycdn.imooc.com//5d53fdc50001679008820584.jpg

测试算法

看看选择不同的k值,分类效果如何


https://img1.sycdn.imooc.com//5d53fdc90001384408930337.jpg

取不同的k值

这里看错误的个数,绘制一个折线图
注意:执行时间比较长,去喝杯咖啡吧

https://img1.sycdn.imooc.com//5d53fdcd0001b42b09040761.jpg

这里取1-4,当然你也可以取更高的k值(速度慢)

实验结果证明,取k=3,效果比较好。

txt转换为png图像


为了更具真实性,同样写了txt转换为png的代码。

https://img1.sycdn.imooc.com//5d53fde80001e7b008610901.jpg

txt转png

图像转txt文件


https://img1.sycdn.imooc.com//5d53fded0001f9f508950395.jpg

image.png

总结


数据集如果稍大一点,执行时间会变得非常长



作者:姜康
链接:https://www.jianshu.com/p/a81ce10c4076

點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消