亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

機器學習的5種距離度量方法

標簽:
機器學習

在机器学习领域中有非常多的问题需要求距离,常见的是向量距离的计算。比如判断A、B、C三种商品之间的相似性,可以先按照商品特征构建A、B、C的各自的向量,然后求向量间的距离,距离近就表示彼此相似度高。今天讲下常见的几种距离计算方法。


A 欧式距离EuclideanDistance

欧式距离:两点之间的直线距离。

(1)二维平面上两点a(x1,y1),b(x2,y2)之间的欧式距离公式:

640?wx_fmt=png&wxfrom=5&wx_lazy=1

(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的欧式距离公式:

640?wx_fmt=png

B  曼哈顿距离(ManhattanDistance)

       曼哈顿距离也叫”曼哈顿街区距离”。想象你在曼哈顿街道上,从一个十字路口开车到另一个十字路口,驾驶距离就是这个“曼哈顿距离”。


(1)二维平面上两点a(x1,y1),b(x2,y2)之间的曼哈顿距离公式:

640?wx_fmt=png

(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的曼哈顿距离公式:

640?wx_fmt=png


C 夹角余弦

机器学习中可以把两点看成是空间中的两个向量,通过衡量两向量之间的相似性来衡量样本之间的相似性。

(1)二维平面上两向量a(x1,y1),b(x2,y2)之间的夹角余弦公式:

640?wx_fmt=png


也可直接通过向量运算:


640?wx_fmt=png

(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的夹角余弦公式:

640?wx_fmt=png

D 切比雪夫距离(Chebyshevdistance)


切比雪夫距离:各对应坐标数值差的最大值。国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步?你会发现最少步数总是max( | x2-x1 | , | y2-y1 | )步。


(1)二维平面上两点a(x1,y1),b(x2,y2)之间的切比雪夫距离公式:

640?wx_fmt=png

(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的切比雪夫距离公式:

640?wx_fmt=png


E 汉明距离

    两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。

  1011101与 1001001 之间的汉明距离是2   

   2143896与 2233796 之间的汉明距离是3   

   irie与 rise之间的汉明距离是 3


∞∞∞

原文出处

點擊查看更多內容
1人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消