亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

機器學習中為什么要做歸一化normalization

標簽:
機器學習

作者:Michael

原文链接:https://segmentfault.com/a/1190000015283224

我们处理feature的时候往往先要normalize encoding,使用python可以很容易做:

from sklearn import preprocessing
from scipy.stats import rankdata

x = [[1], [3], [34], [21], [10], [12]]
std_x = preprocessing.StandardScaler().fit_transform(x)
norm_x= preprocessing.MinMaxScaler().fit_transform(x)
norm_x2= preprocessing.LabelEncoder().fit_transform(x)print('std_x=\n', std_x)print('norm_x=\n', norm_x)print('norm_2=\n', norm_x2)print('oringial order =', rankdata(x))print('stand order    =', rankdata(std_x))print('normalize order=', rankdata(norm_x))

其中preprocessing.LabelEncoder().fit_transform(x)就是做normalize encoding,上面的程序输入如下:

std_x=
 [[-1.1124854 ]
 [-0.93448773]
 [ 1.82447605]
 [ 0.66749124]
 [-0.31149591]
 [-0.13349825]]
norm_x=
 [[0.        ]
 [0.06060606]
 [1.        ]
 [0.60606061]
 [0.27272727]
 [0.33333333]]
norm_2=
 [0 1 5 4 2 3]
oringial order = [1. 2. 6. 5. 3. 4.]
stand order    = [1. 2. 6. 5. 3. 4.]
normalize order= [1. 2. 6. 5. 3. 4.]

可以看到normailize之后的结果是 [0 1 5 4 2 3]。这样做的好处是什么呢?

下面图片转自知乎(https://www.zhihu.com/questio...

https://img1.sycdn.imooc.com//5b21dd2000014e8f05160629.jpg

https://img1.sycdn.imooc.com//5b21dd3e0001829a05150552.jpg

https://img1.sycdn.imooc.com//5b21dd690001c5ac05160626.jpg


點擊查看更多內容
1人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消