亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

我應該使用一種熱編碼的特征選擇嗎?

我應該使用一種熱編碼的特征選擇嗎?

慕勒3428872 2023-10-18 16:37:25
我有一個困境,我正在使用一種熱編碼,我需要進行特征選擇(對于分類和數字特征),我有一些并不真正重要的特征,但我不想使用某種算法來做到這一點,而不是手動。我的問題有兩個 -我可以使用什么特征選擇技術來做到這一點?我是在一次熱編碼之后還是之前進行的?
查看完整描述

1 回答

?
ABOUTYOU

TA貢獻1812條經驗 獲得超5個贊

如果您有許多特征,并且其中許多可能與模型無關,則特征選擇將使您能夠丟棄它們并將數據集限制為最相關的特征。

以下是在這些情況下需要考慮的幾個關鍵方面:

  • 維數詛咒

當您處理大型數據集時,這通常是至關重要的一步。例如,盲目地對所有分類特征進行單熱編碼可能會導致大量數據幀,甚至可能無法存儲到內存中,更不用說用于機器學習模型了。在這種情況下,您可能需要減少要編碼的功能數量或研究其他分類編碼器,例如貝葉斯編碼器(請參閱答案的最后一部分)。

  • 特征重要性

不進行特征選擇的一個負面影響,在這里非常雄辯地提出,可能是我們有許多高度相關的特征,并且在分析特征重要性時,您獲得的這些特征的重要性可能并不表明它們的實際相關性。

回答問題的第二部分,如果您擁有的功能可能是相關的并且您已經完成了一些功能工程,那么您可以對它們進行編碼,如果您最終擁有許多功能,那么您可以執行功能選擇并減少功能維度生成的數據集。有許多特征選擇技術。您可以在特征選擇中找到 scikit-learn 中可用的列表。



查看完整回答
反對 回復 2023-10-18
  • 1 回答
  • 0 關注
  • 141 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號