亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何從值計數不滿足條件的分類變量中刪除行?

如何從值計數不滿足條件的分類變量中刪除行?

Helenr 2022-09-13 10:10:05
我是ML和數據科學的新手(最近從商業分析碩士畢業),現在在尋找數據科學/商業分析的職位時,我盡可能多地自己學習。我正在研究一個實踐數據集,目標是預測哪些客戶可能會錯過他們預定的約會。我的數據集中的一列是“鄰里”,其中包含 30 多個不同鄰域的名稱。我的數據集有 10,000 個觀測值,而一些鄰域名稱僅出現不到 50 次。我認為數據集中出現次數少于50次的鄰域太罕見了,機器學習模型無法正確分析。因此,我想從“鄰域”列中刪除鄰域的名稱,該列中出現的次數少于50次。幾個小時以來,我一直在嘗試為此編寫代碼,但很難做到正確。到目前為止,我已經得到了下面的版本:my_df = my_df.drop(my_df["Neighbourhood"].value_counts() < 50, axis = 0)我也嘗試過其他版本的代碼來刪除該分類列中的行,但我不斷收到類似的錯誤:KeyError: '[False False ...  True  True] not found in axis'我感謝您提前提供幫助,并感謝您與我分享您的知識和見解!
查看完整描述

1 回答

?
繁華開滿天機

TA貢獻1816條經驗 獲得超4個贊

嘗試下面的代碼 - 它使用 .loc 運算符根據特定條件(即在具有高計數的鄰域中)選擇行


counts = my_df['Neighborhood'].value_counts()

new_df = my_df.loc[my_df['Neighborhood'].isin(counts.index[counts > 50])]


查看完整回答
反對 回復 2022-09-13
  • 1 回答
  • 0 關注
  • 62 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號