我有這個數據框:test = database[['WEATHER']]WEATHER 的一些值是“Unknown”和“Other”,這并沒有給它帶來太大的價值,所以我想將它們更改為 NaN。因此,我嘗試以下代碼:for i in range(len(test)):if test['WEATHER'][i] == "Other" or test['WEATHER'][i] == "Unknown": test['WEATHER'][i] = np.nan并且不斷出現這個錯誤:我一直在嘗試糾正它,但我還沒有找到方法。
2 回答

慕斯王
TA貢獻1864條經驗 獲得超2個贊
您的堆棧跟蹤包含KeyError: 15,因此您可能嘗試檢索 key == just 15的行,但您的 DataFrame 不包含這樣的鍵。
現在如何正確有效地完成您的任務。在有問題的列上使用mask ,并使用inplace:
df.WEATHER.mask(df.WEATHER.str.lower().isin(['other', 'unknown']), np.nan, inplace=True)
為了提供正確的處理,無論字母大小寫如何(例如other或 OTHER),我將原始值轉換為小寫,然后與“禁止”列表進行比較。

汪汪一只貓
TA貢獻1898條經驗 獲得超8個贊
通常,您希望避免迭代 pandas DataFrame。我將這樣做:
>>> df.a
0 Other
1 Unknown
2 BLAH
Name: a, dtype: object
>>> df.a = np.choose(df.a.isin(['Other', 'Unknown']), [df.a, np.nan])
>>> df.a
0 NaN
1 NaN
2 BLAH
Name: a, dtype: object
isin()檢查每個值是否在預定義列表中['Other', 'Unknown'],并np.choose()根據調用的布爾結果賦予一個值isin()。結果要么是原始值,df.a要么是np.nan。
添加回答
舉報
0/150
提交
取消