我有一個數據集,其中包含不需要的字符串(這表明無法進行測量)。當 pandas 讀取數據的文本文件時,我想將這些不需要的字符串更改為“NaN”,因為字符串的存在會將原本 int 列的數據類型轉換為字符串。如果有更好的流程,請告訴我。代碼import pandas as pd?data = {? ? 'ID': [1,2,3,4],? ? 'V': [6.6,2.01,'tND - 7777',7.01],? ? 'A': [33,31,'tND - 88881',35]? ??? ? }?df = pd.DataFrame(data, columns = ['ID','V','A'])print(df)df.astype({"V": int})print(df)# returns ValueError: invalid literal for int() with base 10: 'tND - 7777'pd.to_numeric(df['V'], errors = 'coerce')pd.to_numeric(df['A'], errors = 'coerce')print(df)# returns original array, unwanted strings still in place不需要的字符串'tND - 7777','tND - 88881'期望的結果 數據幀列中的數據是整數(我假設 NaN 被視為整數,我只需要在字符串不再存在時繪制數據)。
1 回答

富國滬深
TA貢獻1790條經驗 獲得超9個贊
分配回輸出:
df['V'] = pd.to_numeric(df['V'], errors = 'coerce') df['A'] = pd.to_numeric(df['A'], errors = 'coerce')
另一個想法是使用:
df[['V','A']] = df[['V','A']].apply(pd.to_numeric, errors = 'coerce')
添加回答
舉報
0/150
提交
取消