已解決430363個問題，去搜搜看，總會有你想問的

查找 pandas Dataframe 列的唯一行，其中第二列的所有值都是 NaN

首頁猿問查找 pandas...

查找 pandas Dataframe 列的唯一行，其中第二列的所有值都是 NaN

Python

小唯快跑啊 2023-03-08 10:40:20

我正在努力解決以下問題：給定一個包含列的數據框name，variable我想創建 2 個列表：list_names_nan 包含變量列中所有值為 nan 的名稱list_names_not_nan 包含變量列中的列表 1 值不是 nan 的名稱下面是一個例子import pandasimport numpydf = pandas.DataFrame(data=[['x',1],['y',2],['x',4],['z',numpy.nan], ['x',numpy.nan],['y',3],['x',numpy.nan],['z',numpy.nan],], columns=['name','variable'])df: name variable0 x 1.01 y 2.02 x 4.03 z NaN4 x NaN5 y 3.06 x NaN7 z NaN所需的輸出應該是list_names_nan = [z]list_names_not_nan = [x,y]

查看完整描述

2 回答

溫溫醬

TA貢獻1752條經驗獲得超4個贊

用于Series.isna創建布爾掩碼，然后Series.groupby在此掩碼上使用并聚合，all最后使用此掩碼m過濾nan和not_nan值：

m = df['variable'].isna().groupby(df['name']).all()

nan, not_nan = m[m].index.tolist(), m[~m].index.tolist()

結果：

['z'] # nan

['x', 'y'] # not_nan

反對回復 2023-03-08

茅侃侃

TA貢獻1842條經驗獲得超22個贊

這是使用自定義聚合函數的另一種方法：

agg = df.groupby('name').agg(lambda x: all(np.isnan(x))).reset_index()

這會生成一個聚合數據框：

name variable

0 x False

1 y False

2 z True

False然后你就可以得到是或的名字True

list_names_nan = agg.loc[agg['variable']==True]['name'].tolist()

list_names_not_nan = agg.loc[agg['variable']==False]['name'].tolist()

反對回復 2023-03-08

2 回答
0 關注
134 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

查找 pandas Dataframe 列的唯一行，其中第二列的所有值都是 NaN

查找 pandas Dataframe 列的唯一行，其中第二列的所有值都是 NaN

2 回答

添加回答

查找 pandas Dataframe 列的唯一行，其中第二列的所有值都是 NaN