亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

我有一個數據框,想用基于另一列的相同值填充基于前幾行的所有空列值?

我有一個數據框,想用基于另一列的相同值填充基于前幾行的所有空列值?

倚天杖 2023-06-20 10:21:37
我有一個如下所示的數據框。我想從存在相同值(“名稱”)的前一行復制一個列值。df: Name    Age   EthnicitySam     17    EChris   0     BTom     19    PSam     22    NaNChris   18    NaNTom     7     NaN這就是我想要的:Name    Age   EthnicitySam     17    EChris   0     BTom     19    PSam     22    EChris   18    BTom     7     P
查看完整描述

2 回答

?
Qyouu

TA貢獻1786條經驗 獲得超11個贊

你可以試試條件填充


df = pd.DataFrame([

["Sam" ,    17 ,   "E"],

["Chris" ,  0  ,   "B"],

["Tom"  ,   19  ,  "P"],

["Sam"  ,   22  ,  np.nan],

["Chris" ,  18  ,  np.nan],

["Tom"  ,   7  ,   np.nan],

              

] ,columns=['Name', "Age", "Ethnicity"])

然后


 df.loc[df.Ethnicity.isnull(), 'Ethnicity'] = \

              df.loc[df.Ethnicity.isnull(), 'Name'].map(df.loc[df.Ethnicity.notnull()] \

                .set_index('Name')['Ethnicity'])

輸出:


    Name    Age Ethnicity

0   Sam     17  E

1   Chris   0   B

2   Tom     19  P

3   Sam     22  E

4   Chris   18  B

5   Tom     7   P

但是,如果您確定 NaN 值的名稱始終具有相應的名稱,那么您可以使用 group by


df["Ethnicity"] = df.groupby('Name').ffill()["Ethnicity"]


查看完整回答
反對 回復 2023-06-20
?
白衣非少年

TA貢獻1155條經驗 獲得超0個贊

如果需要,請嘗試排序和 ffill()。最后 sort_index()。如下所示。我使用了隨機 df


df = pd.DataFrame({'A':['a', 'c', 'f',  'a','c','f'],

    'B' :[3, 4, 2,10,3, 1],

    'C':[np.nan, np.nan, np.nan, 12,13,14]

  })

print(df.sort_values(by=['A','C']).ffill().sort_index())


查看完整回答
反對 回復 2023-06-20
  • 2 回答
  • 0 關注
  • 159 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號