亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

使用 Pandas 和 R 將序列號連接到組中的每一行

使用 Pandas 和 R 將序列號連接到組中的每一行

四季花海 2023-08-15 16:26:36
我有一個如下所示的數據框(下面給出了 R 和 Python 數據框代碼)df = pd.DataFrame({'person_id': [11,11,11,12,12,12,12,13,13,13,13,13,14,14,14]}) df['enc_id'] = [1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579] person_id <- c(11,11,11,12,12,12,12,13,13,13,13,13,14,14,14) enc_id <- c(1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579) df <- data.frame(person_id, enc_id)我想enc_id為每個人連接一個序列號我用Python寫了類似下面的東西df['new_enc_id'] = df['enc_id'].map(str) + (df.groupby('person_id').cumcount()+1).map(str)你能幫我解決以下問題嗎?我怎樣才能在 R 中做到這一點?有什么優雅的方法可以在Python中做到這一點嗎?我希望我的輸出如下所示。您可以看到sequence number每個組 和 都是串聯的not added。
查看完整描述

4 回答

?
躍然一笑

TA貢獻1826條經驗 獲得超6個贊

您的解決方案很好,只有我用于astype轉換為字符串:

df['new_enc_id'] = (df['enc_id'].astype(str) + 
                    (df.groupby('person_id').cumcount()+1).astype(str))


查看完整回答
反對 回復 2023-08-15
?
達令說

TA貢獻1821條經驗 獲得超6個贊

在R中

df = df %>% group_by(person_id) %>% dplyr::mutate(new_enc_id = paste0(enc_id,row_number()) )


查看完整回答
反對 回復 2023-08-15
?
SMILET

TA貢獻1796條經驗 獲得超4個贊

在空間內R,您可以通過以下方式獲得相同的結果data.table

setDT(df)

df[,?paste0(enc_id,row.names(.SD)),?by=person_id]


查看完整回答
反對 回復 2023-08-15
?
梵蒂岡之花

TA貢獻1900條經驗 獲得超5個贊

transform使用+的基本 R 選項ave


df <- transform(

  df,

  new_enc_id = paste0(new_enc_id, ave(1:nrow(df), person_id, FUN = seq_along))

)


查看完整回答
反對 回復 2023-08-15
  • 4 回答
  • 0 關注
  • 215 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號