已解決430363個問題，去搜搜看，總會有你想問的

將 pandas 數據框中的字符串拆分為 3 個（三元組）

首頁猿問將 pandas...

將 pandas 數據框中的字符串拆分為 3 個（三元組）

Python

小怪獸愛吃肉 2023-07-11 15:30:22

我有一個像這樣的 df：col1AAP CO. LTD.AAS dds dTdD.我正在嘗試創建一個函數來生成 pandas df 列，就像col2它分割col1每 3 個（或 n 個）字符一樣：col1 col2AAP CO. LTD. ['AAP','AP ','P C','CO.','O. '...]AAS dds dTdD. ['AAS','AS ','S d','dds','ds '...]我已經嘗試過這段代碼，但它只是為每一行重復相同的字符串列表......def trigram(self): for b in df.parent_org_name: a = ["".join(j) for j in zip(*[b[i:] for i in range(3)])] # [b[i:i+3] for i in range(len(b)-1)] return a # print(a) df.apply(trigram, axis=1)有任何想法嗎？

查看完整描述

3 回答

倚天杖

TA貢獻1828條經驗獲得超3個贊

您可以添加更多邏輯，具體取決于如果您提供的N大于字符串長度的情況會發生什么（目前我在列表中返回原始字符串）。

字符串切片，將切片開始和停止索引增加 1，并確保到達字符串末尾后停止，否則可能會返回長度 <N 的子字符串。

import numpy as np

def split_str(s, N):

rmax = np.clip(len(s)-N, a_min=0, a_max=None)+1

return [s[0+i:N+i] for i in range(0, rmax)]

df['col1'].apply(lambda x: split_str(x, 3))

#0 [AAP, AP , P C, CO, CO., O. , . L, LT, LTD, ...

#1 [AAS, AS , S d, dd, dds, ds , s d, dT, dTd, ...

#Name: col1, dtype: object

# To show actual values

df['col1'].apply(lambda x: split_str(x, 3))[0]

#['AAP', 'AP ', 'P C', ' CO', 'CO.', 'O. ', '. L', ' LT', 'LTD', 'TD.']

反對回復 2023-07-11

繁花不似錦

TA貢獻1851條經驗獲得超4個贊

我想這就是你所需要的:)。如果需要使用不同于 3 的參數 n 來運行它，那么他們可以相應地更改括號中的 i+3

df["col2"] = df.apply(lambda x: [x[0][i:i+3] for i in range(0, len(x[0]))],axis=1)

#The result looks as follows

col1 col2

0 AAP CO. LTD. [AAP, AP , P C, CO, CO., O. , . L, LT, LTD, ...

1 AAS dds dTdD. [AAS, AS , S d, dd, dds, ds , s d, dT, dTd, ...

反對回復 2023-07-11

慕斯王

TA貢獻1864條經驗獲得超2個贊

不要循環遍歷所有行，而是更改函數定義，如下所示 -

def trigram(self):

b=self.col1

a = ["".join(j) for j in zip(*[b[i:] for i in range(3)])]

# a = ["".join(j) for j in zip(*[b[i:] for i in range(3)])]

# [b[i:i+3] for i in range(len(b)-1)]

return a

反對回復 2023-07-11

3 回答
0 關注
240 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

將 pandas 數據框中的字符串拆分為 3 個（三元組）

將 pandas 數據框中的字符串拆分為 3 個（三元組）

3 回答

添加回答