我無法將文本文檔拆分為數據框中的多個句子并為每個句子創建行,而其他列值應該相同。讓我解釋一下:最初A | B | C | D
-------------
x | A.B | x | x
y | C.D.E | y | y我想要什么(在 B 列中拆分文本后)A | B | C | D
-------------
x | A | x | x
x | B | x | x
y | C | y | y
y | D | y | y
y | E | y | y到目前為止我做了什么?我已成功使用 split() 方法將文本文檔拆分為不同的句子?,F在我陷入了第二部分。非常感謝您的幫助。
1 回答

holdtom
TA貢獻1805條經驗 獲得超10個贊
使用str.split('.')和explode():
str.split('.')返回一個列表以準備爆炸。爆炸需要列中的列表格式才能工作。
df['B'] = df['B'].str.split('.')
df
Out[10]:
A B C D
0 x [A, B] x x
1 y [C, D, E] y y
然后分解列表,將列作為參數傳遞,表示要根據該列分解數據框:
df['B'] = df['B'].str.split('.')
df = df.explode('B')
df
Out[11]:
A B C D
0 x A x x
0 x B x x
1 y C y y
1 y D y y
1 y E y y
添加回答
舉報
0/150
提交
取消