亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

清理熊貓數據框中的單列

清理熊貓數據框中的單列

慕勒3428872 2021-11-16 16:15:26
將 CSV 作為 Pandas 數據框導入并刪除所有完全空的列:import pandas as pd df1 = pd.read_csv("name.csv") df1 = df1.dropna(axis=1,how='all')唉,一列看起來像:'Background\r\n * find it: IDE-3: Some Name\r\n * Dokument: SomeName.pptx\r\n * Field: TEG-33\r\n  * happy: Done\r\n\r\nh3. Definition\r\n\r\n\xa0tbd.\r\nh3. exists\r\n\r\ncsv\r\nh3. Source\r\n\r\ncsv?\r\n\r\npotentiell?\r\n\r\ntbd\r\nh3. task\r\n\r\ntbd\r\n\r\n\xa0'問題 1:我想刪除所有 \r\n 和 \r\n\r\ 和 \r\n\r\n\ 和 \r\n\r\n\xa0 等。任何人都可以幫助使用正則表達式? 我找不到清晰的模式。問題 2:首先如何防止在將 CSV 導入 Pandas 數據框時寫入所有這些各種形式的 \r\n\r\(參見問題 2)?清理數據框中提到的列的所有行后,最終結果應該是(Python 3,Anaconda3 分發版,在 Windows 10 上)
查看完整描述

2 回答

?
HUH函數

TA貢獻1836條經驗 獲得超4個贊

對于問題 1:


(df1['Column 3']

.str.replace('\r','')

.str.replace('\n','')

.str.replace('\xa0', ''))

對于問題 2:您可以在數據進入 csv 時對其進行清理 - 但在不知道數據來自何處的情況下很難說!


查看完整回答
反對 回復 2021-11-16
?
慕俠2389804

TA貢獻1719條經驗 獲得超6個贊

問題 1

這個正則表達式將實現你想要的:


(\r\n)+(\r)*(\xa0)*

解釋:


(\r\n)+  # One or more copies of '\r\n'

(\r)*    # Any extra appended    '\r'

(\xa0)*  # Any final appended    '\xao'

但請注意,在您的示例中,沒有\r\n...\rie形式的字符串,最后附加了\r.


查看完整回答
反對 回復 2021-11-16
  • 2 回答
  • 0 關注
  • 201 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號