亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python – 使用分割記錄清理 CSV 文件

Python – 使用分割記錄清理 CSV 文件

侃侃無極 2023-07-05 10:20:25
我有一個分隔文件,其中某些字段包含行終止字符。它們可以是 LF 或 CR/LF。行終止符導致記錄分成多行。我的目標是讀取文件,刪除行終止字符,然后寫出一個在字段周圍用引號引起來的分隔文件。輸入記錄示例:444,2018-04-06,19:43:47,43762485,"Request processed"CR\LF555,2018-04-30,19:17:56,43762485,"Added further note:LFemail customer a receipt" CR\LF 第一個記錄沒問題,但第二個記錄有 LF(換行),導致記錄折疊。import csvwith open(raw_data, 'r', newline='') as inp, open(csv_data, 'w') as out:    csvreader = csv.reader(inp, delimiter=',', quotechar='"')    for row in csvreader:        print(str(row))        out.write(str(row)[1:-1] + '\n') 我的代碼幾乎可以工作,但我認為它不正確。我得到的輸出是:['444', '2020-04-06', '19:43:47', '344376882485', 'Request processed']['555', '2020-04-30', '19:17:56', '344376882485', 'Added further note:\nemail customer a receipt']我使用子字符串刪除行開頭和結尾處的方括號,我認為這不是正確的方法。請注意,第二條記錄中的新行字符已轉換為 \n。我想知道如何擺脫它,并將 csv 編寫器合并到代碼中以在字段周圍放置雙引號。為了刪除行終止符,我嘗試更換但沒有成功。(row.replace('\r', '').replace('\n', '') for row in csvreader) 我還嘗試合并一個 csv 編寫器,但無法使其與列表一起使用。任何意見,將不勝感激。
查看完整描述

1 回答

?
長風秋雁

TA貢獻1757條經驗 獲得超7個贊

這段代碼可以滿足您的需求:


with open('raw_data.csv', 'r', newline='') as inp, open('csv_data.csv', 'w') as out:

    reader = csv.reader(inp, delimiter=',', quotechar='"')

    writer = csv.writer(out, delimiter=',', quotechar='"', quoting=csv.QUOTE_ALL)

    for row in reader:

        fixed = [cell.replace('\n', '') for cell in row]

        writer.writerow(fixed)

引用所有單元格是通過傳遞csv.QUOTE_ALL作為作者的“引用”參數來處理的。


線路


fixed = [cell.replace('\n', '') for cell in row]

創建一個新的單元格列表,其中嵌入的'\n'字符被空字符串替換。


默認情況下,Python 會將行尾設置為平臺的默認值。如果您想覆蓋它,您可以將行終止符參數傳遞給編寫器。


對我來說,原始的 csv 看起來很好:在引用的單元格內嵌入換行符(“軟換行符”)是正常的,并且 csv 感知應用程序應該像電子表格一樣正確處理它們。然而,它們在不理解 csv 格式的應用程序中看起來會是錯誤的,因此將嵌入的換行符視為實際的行尾字符。


查看完整回答
反對 回復 2023-07-05
  • 1 回答
  • 0 關注
  • 151 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號