亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

讀取前清理 CSV 文件

讀取前清理 CSV 文件

Go
阿晨1998 2022-12-19 20:29:18
我正在閱讀一個帶有encoding/csv庫的大 CSV 文件。但是這個文件有點不標準并且包含非轉義引號"打破讀者在parser.Read():2022/06/09 17:33:54 第 2 行第 5 列的解析錯誤:引用字段中的“無關或缺失”如果我使用parser.LazyQuotes = true,我會得到:2022/06/09 17:34:15 記錄第2行:字段數錯誤錯誤的 CSV 文件(減少到最小值)foo.csv:1|2"a|b所以我需要刪除所有出現的雙引號",我目前正在使用從終端對整個文件執行此操作sed 's/"//g',但我想從 Go 腳本中刪除它。知道我正在讀取這樣的文件,我應該怎么做:func processCSV(filepath string){    file, err := os.Open("foo.csv")    if err != nil {        log.Fatal(err)    }    parser := csv.NewReader(file)    parser.Comma = '|'    // parser.LazyQuotes = true    _, err = parser.Read() // skip headers    for {        record, err := parser.Read()        if err == io.EOF {            break        }        if err != nil {            log.Fatal(err)        }        // process record    }}
查看完整描述

1 回答

?
萬千封印

TA貢獻1891條經驗 獲得超3個贊

創建一個io.Reader,它從通過底層 io.Reader 讀取的數據中刪除引號。

// rmquote reads r with " removed.

type rmquote struct {

    r io.Reader

}


func (c rmquote) Read(p []byte) (int, error) {

    n, err := c.r.Read(p)


    // i is output position for loop below

    i := 0


    // for each byte read from the file

    for _, b := range p[:n] {


        // skip quotes

        if b == '"' {

            continue

        }


        // copy byte to output position and advance position

        p[i] = b

        i++

    }


    // output position is the new length

    return i, err

}

將其插入 CSV 閱讀器和文件之間:


parser := csv.NewReader(rmquote{file})


查看完整回答
反對 回復 2022-12-19
  • 1 回答
  • 0 關注
  • 113 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號