我正在閱讀一個帶有encoding/csv庫的大 CSV 文件。但是這個文件有點不標準并且包含非轉義引號"打破讀者在parser.Read():2022/06/09 17:33:54 第 2 行第 5 列的解析錯誤:引用字段中的“無關或缺失”如果我使用parser.LazyQuotes = true,我會得到:2022/06/09 17:34:15 記錄第2行:字段數錯誤錯誤的 CSV 文件(減少到最小值)foo.csv:1|2"a|b所以我需要刪除所有出現的雙引號",我目前正在使用從終端對整個文件執行此操作sed 's/"//g',但我想從 Go 腳本中刪除它。知道我正在讀取這樣的文件,我應該怎么做:func processCSV(filepath string){ file, err := os.Open("foo.csv") if err != nil { log.Fatal(err) } parser := csv.NewReader(file) parser.Comma = '|' // parser.LazyQuotes = true _, err = parser.Read() // skip headers for { record, err := parser.Read() if err == io.EOF { break } if err != nil { log.Fatal(err) } // process record }}
1 回答

萬千封印
TA貢獻1891條經驗 獲得超3個贊
創建一個io.Reader,它從通過底層 io.Reader 讀取的數據中刪除引號。
// rmquote reads r with " removed.
type rmquote struct {
r io.Reader
}
func (c rmquote) Read(p []byte) (int, error) {
n, err := c.r.Read(p)
// i is output position for loop below
i := 0
// for each byte read from the file
for _, b := range p[:n] {
// skip quotes
if b == '"' {
continue
}
// copy byte to output position and advance position
p[i] = b
i++
}
// output position is the new length
return i, err
}
將其插入 CSV 閱讀器和文件之間:
parser := csv.NewReader(rmquote{file})
- 1 回答
- 0 關注
- 113 瀏覽
添加回答
舉報
0/150
提交
取消