標題解釋了主要問題,但讓我詳細說明。假設我有兩個 CSV 文件 -csv1和csv2. 他們每個看起來都像這樣:csv1:和csv2:問題是當我運行時pd.read_csv('./csv1.csv')它工作正常,但是當我運行時pd.read_csv('./csv2.csv')我得到一個UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 73: invalid start byte兩個 CSV 文件之間的區別csv2基本上csv1是日期按升序排序。我為實現這一目標所做的操作是:csv2 = csv1.sort_values(by=['date'])csv2.to_csv('./Data/csv_final.csv', index=False)有誰知道問題是什么?我試過查看其他解決方案,許多人建議在運行時嘗試指定不同的編碼方案,pd.read_csv()但我只是好奇問題可能是由什么引起的。謝謝你。
我有兩個相同的 CSV 文件,但由于 UnicodeDecodeError 無法將其中一個讀入
慕的地8271018
2021-12-26 10:56:36