我正在使用 FileWriter 對象將一些文本寫入文件。我指定我希望輸出為 UTF-8,但是當我打開文本文件并另存為時,我看到它是 ANSI 編碼。我還想補充一點,當存在標準 ascii 字符集以外的字符(例如:- 日文字符)時,文件編碼為 UTF-8,但沒有則文本文件編碼為 ANSI。File json_file= new File(path);FileWriter json_file_output=newFileWriter(json_file,StandardCharsets.UTF_8);json_file_output.write("SOME JSON TEXT HERE");json_file_output.flush();我不確定是由于 java 代碼還是記事本。感謝您的幫助。
1 回答

守著一只汪
Unicode是US-ASCII字符集的超集,
TA貢獻1872條經驗 獲得超4個贊
Unicode是US-ASCII字符集的超集,
UTF-8是8位US-ASCII字符編碼的超集
沒有ANSI 編碼這樣的東西。
可能的意思是US-ASCII。并且每個 8 位 US-ASCII 文件也是一個 UTF-8 文件。Unicode 是 US-ASCII 的超集。當使用八位字節寫出時,ASCII 文件是UTF-8 文件。UTF-8 編碼是故意以這種方式設計的,以便兼容。
US-ASCII 是一個 7 位字符集,只有 128 個字符,編號為 0-127。因此,如果使用八位字節(8 位)編寫,則每個八位字節的第一位都是零。
沒有文件元數據
了解 US-ASCII 文件和 UTF-8 文件(沒有 BOM?)都只是一堆位,沒有元數據。不幸的是,計算機行業從未設法為文件系統元數據建立標準。因此應用程序必須猜測內容的內容,或者用戶必須指明預期的格式。
您的文本編輯器可能會查看在您的文件中找到的字符域,然后嘗試使用盡可能小的范圍編碼來保守地標記文件。如果只有 US-ASCII 字符,則標記為 US-ASCII(顯然誤報為“ANSI”)。一旦您添加代碼點超出 ASCII 代碼點的更高編號的字符,然后標記為 UTF-8。
添加回答
舉報
0/150
提交
取消