已解決430363個問題，去搜搜看，總會有你想問的

為什么文本文件編碼仍然是 ANSI，而在我指定它是 UTF-8 的 Java 代碼中

首頁猿問為什么文本文件編碼仍然是...

為什么文本文件編碼仍然是 ANSI，而在我指定它是 UTF-8 的 Java 代碼中

Java

萬千封印 2023-06-04 10:29:32

我正在使用 FileWriter 對象將一些文本寫入文件。我指定我希望輸出為 UTF-8，但是當我打開文本文件并另存為時，我看到它是 ANSI 編碼。我還想補充一點，當存在標準 ascii 字符集以外的字符（例如：- 日文字符）時，文件編碼為 UTF-8，但沒有則文本文件編碼為 ANSI。File json_file= new File(path);FileWriter json_file_output=newFileWriter(json_file,StandardCharsets.UTF_8);json_file_output.write("SOME JSON TEXT HERE");json_file_output.flush();我不確定是由于 java 代碼還是記事本。感謝您的幫助。

查看完整描述

1 回答

守著一只汪

TA貢獻1872條經驗獲得超4個贊

Unicode是US-ASCII字符集的超集，
UTF-8是8位US-ASCII字符編碼的超集

沒有ANSI 編碼這樣的東西。

可能的意思是US-ASCII。并且每個 8 位 US-ASCII 文件也是一個 UTF-8 文件。Unicode 是 US-ASCII 的超集。當使用八位字節寫出時，ASCII 文件是UTF-8 文件。UTF-8 編碼是故意以這種方式設計的，以便兼容。

US-ASCII 是一個 7 位字符集，只有 128 個字符，編號為 0-127。因此，如果使用八位字節（8 位）編寫，則每個八位字節的第一位都是零。

沒有文件元數據

了解 US-ASCII 文件和 UTF-8 文件（沒有 BOM?）都只是一堆位，沒有元數據。不幸的是，計算機行業從未設法為文件系統元數據建立標準。因此應用程序必須猜測內容的內容，或者用戶必須指明預期的格式。

您的文本編輯器可能會查看在您的文件中找到的字符域，然后嘗試使用盡可能小的范圍編碼來保守地標記文件。如果只有 US-ASCII 字符，則標記為 US-ASCII（顯然誤報為“ANSI”）。一旦您添加代碼點超出 ASCII 代碼點的更高編號的字符，然后標記為 UTF-8。

反對回復 2023-06-04

1 回答
0 關注
418 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

為什么文本文件編碼仍然是 ANSI，而在我指定它是 UTF-8 的 Java 代碼中

為什么文本文件編碼仍然是 ANSI，而在我指定它是 UTF-8 的 Java 代碼中

1 回答

Unicode是US-ASCII字符集的超集，UTF-8是8位US-ASCII字符編碼的超集

沒有文件元數據

添加回答

為什么文本文件編碼仍然是 ANSI，而在我指定它是 UTF-8 的 Java 代碼中

Unicode是US-ASCII字符集的超集，
UTF-8是8位US-ASCII字符編碼的超集