亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

為什么文本文件編碼仍然是 ANSI,而在我指定它是 UTF-8 的 Java 代碼中

為什么文本文件編碼仍然是 ANSI,而在我指定它是 UTF-8 的 Java 代碼中

萬千封印 2023-06-04 10:29:32
我正在使用 FileWriter 對象將一些文本寫入文件。我指定我希望輸出為 UTF-8,但是當我打開文本文件并另存為時,我看到它是 ANSI 編碼。我還想補充一點,當存在標準 ascii 字符集以外的字符(例如:- 日文字符)時,文件編碼為 UTF-8,但沒有則文本文件編碼為 ANSI。File json_file= new File(path);FileWriter json_file_output=newFileWriter(json_file,StandardCharsets.UTF_8);json_file_output.write("SOME JSON TEXT HERE");json_file_output.flush();我不確定是由于 java 代碼還是記事本。感謝您的幫助。
查看完整描述

1 回答

?
守著一只汪

TA貢獻1872條經驗 獲得超4個贊

Unicode是US-ASCII字符集的超集,
UTF-8是8位US-ASCII字符編碼的超集

沒有ANSI 編碼這樣的東西。

可能的意思是US-ASCII。并且每個 8 位 US-ASCII 文件也是一個 UTF-8 文件。Unicode 是 US-ASCII 的超集。當使用八位字節寫出時,ASCII 文件UTF-8 文件。UTF-8 編碼是故意以這種方式設計的,以便兼容。

US-ASCII 是一個 7 位字符集,只有 128 個字符,編號為 0-127。因此,如果使用八位字節(8 位)編寫,則每個八位字節的第一位都是零。

沒有文件元數據

了解 US-ASCII 文件和 UTF-8 文件(沒有 BOM?只是一堆位,沒有元數據。不幸的是,計算機行業從未設法為文件系統元數據建立標準。因此應用程序必須猜測內容的內容,或者用戶必須指明預期的格式。

您的文本編輯器可能會查看在您的文件中找到的字符域,然后嘗試使用盡可能小的范圍編碼來保守地標記文件。如果只有 US-ASCII 字符,則標記為 US-ASCII(顯然誤報為“ANSI”)。一旦您添加代碼點超出 ASCII 代碼點的更高編號的字符,然后標記為 UTF-8。

查看完整回答
反對 回復 2023-06-04
  • 1 回答
  • 0 關注
  • 361 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號