亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

dis.readUTF()是如何確定讀多少字節的?

問題是在學Java的DataOutputStream/DataInputStream時想到的

String?fileName?=?"dos.dat";
DataOutputStream?dos?=?new?DataOutputStream(new?FileOutputStream(fileName));
DataInputStream?dis??=?new?DataInputStream(new?FileInputStream(fileName));

//分別以utf-8和utf-16be編碼的方式寫入兩個"中國"
dos.writeUTF("中國");
dos.writeChars("中國");

//打印readUTF()讀到的字符串
String?s?=?dis.readUTF();
System.out.println(s);

文件傳輸基礎——Java IO流 4-4課程中,老師演示的輸出結果只打印了一個"中國"

疑問:

文件就是字節排列,

utf-8編碼中,中文占3個字節

utf-16be編碼中,中文占2個字節

readUTF()方法是如何確定要讀幾個字節的呢?

比如說,

假若字節排列為11 22 33 44 55 66 77 88 99 00

11 22 33組成utf-8的'中'

44 55 66組成utf-8的'國'

77 88組成utf-16be的'中'

99 00組成utf-16be的"國"

然而77 88 99也可組成utf-8的'不知是什么的中文'、或77組成'不知是什么的英文'

那么在將字節轉為字符串的時候,read()方法是如何做到

中文對應的字節轉為中文,而不是轉為2個字母

非utf-8編碼的字節比如utf-16be的字節排除,或停止,而不是繼續讀出來?

底層代碼花了很長世間卻實在是看不懂,求大神解答

感謝。

正在回答

1 回答

嘗試回答一下,首先是utf-16be編碼中英文都是兩個字節,那么就是根據指針兩個兩個字節編譯;utf-8編碼時中文占三個字節,英文占一個字節,設想一下,首先也是按照指針,應該有個先后編譯順序,假設英文優先,就是先嘗試編譯一個字節,若失敗,則嘗試編譯三個字節,成功則編譯成一個漢字,失敗則編譯成亂碼,循環下去,當然實際情況可能復雜的多,編碼的方式也就像是一個封裝,不用考慮太多。

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消

dis.readUTF()是如何確定讀多少字節的?

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號