1-1我在E盤直接創建一個聯通1.txt文件,以utf-8編碼格式保存,里面寫聯通兩字,竟然是9字節?
就是直接在E盤創建一個 聯通1.txt 文件,里邊是兩個漢字“ 聯通“,以utf-8編碼格式保存,竟然是9字節。
但是我在eclipse中創建一個utf-8格式編碼的 聯通1.txt,里邊也是兩個漢字“ 聯通“,拷貝到E盤下,查看屬性,就是6字節。
大家知道UTF-8編碼一個漢字3字節,同樣的都是UTF-8格式,而且里邊無其他內容,包括空格,一個是9字節,一個是6字節,求大神解答,困擾挺久了。。。
2016-09-09
記事本有默認的BOM頭占三個字節
2016-08-22
記事本bug 換個別的字就行了
2016-08-22
7、互聯網的興起,網頁上要顯示各種字符,必須統一啊,親。utf-8就是Unicode最重要的實現方式之一。另外還有utf-16、utf-32等。UTF-8不是固定字長編碼的,而是一種變長的編碼方式。它可以使用1~4個字節表示一個符號,根據不同的符號而變化字節長度。這是種比較巧妙的設計,如果一個字節的第一位是0,則這個字節單獨就是一個字符;如果第一位是1,則連續有多少個1,就表示當前字符占用多少個字節。
網頁地址:http://blog.csdn.net/kaida1234/article/details/49515385
2016-08-22
這個應該跟你的電腦編碼有關? 你的電腦編碼是gbk的話 那就是4個? 你的電腦編碼是utf-16? 那就是8個字節,我不清楚你的9個字節是什么編碼