亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

請問什么是字符集、編碼、代碼頁(code page)?

請問什么是字符集、編碼、代碼頁(code page)?

鳳凰求蠱 2021-11-02 13:10:31
還有什么計算機內碼unicode 和utf-8這些。。我在Uedit32里面查看的utf-8的16進制,怎么顯示的是Unicode編碼啊,而不是3字節的Utf-8數據啊
查看完整描述

2 回答

?
蝴蝶不菲

TA貢獻1810條經驗 獲得超4個贊

字符集就是一組規定了的字和符號。
例如,GB2312-1980,它含ASCII字符,日文假名(字母),俄文字母,7千左右的中文字。

編碼,就是給字符集中每一字符各有一個獨一無二的數字號碼,相當于定義一組向量,一列是字和符號形狀,另一列是它的碼。

代碼頁 code page 是IBM 的傳統術語,就是“一張字符編碼表”,當然這個“張”可以很大也 可以很小。例如 IBM PC (OEM) code page,中文GBK code page 。

Code page is the traditional IBM term used for a specific character encoding table: a mapping in which a sequence of bits, usually a single octet representing integer values 0 through 255, is associated with a specific character. IBM and Microsoft often allocate a code page number to a character set even if that charset is better known by another name.

GB2312 code page 是雙bytes 碼,兩字節大于 0xA0A0 的表. 也就是說code page 里可能含有部分空白(少數碼,沒有字符)。

UTF 是unicode的傳送碼,即unicode編碼后的編碼。UTF的編碼方法很簡單,用算術表達式計算就可以了,看3字節的Utf-8數據沒意思。unicode 與字符集對應。Utf-8與unicode值對應。

計算機內碼就是指令碼,數據和地址。



查看完整回答
反對 回復 2021-11-06
?
慕沐林林

TA貢獻2016條經驗 獲得超9個贊

1.字符集:字符集(Character set)是多個字符的集合,字符集種類較多,每個字符集包含的字符個數不同,常見字符集名稱:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。

2.編碼:編碼是信息從一種形式或格式轉換為另一種形式的過程。用預先規定的方法將文字、數字或其它對象編成數碼,或將信息、數據轉換成規定的電脈沖信號。編碼在電子計算機、電視、遙控和通訊等方面廣泛使用。編碼是信息從一種形式或格式轉換為另一種形式的過程。

3.代碼頁是字符集編碼的別名,也有人稱"內碼表"。

查看完整回答
反對 回復 2021-11-06
  • 2 回答
  • 0 關注
  • 562 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號