3 回答

TA貢獻2003條經驗 獲得超2個贊
A 字符集
是一組符號和編碼。一個 校對用于比較字符集中字符的一組規則。讓我們用一個假想字符集的例子來明確區分。
假設我們有一個有四個字母的字母表:‘a’,‘B’,‘a’,‘b’。我們給每個字母一個數字:‘a’=0,‘B’=1,‘a’=2,‘b’=3。字母‘A’是一個符號,數字0是‘A’的編碼,所有四個字母及其編碼的組合是一個字符集。
現在,假設我們要比較兩個字符串值,‘A’和‘B’。最簡單的方法是查看編碼:0表示‘A’,1表示‘B’。因為0小于1,所以我們說‘A’小于‘B’?,F在,我們所做的就是對我們的字符集應用一個排序規則。排序規則是一組規則(在本例中只有一條規則):“比較編碼”。我們將這種最簡單的排序稱為二進制排序。
但是如果我們想說小寫字母和大寫字母是等價的呢?然后我們至少有兩條規則:(1)把小寫字母‘a’和‘b’當作相當于‘A’和‘B’的字母;(2)然后比較編碼。我們稱之為不分案件的校對。它比二進制排序要復雜一些。
在現實生活中,大多數字符集都有許多字符:不僅僅是‘A’和‘B’,而是整個字母,有時是多個字母或數千個字符的東方書寫系統,還有許多特殊的符號和標點符號。在現實生活中,大多數校對都有很多規則:不只是大小寫不敏感,而且重音不敏感(“重音”是一個標記附在一個字符上,就像德語中的‘?’)和多字符映射(比如兩個德語??敝小甇E’=‘OE’的規則)。

TA貢獻2019條經驗 獲得超9個贊
添加回答
舉報