為了使A與Z匹配,我們將使用正則表達式:[A-Za-z]如何允許正則表達式匹配用戶輸入的utf8字符?例如環保部等中文單詞
3 回答

GCT1015
TA貢獻1827條經驗 獲得超4個贊
Java正則表達式API適用于該char類型
該char類型隱式為UTF-16
如果您有UTF-8數據,則需要在輸入時將其轉碼為UTF-16
Unicode是通用的字符集,而UTF-8可以描述所有字符(包括控制字符,標點符號,符號,字母等)。您將必須更加明確地確定要包含的內容和要排除的內容。Java正則表達式使用\p{category}語法按類別匹配代碼點。請參閱Unicode標準的列表類別。
如果要在表意文字序列中識別和分隔單詞,則需要查看更復雜的API。我將從BreakIterator類型開始。
添加回答
舉報
0/150
提交
取消