亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

使用 Python 將中文 Unicode 碼位轉換為字符串

使用 Python 將中文 Unicode 碼位轉換為字符串

慕田峪9158850 2022-07-26 15:49:12
我有一個包含 8105 個中文字符的Unicode 代碼點的文件,看起來類似于U+516DU+4E03U+516B我理解這些代表以下漢字六 [Chinese character for 'six', Reference http://hanzidb.org/character/%E5%85%AD]七 [Chinese character for 'seven', Reference http://hanzidb.org/character/%E4%B8%83]八 [Chinese character for 'eight', Reference http://hanzidb.org/character/%E5%85%AB]如何使用 Python 3 將包含字符串U+516D, U+4E03,的文件轉換U+516B為對應的漢字?任何幫助,將不勝感激。提前致謝。
查看完整描述

2 回答

?
HUX布斯

TA貢獻1876條經驗 獲得超6個贊

def get_character(string):

    return chr(int(string[2:], 16))

>>> get_character("U+4E03")

'七'

>>> get_character("U+516D")

'六'

>>> get_character("U+4E03")

'七'

>>> get_character("U+516B")

'八'

這是我所知道的最簡單的方法,注意它不會檢查正確的格式,只是砍掉前 2 個字符,假設U+


查看完整回答
反對 回復 2022-07-26
?
慕容708150

TA貢獻1831條經驗 獲得超4個贊

此正則表達式會將U+hhhh格式(4-6 個十六進制字符)的文本轉換為其相應的 Unicode 代碼點:


import re


s = 'U+516D U+4E03 U+516B'


s = re.sub(r'U\+([0-9A-F]{4,6})',lambda m: chr(int(m.group(1),16)),s)

print(s)

輸出:


六 七 八


查看完整回答
反對 回復 2022-07-26
  • 2 回答
  • 0 關注
  • 226 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號