已解決430363個問題，去搜搜看，總會有你想問的

需要RE來檢測UTF-8

首頁猿問需要RE來檢測UTF-8

需要RE來檢測UTF-8

Python

catspeake 2021-03-19 18:14:36

我有以下代碼inf = codecs.open(inPath , encoding='utf-8')outf = codecs.open(outPath, encoding='utf-8', mode='w')old = u'’;'new = u'’;'for line in inf: line = line.replace(old,new) asc = line.encode('ascii', 'xmlcharrefreplace') outf.write(asc) # print ascinf.close()outf.close()這（正確）使用數字格式將智能引號和帶重音符號等轉換為它們的html實體格式。它將轉換<p>Dreams like: “Someday I’ll travel to…; someday I’ll write a book;進入<p>Dreams like: “Someday I’ll travel to…; someday I’ll write a book; 這都是正確的。但是，…;在更下游的代碼中，看到了中間的代碼，刪除了雙分號，然后抱怨它沒有有效的實體。我無法更改此代碼。如您從我的代碼中看到的那樣，我發現了一種情況，其中一個實體后跟一個分號。我不想替換源代碼中的所有分號。如何檢測代碼點> 127的UTF-8字符后的半冒號，以便將其替換為;？謝謝。

查看完整描述

1 回答

慕標琳琳

TA貢獻1830條經驗獲得超9個贊

面對棕櫚！

如果我先轉換為htmlentites，然后替換;;為即可;E解決我的問題。

自我注意-考慮您在哪里做事情以及該怎么做！

反對回復 2021-03-27

1 回答
0 關注
185 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

需要RE來檢測UTF-8

需要RE來檢測UTF-8

1 回答

添加回答