亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python:從字符串中刪除\ xa0?

Python:從字符串中刪除\ xa0?

慕森王 2019-10-23 16:46:04
我目前正在使用Beautiful Soup解析HTML文件并調用get_text(),但似乎我剩下很多\ xa0 Unicode表示空格。有沒有一種有效的方法可以在Python 2.7中將其全部刪除,并將其更改為空格?我想更籠統的問題是,有沒有辦法刪除Unicode格式?我嘗試使用:line = line.replace(u'\xa0',' '),如另一個線程所建議的那樣,但是將\ xa0更改為u,所以現在到處都是“ u”。):編輯:問題似乎已由解決str.replace(u'\xa0', ' ').encode('utf-8'),但.encode('utf-8')不這樣做replace()似乎會導致它吐出甚至更奇怪的字符,例如\ xc2。誰能解釋一下?
查看完整描述

3 回答

?
繁星淼淼

TA貢獻1775條經驗 獲得超11個贊

Python unicodedata庫中有許多有用的東西。功能之一就是.normalize()功能。


嘗試:


new_str = unicodedata.normalize("NFKD", unicode_str)

如果您沒有得到想要的結果,請使用上面鏈接中列出的任何其他方法替換NFKD。


查看完整回答
反對 回復 2019-10-23
?
Smart貓小萌

TA貢獻1911條經驗 獲得超7個贊

我遇到了同樣的問題,使用python從sqlite3數據庫中提取了一些數據。上面的答案對我不起作用(不確定為什么),但是這樣做了:line = line.decode('ascii', 'ignore')但是,我的目標是刪除\ xa0s,而不是用空格替換它們。


我是從Ned Batchelder的這個超級有用的unicode教程中獲得的。


查看完整回答
反對 回復 2019-10-23
  • 3 回答
  • 0 關注
  • 3087 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號