前阵子想爬点东西,结果一直提示错误UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position
,在网上一查,发现是 Windows 的控制台的问题。控制台的编码是 GBK
,Python 是 UTF-8
,造成了冲突。下面给出三种解决方法:
第一种方法:直接替换出错的内容
import requests url = 'https://segmentfault.com/a/1190000015617318'print(requests.get(url).text.replace('\xa0', ' '))
第二种方法:再解码
先用 GBK 编码,加个 ignore 丢弃错误的字符,然后再解码。
import requests url = 'https://segmentfault.com/a/1190000015617318'print(requests.get(url).text.encode('gbk', 'ignore').decode('gbk')
第三种方法:修改控制台编码
新建一个 cmd.reg, 输入代码:
Windows Registry Editor Version 5.00 [HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]"CodePage"=dword:0000fde9"FontFamily"=dword:00000036"FontWeight"=dword:00000190"FaceName"="Consolas""ScreenBufferSize"=dword:232900d2"WindowSize"=dword:002b00d2
保存后运行。如果 Ctrl+B 无效,用 python.exe
打开.py程序后再试一次。
作者:以茄之名
链接:https://www.jianshu.com/p/8a8f358c40c0
點擊查看更多內容
為 TA 點贊
評論
評論
共同學習,寫下你的評論
評論加載中...
作者其他優質文章
正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦