亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

編碼問題無法解決,對百度百科詞條的爬蟲

這個錯誤怎么解決啊,python 3.5?

?UnicodeEncodeError: 'gbk' codec can't encode character '\u02c8' in position 19: illegal multibyte sequence

正在回答

6 回答

我用的python3

加了下面兩行代碼就行了

fout = open('output.html','w',encoding='utf-8')
fout.write('<head><meta charset="utf-8"></head>')

1 回復 有任何疑惑可以回復我~
#1

ABSmiLT

贊一個。。這個最優雅
2016-10-08 回復 有任何疑惑可以回復我~
#2

leve__9

啊我也是用的3,但是都快給亂碼的問題搞死了,什么都可以就是亂碼搞不定,試過好多種方法都不行,你的也試了
2016-10-11 回復 有任何疑惑可以回復我~

可以嘗試一下 gb2312編碼,ignore參數,我猜是因為打開時用的utf-8

fout.write("<td>%s</td>"% data['title'].encode('gb2312', 'ignore'))

1 回復 有任何疑惑可以回復我~
#1

慕課的浩浩

謝謝,你這個方法解決了我的問題
2016-09-28 回復 有任何疑惑可以回復我~

在html_outputer中加fout.write('<head><meta charset="utf-8"></head>'),可以試一下

1 回復 有任何疑惑可以回復我~

編碼格式的問題,最好把錯誤信息貼出來!

0 回復 有任何疑惑可以回復我~

把gbk改成utf-8

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
Python開發簡單爬蟲
  • 參與學習       227596    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術的面紗

進入課程

編碼問題無法解決,對百度百科詞條的爬蟲

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號