亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

爬蟲亂碼情況

爬出來的全是b'\nPython\xef\xbc\x88\xe8\x8b\xb1\xe8\xaf\xad\xe5\x8f\x91\xe9\x9f\xb3亂碼,什么情況

正在回答

4 回答

沒錯,編碼,又解碼,相當于不起作用,但是起作用的是這一句“fout = open('output.html','w',encoding='utf-8')”,我也很奇怪,給文本編一次UTF編碼就好,MOOC的方式就出現了亂碼錯誤,但是在文件的打開的時間進行UTF編碼就可以避免亂碼了

0 回復 有任何疑惑可以回復我~

又encode,又decode,豈不是編碼沒有改???

0 回復 有任何疑惑可以回復我~

在文件開頭加

#?-*-?coding:?utf-8?-*-
import?sys
reload(sys)
sys.setdefaultencoding("utf-8")


0 回復 有任何疑惑可以回復我~
??我的運行環境是win7,32位,python3.5.1,
??修改解析器代碼
??把#號后面的語句修改成下行,就好了!
????def?output_html(self):

????????#fout?=?open('output.html','w')
????????fout?=?open('output.html','w',encoding='utf-8')
????????
????????#fout.write("<html><meta?charset=\"utf-8\"?/>")
????????fout.write("<head><meta?charset=\"utf-8\"></head>")

????????fout.write("<body>")
????????fout.write("<table>")
????????
????????for?data?in?self.datas:
????????????fout.write("<tr>")
????????????fout.write("<td>%s</td>"?%?data['url'])

????????????#fout.write("<td>%s</td>"?%?data['title'].encode('utf-8'))
????????????fout.write("<td>%s</td>"?%?data['title'].encode('utf-8').decode("utf-8"))

????????????#fout.write("<td>%s</td>"?%?data['summary'].encode('utf-8'))
????????????fout.write("<td>%s</td>"?%?data['summary'].encode('utf-8').decode("utf-8"))


2 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
Python開發簡單爬蟲
  • 參與學習       227596    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術的面紗

進入課程

爬蟲亂碼情況

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號