TA貢獻1868條經驗 獲得超4個贊
一般python的console只能識別GBK的中文,unicode與utf-8都不可以。
LZ先查一下爬的網頁的編碼格式,然后用decode轉碼成unicode格式的,再用encode轉碼成GBK,就能正確輸出了。
html = '<p>***<p>' #比如說這是爬取下來的網頁,編碼格式為utf-8 html.decode( 'utf-8' ).encode( 'GBK' ) print html
TA貢獻1891條經驗 獲得超3個贊
一般是編碼不對,看清是utf8還是gb2312
從 0 開始學爬蟲
¥ 68.00
舉報
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網安備11010802030151號
購課補貼聯系客服咨詢優惠詳情
慕課網APP您的移動學習伙伴
掃描二維碼關注慕課網微信公眾號