課程
                    
                        /后端開發
                        
                            /Python
                        
                        /Python最火爬蟲框架Scrapy入門與實踐

編碼問題，現在是unicode，沒法用xpath

請問老師及各位朋友，我現在抓取的網頁，源代碼是unicode，直接使用response.xpath是不能正確匹配的。

但是如果，我將response.text轉碼為utf-8后賦值給一個str變量，str是不能使用xpath的。

但是同時response.text又不能修改（即轉碼后給自身賦值）。

這種情況有什么好的辦法嘛

手刻CPU

2020-02-03

源自：Python最火爬蟲框架Scrapy入門與實踐 2-7

關注問題我要回答

1061

操作

收起

1 回答

手刻CPU 提問者
2020-02-04

已解決，使用lxml的etree配合轉碼可以解決。

目前轉碼后發現，爬去的返回信息是JS和data，網頁是動態生成的，這個怎么爬取呢

目標網頁：

https://b2b.baidu.com/cc?q=%E4%BC%BA%E6%9C%8D%E9%A9%B1%E5%8A%A8%E5%99%A8&from=b2b_factory&srcid=5359&from_ver=v2&from_elem=title

0 回復有任何疑惑可以回復我~

收起回答

舉報

0/150

提交

取消

Python最火爬蟲框架Scrapy入門與實踐

參與學習 67423 人
解答問題 235 個

做為爬蟲工程師Python Scrapy主流爬蟲框架你必須要會！

進入課程

本課相似問答

3 回答Xpath問題

1 回答Xpath在解析的時候沒問題，但是有的Xpath語句就爬不到東西怎么回事呢

2 回答爬到的類容中文顯示unicode編碼

1 回答老師用的xpath工具是什么？

1 回答有的xpath里面可以獲得數據沒有問題但是scrapy里面將xpath語句復制過來得到的[]

搜索更多本課相關問答

編碼問題，現在是unicode，沒法用xpath

我要回答關注問題

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

編碼問題，現在是unicode，沒法用xpath

1 回答

本課相似問答

編碼問題，現在是unicode，沒法用xpath

編碼問題，現在是unicode，沒法用xpath

編碼問題，現在是unicode，沒法用xpath