課程
                    
                        /后端開發
                        
                            /Python
                        
                        /python遇見數據采集

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據，如何把全部數據爬取下來，求教？

#?encode:utf-8

#?引入開發包
from?urllib?import?request
from?bs4?import?BeautifulSoup
import?re

#?攜帶User-Agent的頭，模擬真實瀏覽器來請求URL,并把結果用?utf-8?編碼
req?=?request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO')
req.add_header('User-Agent',?'Mozilla/5.0?(Windows?NT?10.0;?WOW64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/65.0.3325.181?Safari/537.36')
resq?=?request.urlopen(req)
#?使用?BeautifulSoup?去解析
soup?=?BeautifulSoup(resq,?'html.parser')
#?獲取所有以//www.bilibili.com/video/開頭的a標簽的href屬性
listUrls?=?soup.findAll('a',?href=re.compile('^//www\.bilibili\.com/video/'))
#?輸出所有的詞條對應的名稱和url
for?url?in?listUrls:
????print(url.get_text(),?'<---->',?url['href'])

小小鐵頭娃

2019-08-10

源自：python遇見數據采集 3-5

關注問題我要回答

1546

操作

收起

1 回答

蒙奇_D_路飛
2019-08-20

url修改成：https://api.bilibili.com/x/web-interface/search/type?search_type=video&highlight=1&keyword=%E5%BE%90%E5%A4%A7SAO&page=3&jsonp=jsonp&callback=__jp1直接設置page就可以了

0 回復有任何疑惑可以回復我~

收起回答

舉報

0/150

提交

取消

python遇見數據采集

參與學習 59663 人
解答問題 209 個

本教程讓你初步掌握Python進行數據采集，創造屬于你的價值

進入課程

本課相似問答

2 回答為什么爬不出數據

1 回答req=request.request('http://www.baidu.com') 和req=request.Request('http://www.baidu.com')

3 回答爬不出來，求助

4 回答如何定時爬蟲

1 回答關于抓取回來的網頁數據保存失敗問題？？？

搜索更多本課相關問答

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據，如何把全部數據爬取下來，求教？

我要回答關注問題

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據，如何把全部數據爬取下來，求教？

1 回答

本課相似問答

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據，如何把全部數據爬取下來，求教？

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據，如何把全部數據爬取下來，求教？

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據，如何把全部數據爬取下來，求教？