亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據,如何把全部數據爬取下來,求教?

#?encode:utf-8

#?引入開發包
from?urllib?import?request
from?bs4?import?BeautifulSoup
import?re

#?攜帶User-Agent的頭,模擬真實瀏覽器來請求URL,并把結果用?utf-8?編碼
req?=?request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO')
req.add_header('User-Agent',?'Mozilla/5.0?(Windows?NT?10.0;?WOW64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/65.0.3325.181?Safari/537.36')
resq?=?request.urlopen(req)
#?使用?BeautifulSoup?去解析
soup?=?BeautifulSoup(resq,?'html.parser')
#?獲取所有以//www.bilibili.com/video/開頭的a標簽的href屬性
listUrls?=?soup.findAll('a',?href=re.compile('^//www\.bilibili\.com/video/'))
#?輸出所有的詞條對應的名稱和url
for?url?in?listUrls:
????print(url.get_text(),?'<---->',?url['href'])


正在回答

1 回答

url修改成:https://api.bilibili.com/x/web-interface/search/type?search_type=video&highlight=1&keyword=%E5%BE%90%E5%A4%A7SAO&page=3&jsonp=jsonp&callback=__jp1直接設置page就可以了

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前這樣只能爬取一頁的數據,如何把全部數據爬取下來,求教?

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號