def?get_page_max_list(url,error_count?=?1):??#error_count=1方面函數內全局的對錯誤的計數不受for限制
????page_max_list?=?[]
????Bankuan_link_list?=?get_Bankuan_link(url)??#獲取板塊的鏈接,返回的是列表類型
????Bankuan_name_list?=?get_Bankuan_name(url)?#獲取板塊的名,列表
????for?x?in?Bankuan_link_list:??
????????html?=?urllib.request.urlopen(url?+?x)
????????bsObj?=?BeautifulSoup(html,?"lxml")
????????error?=?Bankuan_link_list.index(x)???#error變量是為了后面遇到問題時候能標記到底是哪個板塊的問題
????????error_Bankuan_name?=?Bankuan_name_list[error]
????????try:
????????????num?=?bsObj.find('input',?{'name':?'custompage'}).next_sibling.string[3:-2]??#[3:-2]收集字符串從左起第四個??與???從右起倒數第二個??之間的字符串
????????????page_max_list.append(num)
????????except:
????????????print?('Error%d:?"%error_count,"%s?版塊的get_page_max_list無法解決該板塊,"需要自己動手查找該頁面頁數"%error_Bankuan_name,'\n',??"該版塊的網址是:?http://bbs.csu.edu.cn/bbs/%s?"%x,?'\n'
??????????????"在版塊名、版塊鏈接列表中的第%d位置"%error')
????????????print("="*100)
????????????error_count?=?error_count?+?1???
????????time.sleep(1)
????return?page_max_list
添加回答
舉報
0/150
提交
取消