亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

無法計算 beautifulsoup 字符串總和

無法計算 beautifulsoup 字符串總和

至尊寶的傳說 2023-07-27 16:27:45
你好,我想抓取一個網頁。我發布了我的代碼,但我的目標行很重要。它不起作用。我的意思是沒有錯誤,但也沒有輸出。我的代碼就在那里。我需要對字符串求和,這就出現了問題。import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'html_content = requests.get(url).textsoup = BeautifulSoup(html_content, "lxml")url_course_main='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='url_course=url_course_main+soup.find_all('option')[1].get_text()    <---this linehtml_content_course=requests.get(a).textsoup_course=BeautifulSoup(html_content_course,'lxml')for j in soup_course.find_all('td'):    print(j.get_text())當我改變我所展示的線路時url_course=url_course_main+'AKM'有效。也soup.find_all('option')[1].get_text()等于AKM。你能猜出錯誤在哪里嗎?
查看完整描述

2 回答

?
滄海一幻覺

TA貢獻1824條經驗 獲得超5個贊

嘗試使用requestsPython 的標準urllib.request. requests模塊打開頁面時出現問題:


import urllib.request

from bs4 import BeautifulSoup



url='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'

html_content = urllib.request.urlopen(url).read()

soup = BeautifulSoup(html_content, "lxml")

url_course_main='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='

url_course=url_course_main+soup.find_all('option')[1].get_text()

html_content_course=urllib.request.urlopen(url_course).read()

soup_course=BeautifulSoup(html_content_course,'lxml')


for j in soup_course.find_all('td'):

    print(j.get_text(strip=True))

印刷:


2019-2020 Yaz D?nemi AKM Kodlu Derslerin Ders Program? 


...


查看完整回答
反對 回復 2023-07-27
?
瀟湘沐

TA貢獻1816條經驗 獲得超6個贊

問題是在末尾get_text()給出空格并發送帶有此空格的 url - 服務器找不到帶有空格的文件。'AKM 'requests'AKM '


我用><字符串'>{}<'.format(param)來顯示這個空間 - >AKM <- 因為沒有><它似乎沒問題。


代碼需要get_text(strip=True)或get_text().strip()刪除這個空格。


import requests

from bs4 import BeautifulSoup


url = 'http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'

html_content = requests.get(url).text


soup = BeautifulSoup(html_content, 'lxml')


url_course_main = 'http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='


param = soup.find_all('option')[1].get_text() 

print('>{}<'.format(param))   # I use `> <` to show spaces


param = soup.find_all('option')[1].get_text(strip=True)

print('>{}<'.format(param))   # I use `> <` to show spaces


url_course = url_course_main + param


html_content_course = requests.get(url_course).text


soup_course = BeautifulSoup(html_content_course, 'lxml')

for j in soup_course.find_all('td'):

    print(j.get_text())


查看完整回答
反對 回復 2023-07-27
  • 2 回答
  • 0 關注
  • 154 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號