首頁猿問無法計算...

無法計算 beautifulsoup 字符串總和

Python

至尊寶的傳說 2023-07-27 16:27:45

你好，我想抓取一個網頁。我發布了我的代碼，但我的目標行很重要。它不起作用。我的意思是沒有錯誤，但也沒有輸出。我的代碼就在那里。我需要對字符串求和，這就出現了問題。import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'html_content = requests.get(url).textsoup = BeautifulSoup(html_content, "lxml")url_course_main='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='url_course=url_course_main+soup.find_all('option')[1].get_text() <---this linehtml_content_course=requests.get(a).textsoup_course=BeautifulSoup(html_content_course,'lxml')for j in soup_course.find_all('td'): print(j.get_text())當我改變我所展示的線路時url_course=url_course_main+'AKM'有效。也soup.find_all('option')[1].get_text()等于AKM。你能猜出錯誤在哪里嗎？

查看完整描述

2 回答

滄海一幻覺

TA貢獻1824條經驗獲得超5個贊

嘗試使用requestsPython 的標準urllib.request. requests模塊打開頁面時出現問題：

import urllib.request

from bs4 import BeautifulSoup

url='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'

html_content = urllib.request.urlopen(url).read()

soup = BeautifulSoup(html_content, "lxml")

url_course_main='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='

url_course=url_course_main+soup.find_all('option')[1].get_text()

html_content_course=urllib.request.urlopen(url_course).read()

soup_course=BeautifulSoup(html_content_course,'lxml')

for j in soup_course.find_all('td'):

print(j.get_text(strip=True))

印刷：

2019-2020 Yaz D?nemi AKM Kodlu Derslerin Ders Program?

...

反對回復 2023-07-27

瀟湘沐

TA貢獻1816條經驗獲得超6個贊

問題是在末尾get_text()給出空格并發送帶有此空格的 url - 服務器找不到帶有空格的文件。'AKM 'requests'AKM '

我用><字符串'>{}<'.format(param)來顯示這個空間 - >AKM <- 因為沒有><它似乎沒問題。

代碼需要get_text(strip=True)或get_text().strip()刪除這個空格。

import requests

from bs4 import BeautifulSoup

url = 'http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'

html_content = requests.get(url).text

soup = BeautifulSoup(html_content, 'lxml')

url_course_main = 'http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='

param = soup.find_all('option')[1].get_text()

print('>{}<'.format(param)) # I use `> <` to show spaces

param = soup.find_all('option')[1].get_text(strip=True)

print('>{}<'.format(param)) # I use `> <` to show spaces

url_course = url_course_main + param

html_content_course = requests.get(url_course).text

soup_course = BeautifulSoup(html_content_course, 'lxml')

for j in soup_course.find_all('td'):

print(j.get_text())

反對回復 2023-07-27

2 回答
0 關注
177 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

無法計算 beautifulsoup 字符串總和

無法計算 beautifulsoup 字符串總和

2 回答

添加回答