自學看書,總是遇到BeautifulSoup,但是書上也沒有說到底這個是啥意思,如圖:圖中為了標記方便,我把有疑問的代碼用紅線標注,分為A行和B行A行我可以理解為,用urlopen函數把http://www.pythonscraping.com...這一行地址的網頁打開,然后把里面所有的源代碼,作為一個整體,給html這個自定義的變量。那么我想問B這一行是啥意思?為什么每次遇到爬蟲,總會需要BeautifulSoup(html)這樣弄一下?這里的BeautifulSoup 具體執行什么任務?
1 回答

慕容3067478
TA貢獻1773條經驗 獲得超3個贊
hmtl 只是文本,BeautifulSoup 內部維護了一個樹形結構,方便你各種操作
因此第一步一般都是需要實例化一個 BeautifulSoup 可操作的對象
添加回答
舉報
0/150
提交
取消