亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

python遇見數據采集

難度初級
時長 2小時 5分
學習人數
綜合評分9.63
95人評價 查看評價
9.7 內容實用
9.5 簡潔易懂
9.7 邏輯清晰
為億萬富翁點贊,為作者點贊。
Beautiful Soup 4.2.0 文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html
pdf 的那塊講解要更新一下了,現在2020年無法按照視頻中的安裝,使用。
有一點不太嚴謹,p['paser']不是數組、列表、元祖,是字典的獲取語法
for t in soup.find_all('a'): # for循環遍歷所有a標簽,并把返回列表中的內容賦給t
print('t的值是:', t) # link得到的是標簽對象
print('t的類型是:', type(t))
print('a標簽中的href屬性是:', t.get('href')) # 獲取a標簽中的url鏈接
之前講過的這個方式
html = urlopen("https://en.wikipedia.org/robots.txt").read().decode("utf-8")
print(html)

爬出來的結果,似乎還更有秩序一些?
精通課程就可以打造google這樣的公司,發家致富哈哈哈哈哈啊哈
pip install pdfminer3k
視頻是2016年的啊,兩年半了都!(⊙﹏⊙)b
最后結尾我笑了
就聽見下一個億萬富翁
我測試使用story = soup.find( {'class':'story'}) 返回None,使用
story = soup.find( class_='story') 可以正常返回結果
用的是python 3.7
我根據老師的代碼,返回的結果是json字符串,不是HTML,不過json更好了,都是干凈的數據
如果安裝完畢后還是找不到bs4 直接在 PyCharm 的terminal命令行里面輸入 pip install bs4 完美解決
在navicat設計表的時候需要把ID設置為自動遞增,不然導入不會成功的
首頁上一頁1234567下一頁尾頁
課程須知
熟悉Python語言的語法,掌握Python的正則表達式模塊,懂得如何使用Python操作數據庫
老師告訴你能學到什么?
使用Python內置urllib模塊和第三方BeautifulSoup模塊進行數據采集和提取、MySQL數據庫的操作、TXT和PDF文檔的讀取,以及robots協議和相關注意事項

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!

本次提問將花費2個積分

你的積分不足,無法發表

為什么扣積分?

本次提問將花費2個積分

繼續發表請點擊 "確定"

為什么扣積分?

舉報

0/150
提交
取消