亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在 python 中包含轉義字符的字段上使用 BS4

在 python 中包含轉義字符的字段上使用 BS4

慕婉清6462132 2021-12-09 10:48:09
所以我抓取的內容在類名中有轉義字符。這是數據的樣子。<div class='\"content-review\"'> blah blah blah </div>我試過這樣做:mydivs = soup.findAll("div", {"class": repr('\"content-review\"')})它返回一個空數組。我認為這有一個簡單的解決方案,但我似乎無法弄清楚。
查看完整描述

3 回答

?
慕田峪7331174

TA貢獻1828條經驗 獲得超13個贊

轉義字符可能不是您的問題。我相信“class”是 Python 中的保留字,因此您不能將其用作關鍵字參數。Beautiful Soup通過使用關鍵字參數“class_”來處理這個問題。嘗試這樣的事情”:


mydivs = soup.findAll("div", class_="content-review")

如果這仍然不起作用,那么您可以告訴 Beautiful Soup 忽略轉義的引號,如下所示:


import re

mydivs = soup.findAll("div", class_=re.compile("content-review"))


查看完整回答
反對 回復 2021-12-09
?
胡子哥哥

TA貢獻1825條經驗 獲得超6個贊

我在查詢的課堂中出現轉義字符時遇到了類似的問題。我使用以下方法來查詢這些標簽:

soup.find_all(name='div', attrs={'class': 'content-review'})


查看完整回答
反對 回復 2021-12-09
?
慕森卡

TA貢獻1806條經驗 獲得超8個贊

我在現有的轉義字符旁邊添加了一個反斜杠,它對我有用。

soup.find_all("div", {"class": '\\"content-review\\"'})

我不太確定為什么,但是當我嘗試獲取“class”標簽的內容時,它返回的是什么。也許這意味著逃避轉義字符。


查看完整回答
反對 回復 2021-12-09
  • 3 回答
  • 0 關注
  • 263 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號