已解決430363個問題，去搜搜看，總會有你想問的

在 python 中包含轉義字符的字段上使用 BS4

首頁猿問在 python...

在 python 中包含轉義字符的字段上使用 BS4

Python

慕婉清6462132 2021-12-09 10:48:09

所以我抓取的內容在類名中有轉義字符。這是數據的樣子。<div class='\"content-review\"'> blah blah blah </div>我試過這樣做：mydivs = soup.findAll("div", {"class": repr('\"content-review\"')})它返回一個空數組。我認為這有一個簡單的解決方案，但我似乎無法弄清楚。

查看完整描述

3 回答

慕田峪7331174

TA貢獻1828條經驗獲得超13個贊

轉義字符可能不是您的問題。我相信“class”是 Python 中的保留字，因此您不能將其用作關鍵字參數。Beautiful Soup通過使用關鍵字參數“class_”來處理這個問題。嘗試這樣的事情”：

mydivs = soup.findAll("div", class_="content-review")

如果這仍然不起作用，那么您可以告訴 Beautiful Soup 忽略轉義的引號，如下所示：

import re

mydivs = soup.findAll("div", class_=re.compile("content-review"))

反對回復 2021-12-09

胡子哥哥

TA貢獻1825條經驗獲得超6個贊

我在查詢的課堂中出現轉義字符時遇到了類似的問題。我使用以下方法來查詢這些標簽：

soup.find_all(name='div', attrs={'class': 'content-review'})

反對回復 2021-12-09

慕森卡

TA貢獻1806條經驗獲得超8個贊

我在現有的轉義字符旁邊添加了一個反斜杠，它對我有用。

soup.find_all("div", {"class": '\\"content-review\\"'})

我不太確定為什么，但是當我嘗試獲取“class”標簽的內容時，它返回的是什么。也許這意味著逃避轉義字符。

反對回復 2021-12-09

3 回答
0 關注
263 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

在 python 中包含轉義字符的字段上使用 BS4

在 python 中包含轉義字符的字段上使用 BS4

3 回答

添加回答