亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

執行正則表達式查找全部的更好方法

執行正則表達式查找全部的更好方法

偶然的你 2022-11-29 15:20:42
我正在嘗試使用正則表達式從字符串中提取一些文本。給定一個字符串,我希望提取“標簽”。標簽可以通過兩種方式定義:1) 一個@符號 eg后面的單個單詞@tag應該返回tag2)@"和"eg之間的多個單詞@"multiple words tag"應該返回multiple words tag。對于 (1),我有模式\B@\w+,對于 (2),我有模式@"(.*?)"。我有幾個問題: a) 模式 1 返回帶有still 前綴的標簽。@如何更改模式以僅返回不帶的單詞@?b) 如何將這些模式組合成一個可用于以下用途的模式:re.findall(pattern, string)先感謝您。
查看完整描述

2 回答

?
慕沐林林

TA貢獻2016條經驗 獲得超9個贊

條件正則表達式的一個很好的用例:

@(")?((?(1)[^"]+|\w+))

請參閱regex101.com 上的演示


import re


text = """

lorem ipsum @"multiple words tag"

lorem ipsum @tag 

"""


tags = [m.group(2) for m in re.finditer(r'@(")?((?(1)[^"]+|\w+))', text)]

print(tags)

# ['multiple words tag', 'tag']

為了替換匹配項并獲取標簽,請使用以下代碼:

import re


text = """

lorem ipsum @"multiple words tag"

lorem ipsum @tag 

"""

tags = []

def replacer(match):

    tags.append(match.group(2))

    return ""


text = re.sub(r'@(")?((?(1)[^"]+|\w+))(?(1)")', replacer, text)

print(text)

print(tags)


查看完整回答
反對 回復 2022-11-29
?
拉莫斯之舞

TA貢獻1820條經驗 獲得超10個贊

關于 a)/b):

我會為 python 3.7-3.8 建議以下正則表達式:

@(?:"((?:\w+\s{1}){0,}\w+)"){0,1}(?:(\w+){0,1})


查看完整回答
反對 回復 2022-11-29
  • 2 回答
  • 0 關注
  • 114 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號