您好,我正在嘗試使用 str.extract() 提取子字符串,但它不想工作...我的正則表達式regex=r'(An+.+,$)'
dataset['Sprint']=dataset['URL'].str.extract(regex)我想用粗體提取的內容:[id=5548,rapidViewId=2968,state=ACTIVE,name= Anki Sprint 1.12 glu ,startDate=2020-03-09T09:21:24.412+01:00,endDate=2020-03-31T23:59:00.000+02: 00,完成日期=,序列=5548,目標=]
2 回答

幕布斯7119047
TA貢獻1794條經驗 獲得超8個贊
問題是你如何定義正則表達式,你的正則表達式意味著'提取匹配的字符串:一個字符“A”,具有1個或多個字符“n”,具有1個或多個任何字符(行終止符除外),一個字符"," 和一行的末尾'。如果您考慮一下,您無法在您的示例中匹配此描述,因為您在行尾沒有逗號。您可以使用這個有用的網站嘗試您的 regex 表達式,它很好地解釋了您的 regex 表達式。
解決問題,你可以做
regex=r'(An[a-zA-Z0-9\s]+.[a-zA-Z0-9\s]+),' dataset['Sprint']=dataset['URL'].str.extract(regex)
或任何其他正則表達式,具體取決于您希望正則表達式的靈活性。
添加回答
舉報
0/150
提交
取消