亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

正則表達式以點|分號空間分割但忽略 url 例如

正則表達式以點|分號空間分割但忽略 url 例如

Go
元芳怎么了 2023-06-12 16:54:41
我正在嘗試解析和匹配大量法律文本,將其全部拆分成單獨的句子。我有以下正則表達式,它只適用于幾行簡單的文本:[^\.\!\?\;\n]*[\.\!\?\;\n](\s+)!和 ?或在這里非常無關緊要但是。和 ;?因為分隔符在我嘗試處理的文本中很常見。問題是上面的正則表達式只是找到那些后跟空格字符的定界符。例如,以下文本將無法正確匹配:成員國法律或根據與衛生專業人員簽訂的合同并遵守第 3 段中提到的條件和保障措施;出于公共衛生領域的公共利益考慮,處理是必要的,例如防止嚴重的跨境健康威脅或確保高標準比較工具 https://ec.europa.eu/ploteus/en/compare 已?采用7可比較的程序(例如認證/審計),并按照成員國的要求進行注冊。基于歐盟或成員國法律的醫療保健和醫藥產品或醫療器械的質量和安全,該法律規定了適當和具體的措施來保護數據主體的權利和自由,特別是職業保密;處理是...以下整個部分:出于公共衛生領域的公共利益考慮,處理是必要的,例如防止嚴重的跨境健康威脅或確保根本不會匹配。任何有助于改進上述正則表達式的幫助將不勝感激!
查看完整描述

1 回答

?
偶然的你

TA貢獻1841條經驗 獲得超3個贊

我想你想要的名字是一個句子分詞器。對于 Go,我可以推薦一個庫:github.com/jdkato/prose,它應該很有魅力。

就個人而言,我從未使用過。祝你好運!


查看完整回答
反對 回復 2023-06-12
  • 1 回答
  • 0 關注
  • 163 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號