亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Golang正則表達式邊界與拉丁字符

Golang正則表達式邊界與拉丁字符

Go
一只斗牛犬 2021-12-07 18:33:26
我有一個關于 golang 正則表達式的棘手問題。\b當我像這樣放置延遲字符時,邊界選項似乎不起作用。我希望它é應該被視為常規字符......但它被視為邊界病房之一。package mainimport (    "fmt"    "regexp")func main() {       r, _ := regexp.Compile(`\b(vis)\b`)    fmt.Println(r.MatchString("re vis e"))    fmt.Println(r.MatchString("revise"))    fmt.Println(r.MatchString("révisé"))}結果是:true false true請給我任何建議,如何處理r.MatchString("révisé")作為false?謝謝
查看完整描述

1 回答

?
慕森王

TA貢獻1777條經驗 獲得超3個贊

問題是這\b僅適用于 ASCII 字符周圍的邊界,如文檔中所述:


在 ASCII 字邊界處(一側為 \w,另一側為 \W、\A 或 \z)


并且é不是 ASCII。但是,您可以\b通過組合其他正則表達式快捷方式來進行自己的替換。這是一個簡單的解決方案,可以解決問題中給出的情況,但您可能希望添加更徹底的匹配:


package main


import (

    "fmt"

    "regexp"

)


func main() {   

    r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)

    fmt.Println(r.MatchString("vis")) // added this case

    fmt.Println(r.MatchString("re vis e"))

    fmt.Println(r.MatchString("revise"))

    fmt.Println(r.MatchString("révisé"))

}

運行這個給出:


true

true

false

false

此解決方案所做的基本上是替換\b為(?:\A|\z|\s),這意味著“具有以下其中一項的非捕獲組:字符串開頭、字符串結尾或空格”。您可能想在此處添加其他可能性,例如標點符號。


查看完整回答
反對 回復 2021-12-07
  • 1 回答
  • 0 關注
  • 171 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號