我有一個關于 golang 正則表達式的棘手問題。\b當我像這樣放置延遲字符時,邊界選項似乎不起作用。我希望它é應該被視為常規字符......但它被視為邊界病房之一。package mainimport ( "fmt" "regexp")func main() { r, _ := regexp.Compile(`\b(vis)\b`) fmt.Println(r.MatchString("re vis e")) fmt.Println(r.MatchString("revise")) fmt.Println(r.MatchString("révisé"))}結果是:true false true請給我任何建議,如何處理r.MatchString("révisé")作為false?謝謝
1 回答

慕森王
TA貢獻1777條經驗 獲得超3個贊
問題是這\b僅適用于 ASCII 字符周圍的邊界,如文檔中所述:
在 ASCII 字邊界處(一側為 \w,另一側為 \W、\A 或 \z)
并且é不是 ASCII。但是,您可以\b通過組合其他正則表達式快捷方式來進行自己的替換。這是一個簡單的解決方案,可以解決問題中給出的情況,但您可能希望添加更徹底的匹配:
package main
import (
"fmt"
"regexp"
)
func main() {
r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
fmt.Println(r.MatchString("vis")) // added this case
fmt.Println(r.MatchString("re vis e"))
fmt.Println(r.MatchString("revise"))
fmt.Println(r.MatchString("révisé"))
}
運行這個給出:
true
true
false
false
此解決方案所做的基本上是替換\b為(?:\A|\z|\s),這意味著“具有以下其中一項的非捕獲組:字符串開頭、字符串結尾或空格”。您可能想在此處添加其他可能性,例如標點符號。
- 1 回答
- 0 關注
- 171 瀏覽
添加回答
舉報
0/150
提交
取消