亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在字符串搜索中處理 Unicode

在字符串搜索中處理 Unicode

Go
慕田峪7331174 2022-08-24 20:29:28
假設我有一個包含 Unicode 字符的字符串。例如:s := "foo 日本 foo!"我試圖找到字符串中最后一次出現:fooindex := strings.LastIndex(s, "foo")此處的預期結果為 7,但由于字符串中的 Unicode,這將返回 11 作為索引。有沒有辦法使用標準庫函數來處理這個問題?
查看完整描述

2 回答

?
守著一只汪

TA貢獻1872條經驗 獲得超4個贊

你遇到了符文在圍棋和字節中的差異。字符串由字節組成,而不是符文。如果您尚未了解這一點,則應閱讀 https://blog.golang.org/strings。


這是我的快速函數版本,用于計算字符串中子字符串的最后一個匹配之前的符文數?;痉椒ㄊ钦业阶止澦饕缓笱h訪問/計數字符串符文,直到該字節數被消耗。


我不知道有哪個標準庫方法可以直接執行此操作。


package main


import (

    "fmt"

    "strings"

)


func LastRuneIndex(s, substr string) (int, error) {

    byteIndex := strings.LastIndex(s, substr)

    if byteIndex < 0 {

        return byteIndex, nil

    }

    reader := strings.NewReader(s)

    count := 0

    for byteIndex > 0 {

        _, bytes, err := reader.ReadRune()

        if err != nil {

            return 0, err

        }

        byteIndex = byteIndex - bytes

        count += 1

    }

    return count, nil

}


func main() {

    s := "foo 日本 foo!"

    count, err := LastRuneIndex(s, "foo")

    fmt.Println(count, err)

    // outputs:

    // 7 <nil>

}


查看完整回答
反對 回復 2022-08-24
?
犯罪嫌疑人X

TA貢獻2080條經驗 獲得超4個贊

這變得非常接近:


package main


import (

   "golang.org/x/text/language"

   "golang.org/x/text/search"

)


func main() {

   m := search.New(language.English)

   start, end := m.IndexString("foo 日本 foo!", "foo")

   println(start == 0, end == 3)

}

但它正在向前搜索。我試過這個:


m.IndexString("foo 日本 foo!", "foo", search.Backwards)

但我得到這個結果:


panic: TODO: implement

https://pkg.go.dev/golang.org/x/text/search

https://github.com/golang/text/blob/v0.3.6/search/search.go#L222-L223


查看完整回答
反對 回復 2022-08-24
  • 2 回答
  • 0 關注
  • 103 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號