亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Go 的 LeftStr、RightStr、SubStr

Go 的 LeftStr、RightStr、SubStr

Go
幕布斯6054654 2021-09-27 16:09:44
我相信Go中沒有LeftStr(str,n)(最多取n個第一個字符),RightStr(str,n)(最多取n個最后一個字符)和SubStr(str,pos,n)(取pos后的第一個n個字符)函數,所以我嘗試制作一個// take at most n first charactersfunc Left(str string, num int) string {    if num <= 0 {        return ``    }    if num > len(str) {        num = len(str)    }    return str[:num]}// take at most last n charactersfunc Right(str string, num int) string {    if num <= 0 {        return ``    }    max := len(str)    if num > max {        num = max    }    num = max - num    return str[num:]}但我相信當字符串包含 unicode 字符時,這些函數會給出錯誤的輸出。這些功能最快的解決方案是什么,使用for range循環是唯一的方法嗎?
查看完整描述

1 回答

?
慕姐4208626

TA貢獻1852條經驗 獲得超7個贊

正如評論中已經提到的, 組合字符、修改符文和其他多符文 “字符” 可能會造成困難。

任何對 Go 中的 Unicode 處理感興趣的人都應該閱讀 Go 博客文章“ Go 中的 字符串、字節、符文和字符” 和“Go 中的文本規范化”。特別是,后者討論了golang.org/x/text/unicode/norm可以幫助處理其中一些問題的包。

您可以考慮從字符串中吐出第一個(或最后一個)“n 個字符”的幾個級別越來越準確(或越來越多的 Unicode 感知)。

  1. 只需使用 n 個字節。這可能會在符文的中間分裂,但它是 O(1),非常簡單,并且在許多情況下,您知道輸入僅由單字節符文組成。例如 str[:n]。

  2. 在 n 個符文后分裂。這可能會在字符的中間分裂。這可以輕松完成,但代價是僅使用string([]rune(str)[:n]). 您可以通過使用unicode/utf8包的DecodeRuneInString(and DecodeLastRuneInString) 函數依次獲取前 n 個符文中的每個符文的長度,然后返回str[:sum](O(n),無分配)來避免轉換和復制。

  3. 在第 n 個“邊界”之后拆分。一種方法是norm.NFC.FirstBoundaryInString(str)重復使用 或norm.Iter找到要拆分的字節位置,然后返回str[:pos]。

考慮顯示的字符串“cafés”,它可以在 Go 代碼中表示為:“cafés”、“caf\u00E9s”或“caf\xc3\xa9s”,它們都產生相同的六個字節?;蛘撸梢员硎緸椤癱afe\u0301s”或“cafe\xcc\x81s”,它們都產生相同的七個字節。

上面的第一個“方法”可能會將它們拆分為“caf\xc3”+“\xa9s”和cafe\xcc“+”\x81s”。

第二個可能將它們拆分為“caf\u00E9”+“s”(“cafe”+“s”)和“cafe”+“\u0301s”(“cafe”+“?s”)。

第三個應該將它們分成“caf\u00E9”+“s”和“cafe\u0301”+“s”(都顯示為“café”+“s”)。


查看完整回答
反對 回復 2021-09-27
  • 1 回答
  • 0 關注
  • 211 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號