1 回答

TA貢獻1815條經驗 獲得超13個贊
在 Go 中,一個字符串實際上只是一個字節序列,索引一個字符串會產生 bytes。所以你可以簡單地將你的字符串分割成 4kB 的子字符串。
但是,由于 UTF-8 字符可以跨越多個字節,因此您可能會在字符序列的中間拆分。如果分割后的字符串總是在解碼之前在另一端以相同的順序再次連接在一起,這不是問題,但是如果您嘗試單獨解碼每個字符串,則可能會得到無效的前導或尾隨字節序列。如果你想防止這種情況發生,你可以使用這個unicode/utf8
包來檢查你是否在一個有效的前導字節上進行拆分,如下所示:
package httputil
import "unicode/utf8"
const maxLen = 4096
func SplitHeader(longString string) []string {
? ? splits := []string{}
? ? var l, r int
? ? for l, r = 0, maxLen; r < len(longString); l, r = r, r+maxLen {
? ? ? ? for !utf8.RuneStart(longString[r]) {
? ? ? ? ? ? r--
? ? ? ? }
? ? ? ? splits = append(splits, longString[l:r])
? ? }
? ? splits = append(splits, longString[l:])
? ? return splits
}
直接切片字符串比[]byte來回轉換更有效,因為 astring是不可變的而 a[]byte不是,數據必須在轉換時復制到新內存,花費 O(n) 時間(雙向?。?,而切片 a string 只是返回一個新的字符串頭,由與原始數組相同的數組支持(花費常數時間)。
- 1 回答
- 0 關注
- 324 瀏覽
添加回答
舉報