亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何將兩個代碼點組合成一個?

如何將兩個代碼點組合成一個?

Go
不負相思意 2023-03-15 15:40:26
我知道 unicode 代碼點á是U+00C1. 我在互聯網和許多論壇和文章上閱讀,我也可以á通過組合字符′(unicode:)U+00B4和A(unicode:)來制作它們U+0041。我的問題很簡單。怎么做?我試過這樣的事情。我決定在 golang 中嘗試一下,但如果有人知道如何在 python(或其他一些編程語言)中進行操作,那就太好了。對我來說沒關系。好的,所以我接下來嘗試了。A二進制是:01000001′二進制是:10110100它總共需要 15 位,所以我需要 UTF-8 3 字節格式 ( 1110xxxx  10xxxxxx  10xxxxxx)通過在 x 的位置填充來自A和(第一個 A)的位,獲得以下內容: ?!?1100100  10000110  10110100然后我將生成的三個字節轉換回十六進制值:E4 86 B4。然而,當我嘗試用代碼編寫它時,我得到了一個完全不同的字符。換句話說,我的解決方案沒有按預期工作。package mainimport (    "fmt")func main() {    r := "\xE4\x86\xB4"    fmt.Println(r) // It wrote ? instead of á}
查看完整描述

2 回答

?
小怪獸愛吃肉

TA貢獻1852條經驗 獲得超1個贊

看起來您提供的 (U+00B4) 字符實際上并不是Unicode 定義的組合字符。

>>>?"A\u00b4"
'A′'

如果我們改用??(U+0301),那么我們只需將它與一個字符按順序放置A,就可以得到預期的輸出:

>>>?"A\u0301"
'A?'

除非我誤解了你的意思,否則這里看起來不需要任何二進制操作或欺騙。


查看完整回答
反對 回復 2023-03-15
?
慕勒3428872

TA貢獻1848條經驗 獲得超6個贊

正如 StardustGogeta 在他們的回答中解釋的那樣,“尖音”口音的正確組合 unicode 字符是 U+0301(組合尖音)。

但是在 Go 中,由單個 U+00C1(帶尖音符的拉丁文大寫字母 A)字符組成的字符串不等于由 U+0041(拉丁文大寫字母 A)后跟 U+0301(組合尖音符)組成的字符串)

如果要比較字符串,則需要將兩者都規范化為相同的規范化形式。

以下代碼片段展示了如何做到這一點:

package main


import (

? ? "fmt"


? ? "golang.org/x/text/unicode/norm"

)


func main() {

? ? combined := "\u00c1"

? ? combining := "A\u0301"

? ? fmt.Printf("combined = %s, combining = %s\n", combined, combining)

? ? fmt.Printf("combined == combining: %t\n", combined == combining)

? ? combiningNormalised := string(norm.NFC.Bytes([]byte(combining)))

? ? fmt.Printf("combined == combiningNormalised: %t\n", combined == combiningNormalised)

}

輸出:


combined = á, combining = A?

combined == combining: false

combined == combiningNormalised: true


查看完整回答
反對 回復 2023-03-15
  • 2 回答
  • 0 關注
  • 159 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號