亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

讀取響應體時獲取 unicode 字符作為字符串(Golang)

讀取響應體時獲取 unicode 字符作為字符串(Golang)

Go
白豬掌柜的 2023-02-21 16:44:27
我正在抓取一個用波蘭語編寫的網站,這意味著它包含 ? 和 ? 等字符。當我嘗試解析 html 時,無論是使用 html 包還是通過拆分響應主體的字符串,我都會得到如下輸出:???~??♀?????r????????q???y???<p??19??lF??→Z?7??我目前正在使用bodyBytes, err := ioutil.Readall(resp.body)if err != nil {  //handle} bodyString := string(bodyBytes)為了得到字符串如何獲得可讀格式的文本?
查看完整描述

2 回答

?
子衿沉夜

TA貢獻1828條經驗 獲得超3個贊

更新:


由于響應的內容編碼是 gzip,下面的代碼用于將響應作為可打印字符串獲取


gReader, err := gzip.NewReader(resp.Body)

if err != nil {

    return err

}

gBytes, err := ioutil.ReadAll(gReader)

if err != nil {

    return err

}

gReader.Close()

bodyStr := string(gBytes)


查看完整回答
反對 回復 2023-02-21
?
互換的青春

TA貢獻1797條經驗 獲得超6個贊

你在哪個網站上工作?當我在維基百科頁面上測試時,我得到了正確的字符


package main


import (

    "fmt"

    "io"

    "net/http"

)


func main() {

    resp, err := http.Get("https://en.wikipedia.org/wiki/Polish_alphabet")

    if err != nil {

        // handle error

    }

    defer resp.Body.Close()

    b, err := io.ReadAll(resp.Body)

    if err != nil {

        panic(err)

    }

    bodyStr := string(b)

    fmt.Println(bodyStr)

}


<td>?</td>

<td>?</td>

<td>?</td>


查看完整回答
反對 回復 2023-02-21
  • 2 回答
  • 0 關注
  • 225 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號