亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

為什么 len on x/net/html Token().Attr 在這里為空切片返回一個非零值?

為什么 len on x/net/html Token().Attr 在這里為空切片返回一個非零值?

Go
慕桂英546537 2023-01-03 15:59:27
我正在使用 Golang 中的內置html庫。下面是重現問題的代碼:package mainimport (    "fmt"    "log"    "net/http"    "golang.org/x/net/html")const url = "https://google.com"func main() {    resp, err := http.Get(url)    if err != nil {        log.Fatal(err)    }    defer resp.Body.Close()    if resp.StatusCode != 200 {        log.Fatalf("Status code error: %d %s", resp.StatusCode, resp.Status)    }    h := html.NewTokenizer(resp.Body)    for {        if h.Next() == html.ErrorToken {            break        }        l := len(h.Token().Attr)        if l != 0 {            fmt.Println("=======")            fmt.Println("Length", l) // greater than 0            fmt.Println("Attr", h.Token().Attr) // empty all the times        }    }}這是輸出的樣子=======Length 2Attr []typeof Attr []html.Attribute=======Length 8Attr []typeof Attr []html.Attribute=======Length 1Attr []typeof Attr []html.Attribute=======Length 1Attr []typeof Attr []html.Attribute去版本go version go1.17.7 linux/amd64為什么 Go 認為的長度h.Token().Attrh.Token().Attr當 the為空時這里的長度不為零?PS:保存輸出h.Token().Attr并將其用于len打印內容使一切正常
查看完整描述

3 回答

?
月關寶盒

TA貢獻1772條經驗 獲得超5個贊

Tokenizer 有一種有趣的界面,你不能Token()在兩次調用之間多次調用Next(). 正如文檔所說:

在 EBNF 表示法中,每個令牌的有效調用序列是:
Next {Raw} [ Token | Text | TagName {TagAttr} ]

也就是說:調用后Next()可能調用Raw()零次或多次;那么你可以

  • 調用Token()一次,

  • 調用Text()一次,

  • 調用TagName()一次,然后調用TagAttr()零次或多次(大概是根本不調用,因為您不關心屬性,或者調用的次數足以檢索所有屬性)。

  • 或者什么也不做(也許你正在跳過令牌)。

亂序調用的結果是不確定的,因為這些方法修改了內部狀態——它們不是純粹的訪問器。在您的第一個片段中,您在Token()兩次調用之間調用了多次Next(),因此結果無效。所有屬性都由第一次調用使用,而不會由后面的調用返回。


查看完整回答
反對 回復 2023-01-03
?
滄海一幻覺

TA貢獻1824條經驗 獲得超5個贊

(*Tokenizer).Token()每次都返回一個新的令牌,它再次有一個新的 []Attr,在這里.Token() ,下一次調用中的分詞器在第 1145 行的開始和結束是相同的數字,所以它不會進入這個循環,所以下次 attr 將為空。



查看完整回答
反對 回復 2023-01-03
?
智慧大石

TA貢獻1946條經驗 獲得超3個贊

不是空的,您只需要遍歷它并查看值。


package main


import (

    "fmt"

    "strings"


    "golang.org/x/net/html"

)


func main() {

    body := `

<html>

<body onload="fool()">

</body>

</html>

`

    h := html.NewTokenizer(strings.NewReader(body))


    for {

        if h.Next() == html.ErrorToken {

            break

        }


        attr := h.Token().Attr

        l := len(attr)


        if l != 0 {

            fmt.Println("=======")

            fmt.Println("Length", l) // greater than 0

            for i, a := range attr {

                fmt.Printf("Attr %d %v\n", i, a)

            }

        }

    }

}


游樂場:https ://go.dev/play/p/lzEdppsURl0


查看完整回答
反對 回復 2023-01-03
  • 3 回答
  • 0 關注
  • 126 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號