亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Go GCP Cloud PubSub 不批量發布消息

Go GCP Cloud PubSub 不批量發布消息

Go
慕娘9325324 2023-06-05 18:16:10
我發現它html.NewTokenizer()不會自動修復某些問題。因此,您可能會得到一個雜亂的結束標記 ( html.EndTagToken)。<div></p></div>也會這樣html.StartTagToken, html.EndTagToken, html.EndTagToken。是否有推薦的解決方案來處理忽略/刪除/修復這些標簽?我的第一個猜測是[]atom.Atom在開始/結束每個標簽時手動保留一個切片并推送/彈出到列表(在比較標簽以確保您沒有得到意外的結束標簽之后)。下面是一些代碼來演示這個問題:var err errorhtm := `<div><div><p></p></p></div>`tokenizer := html.NewTokenizer(strings.NewReader(htm))for {    if tokenizer.Next() == html.ErrorToken {        err = tokenizer.Err()        if err == io.EOF {            err = nil        }        return    }    token := tokenizer.Token()    switch token.Type {    case html.DoctypeToken:        continue    case html.CommentToken:        continue    case html.SelfClosingTagToken:        fmt.Println(token.Data)        continue    case html.StartTagToken:        fmt.Printf("<%s>\n", token.Data)    case html.EndTagToken:        fmt.Printf("</%s>\n", token.Data)    case html.TextToken:        continue    default:        continue    }}輸出:<div><div><p></p></p></div>
查看完整描述

1 回答

?
撒科打諢

TA貢獻1934條經驗 獲得超2個贊

net/htmlFWIW,當你使用它的方法時,似乎可以解決這些問題Parse。

package main


import (

? ? "bytes"

? ? "fmt"

? ? "log"

? ? "strings"


? ? "golang.org/x/net/html"

)


func main() {

? ? brokenHtml := `<div><div><p></p></p></div>`


? ? reader := strings.NewReader(brokenHtml)

? ? root, err := html.Parse(reader)


? ? if err != nil {

? ? ? ? log.Fatal(err)

? ? }


? ? var b bytes.Buffer

? ? html.Render(&b, root)

? ? fixedHtml := b.String()


? ? fmt.Println(fixedHtml)

}


查看完整回答
反對 回復 2023-06-05
  • 1 回答
  • 0 關注
  • 153 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號