import ( "fmt" "gopkg.in/xmlpath.v2" "log")...path := xmlpath.MustCompile("//div[@id='23']")tree, err := xmlpath.ParseHTML(reader)if err != nil { log.Fatal("HTML parsing error, maybe not wellformed", err)}iter := path.Iter(tree)for iter.Next() { fmt.Println(iter.Node().String()) // returns only the values of the text-node}...有沒有辦法轉換iter.Node()回 html 標記之類的<div>...</div>?iter.Node().String()僅返回所有內部文本節點的值。據我所知,xmlpath-package的文檔沒有提供這樣的功能。
2 回答

largeQ
TA貢獻2039條經驗 獲得超8個贊
你是對的 -gopkg.in/xmlpath.v2
功能僅限于讀取節點的內容。在 Go 中使用 DOM 的替代方案并不多。
在本機 Go 庫中,我只能提到goquery。它僅適用于 HTML,不支持 XPath 但支持 CSS 選擇器。也許這對你來說就足夠了。
如果您真的需要通過 XPath 處理 HTML 和 XML,那么 Go 的 libxml 包裝器稱為gokogiri。它支持 libxml 的所有功能,因此您可以獲取節點、內部/外部 HTML、屬性和其他內容。我用它來提取當前處于生產狀態的一項服務中的文本內容。它比 PHP 的 DOMDocument 快一點。只有一個限制是我不確定它是否支持高于 1.4.* 的 Go 版本。哦,在 Windows 上安裝有點棘手。
- 2 回答
- 0 關注
- 273 瀏覽
添加回答
舉報
0/150
提交
取消