如何在抓取時避免連接節點中的所有文本當我從HTML或XML中抓取幾個相關節點以提取文本時,所有文本都被連接到一個長字符串中,因此無法恢復單個文本字符串。例如:require 'nokogiri'doc = Nokogiri::HTML(<<EOT)<html>
<body>
<p>foo</p>
<p>bar</p>
<p>baz</p>
</body></html>EOT
doc.search('p').text # => "foobarbaz"但我想要的是:["foo", "bar", "baz"]在刮取XML時也會發生相同的情況:doc = Nokogiri::XML(<<EOT)<root>
<block>
<entries>foo</entries>
<entries>bar</entries>
<entries>baz</entries>
</block></root>EOT
doc.search('entries').text # => "foobarbaz"為什么會發生這種情況,我該如何避免呢?
- 1 回答
- 0 關注
- 504 瀏覽
相關問題推薦
添加回答
舉報
0/150
提交
取消