亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

獲取網站 HTML,然后查找和復制列和行:PHP

獲取網站 HTML,然后查找和復制列和行:PHP

PHP
慕尼黑8549860 2022-09-17 21:35:28
我正在使用file_get_contents獲取網站的整個HTML代碼,并將其保存到變量中。本網站的內容基于時間,并經常更新。我需要運行一個腳本,該腳本將從其HTML中獲取特定的列和行,然后我計劃將其轉換為人類可讀的文本形式。我現在的問題是,我對應該使用什么方法來掃描HTML,找到我想要提取的列和行,并且只有在自上次運行腳本以來對其進行了更新時才保存它。
查看完整描述

1 回答

?
12345678_0001

TA貢獻1802條經驗 獲得超5個贊

如果您熟悉 DOM 遍歷,請嘗試使用 DOM文檔::加載HTML。然后使用其他 DOM 文檔方法來獲取所需的信息。

下面是一些示例:

<!DOCTYPE html>

<!-- test.html -->

<html><body>

    <table id = "target_table"><tbody>

        <tr><td>this</td><td>something</td></tr>

        <tr><td>is</td><td>in</td></tr>

        <tr><td>a</td><td>a</td></tr>

        <tr><td>test</td><td>column</td></tr>

    </tbody></table>

    <table><tbody>

        <tr><td>ignore</td><td>this</td></tr>

        <tr><td>table</td><td>.</td></tr>

    </tbody></table>

</body></html>

這將抓取特定表中的所有行并轉儲其文本內容:


<?php


$string = file_get_contents("test.html");

$doc = DOMDocument::loadHTML($string);

$xpath = new DOMXpath($doc);

$elements = $xpath->query("//*[@id=\"target_table\"]/*/tr");


foreach ($elements as $element) {

  echo $element->textContent, PHP_EOL;

}


查看完整回答
反對 回復 2022-09-17
  • 1 回答
  • 0 關注
  • 118 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號