亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用 puppeteer 在 <div> 列表中抓取

如何使用 puppeteer 在 <div> 列表中抓取

呼喚遠方 2021-06-15 10:13:04
我正在尋找一種方法來使用puppeteer有效地抓取以下列方式格式化的信息。 假設我有一個網站上的內容列表,如下所示:<div id="list">  <div class="item" pos="0">   <a href="www.somewebsite.com">    <div class="nameToRetrieve"> Name 1 </div>  </div>  <div class="item" pos="1">   <a href="www.somewebsite.com">    <div class="nameToRetrieve"> Name 2 </div>  </div>  <div class="item" pos="2">   <a href="www.somewebsite.com">    <div class="nameToRetrieve"> Name 3 </div>  </div></div>如何檢索姓名的信息(姓名 1、姓名 2 和姓名 3?我曾嘗試將它們放入一個對象中,然后再放入一個數組中,但我仍然對如何處理它感到困惑。const listOfStuff = document.getElementById('list').getElementsByClassName('itemResult')
查看完整描述

2 回答

?
aluckdog

TA貢獻1847條經驗 獲得超7個贊

puppeteer 中有一個特別方便的方法page.$$eval來處理這個任務:

let result = await page.$$eval('.nameToRetrieve', names => names.map(name => name.textContent));
console.log(result);

此方法在頁面內運行 Array.from(document.querySelectorAll(selector)) 并將其作為第一個參數傳遞給 pageFunction。

結果將是:

[ ' Name 1 ', ' Name 2 ', ' Name 3 ' ]


查看完整回答
反對 回復 2021-06-18
  • 2 回答
  • 0 關注
  • 278 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號