亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

【九月打卡】第53天 TypeScript(9)

標簽:
Typescript

TS编写爬虫工具

  1. 抓取html文本(通过superagent模块)
  2. 解析html节点内容并进行处理(通过cheerio模块,类似于jquery语法)
  3. 读取文件并写入处理后的内容到文件中
// 抓取html
import superagent from 'superagent';
// 获取节点元素
import * as cheerio from 'cheerio';

import fs from 'fs';
import path from 'path';

interface Course {
  title: string;
  count: number;
}

interface CourseInfo {
  time: number;
  data: Course[];
}

interface FileContent {
  [prop: number]: Course[];
}

class Crowller {
  private secret = 'x3b174jsx';

  private url = `http://www.dell-lee.com/typescript/demo.html?secret=${this.secret}`;
  private rawHtml = '';

  constructor() {}

  async getHtml() {
    const res = await superagent.get(this.url);
    return res.text;
  }

  async getCourseInfo(html: string) {
    const $ = cheerio.load(html);
    const $courseItems = $('.course-item');
    const courseInfos: Course[] = [];
    $courseItems.map((index, ele) => {
      const descs = $(ele).find('.course-desc');
      const title = descs.eq(0).text();
      const count = parseInt(descs.eq(1).text().split(':')[1]);
      courseInfos.push({ title, count });
    });

    return {
      time: new Date().getTime(),
      data: courseInfos,
    };
  }

  genJSON(courseInfo: CourseInfo) {
    const filePath = path.resolve(__dirname, '../dist/data.json');
    let fileContent: FileContent = {};
    if (fs.existsSync(filePath)) {
      try {
        fileContent = JSON.parse(fs.readFileSync(filePath, 'utf-8'));
      } catch (e) {
        console.log('无法解析');
      }
    }
    fileContent[courseInfo.time] = courseInfo.data;
    fs.writeFileSync(filePath, JSON.stringify(fileContent));
  }

  async init() {
    const html = await this.getHtml();
    const courseInfo = await this.getCourseInfo(html);
    this.genJSON(courseInfo);
  }
}

const crowller = new Crowller();
crowller.init();

點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
Web前端工程師
手記
粉絲
3
獲贊與收藏
9

關注作者,訂閱最新文章

閱讀免費教程

  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消