亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

nodejs爬蟲獲取漫威超級英雄電影海報

昨天去看了《复联3》的首映,当我提前15分钟进入影院的时候, 看到了粉丝们取票的长队, 顿时有一种跨年夜的感觉...
最近看了node爬虫的一些知识, 这里用node爬取一下漫威官网的电影海报!

https://img1.sycdn.imooc.com//5d5e01f70001440c07360497.png

marvel

// https://marvel.com/movies/allconst request = require('superagent')const cheerio = require('cheerio')const fs = require('fs-extra')const path = require('path')let url = 'https://marvel.com/movies/all'// 获取图片url和图片名字async function getUrlAndName(){    // 用于存储返回值
    let imgAddrArray = []    // 请求资源
    const res = await request.get(url)    // 将获取的html, 转换为资源符$, 相当于python中的xpath语法的etree过程
    const $ = cheerio.load(res.text)    // 定位资源位置, 将图片资源,和图片名字, 以数组方式, 返回给调用函数
    $('.row-item-image a').each(function(i, elem){        let movieName = $(this).attr('href').split('/').pop()        let imgAddr = $(this).find('img').attr('src')
        imgAddrArray.push([imgAddr, movieName])
    })    return imgAddrArray
}// 下载图片async function download(imgAndName){    // 拼接出, 当前资源的文件名
    let filename = imgAndName[1] + '.jpg'
    console.log("爬取海报:", filename);    // 获取图片二进制数据
    const req = request.get(imgAndName[0]);    // 保存图片
    await req.pipe(fs.createWriteStream(path.join(__dirname, 'images', filename))); 
}// 创建文件夹, 控制整体流程async function init(){    let imgAddrArray = await getUrlAndName()    // 创建文件夹
    try{        await fs.mkdir(path.join(__dirname, 'images'));
    }    catch(err){        console.log("==>", err);
    }    // 获取资源
    for (let imgAddr of imgAddrArray){        await download(imgAddr);
    }
}

init()

https://img1.sycdn.imooc.com//5d5e01fa0001016e07300562.png

运行结果

小结:

直观感受, node爬虫并没有python好用, 而且由于浏览器的同源限制, 在浏览器端跑node爬虫也会有些麻烦;node爬虫的优势:理论上讲,node默认的异步玩法, 能达到python的多线程爬虫的效果.
写爬虫, 还是老老实实用python吧!



作者:木子昭
链接:https://www.jianshu.com/p/368f982423f2

點擊查看更多內容
1人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消