亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

進擊Node.js基礎(一)_5-10 HTTP 小爬蟲 代碼優化

標簽:
Node.js

首先本人菜鸟一个,这个demo也很简单,但在实现它的时候走了很多弯路,希望把这个过程记录下来分享给刚入门的朋友们;

这个题目就是慕课网上进击Node.js基础(一)_5-10 HTTP 小爬虫

优化后的代码是这样的(scott老师的源码 请参考视频):

var http = require('http')
var cheerio = require('cheerio')
var url = 'http://www.xianlaiwan.cn/learn/348'

function fliter(html){
    var $ = cheerio.load(html)
    var chapters = $('.chapter')

    for (var i = 0; i < chapters.length; i++) {
        var mainTitle = $(chapters[i]).find('strong').text()
        var content = $(chapters[i]).find('a')
        var href_attr = content.attr('href')
        console.log(mainTitle+'\n')
        for (var j = 0; j < content.length; j++) {
            console.log('  【'+$(content[j]).attr('href').substr(7)+'】'+$(content[j]).text())
        }
    }
}

http.get(url,function(res){
    var html = '' 
    res.on('data',function(data){
        html +=data
    })
    res.on('end',function(){
        fliter(html)
    })
}).on('error',function(){
    console.log('错误!!!')
})

在Nodejs中的运行效果:

图片描述

點擊查看更多內容
2人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消