首頁手記用Html Agility Pack 解析HTML

用Html Agility Pack 解析HTML

標簽：

Html/CSS

摘要

在开发过程中，很有可能会遇到这样的情况，服务端返回的是html的内容，但需要在客户端显示纯文本内容，这时候就需要解析这些html，拿到里面的纯文本。达到这样的目的可以有很多途径，比如自己写正则表达式，但对于没有什么规则的内容，就有点力不从心了。Html Agility Pack开源组件，可以通过xPath的方式快速的解析html内容。

一个例子

你可以通过Nuget进行安装。

比如我们这里解析博客园首页文章列表，查看博客园首页列表html，如图所示：

抓取所有文章的名称

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;
namespace HtmlAgilityPackDemo
{    class Program
    {        static void Main(string[] args)
        {            //初始化网络请求客户端
            HtmlWeb webClient = new HtmlWeb();            //初始化文档
            HtmlDocument doc = webClient.Load("http://www.cnblogs.com/");            //查找节点
            HtmlNodeCollection titleNodes = doc.DocumentNode.SelectNodes("http://a[@class='titlelnk']");            
            if (titleNodes != null)
            {                foreach (var item in titleNodes)
                {
                    Console.WriteLine(item.InnerText);
                }
            }
            Console.Read();

        }
    }
}

输出

记得之前自己写过一个小工具，当时还是自己写的正则来匹配的，和这个组件相比确实很麻烦。

在上面的代码中，有[@class='xxx']的设置，它是根据html标签的属性查找node，当然你也可以进行其它的设置，如根据id查找，你可以这样写h3[@id='xxxx']。

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

holdtom

手記
篇

粉絲

241

獲贊與收藏

993

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節 32258 360

網絡編程入門教程

20個小節 13300 250

Pandas 入門教程

25個小節 19925 373

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

用Html Agility Pack 解析HTML

摘要

一个例子

閱讀免費教程