首頁手記 PHP正則處理遇到的幾個問題

PHP正則處理遇到的幾個問題

標簽：

PHP

首先给出几个问题。

将html代码中的js内容过滤掉。
将html代码中table标签中间的内容（<table>内容</table>）前后加上特殊字符#。
取出img标签alt属性的值。

html代码如下：

<html><head>
       <title>test</title></head><body>
       <script type="text/javascript">
              data = 'test data';       </script>
       <p><img class="lazyload" src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAAJcEhZcwAADsQAAA7EAZUrDhsAAAANSURBVBhXYzh8+PB/AAffA0nNPuCLAAAAAElFTkSuQmCC" data-original="http://test.com/1.jpg" alt="this's a description."></p>
       <table>....</table>
       <p><img src='http://test.com/2.jpg' alt='other'></p>
       <script>
              console.log('statics');       </script></body></html>

第一个问题，很容易写出下面代码:

$html = preg_replace('~<script.*>.+</script>~U', '', $html);

但执行的时候发现并没有过滤掉js代码。

原因是点号（.）元字符匹配除换行符以外的任意字符。js代码是多行的，所以用点号无法匹配，这个坑很浅，我却掉进去了。

解决方法：使用模式修饰符s，此修饰符可以让点号匹配换行符。

$html = preg_replace('~<script.*>.+</script>~Us', '', $html);

执行结果：

第二问题，可以使用php的preg_replace_callback函数。

$html = preg_replace_callback(    '~<table>(.+)</table>~Us',    function ($matches) {        return '#' . $matches[1] . '#';
    },
   $html);

第三个问题：

preg_match_all('~<img.*alt=[\'"](.+)[\'"]~U', $html, $matches);

执行结果：

发现第一个匹配出错。由于alt属性值可能由双引号或单引号包括的，所以在正则中使用[\’”]，但如果alt属性值中有单引号或双引号就会匹配不全，此时可以使用反向引用来解决，好吧，我竟然忘了反向引用。

preg_match_all('~<img.*alt=（[\'"]）(.+)\1~U', $html, $matches);

作者：zhou
链接：https://www.jianshu.com/p/79cba48bc3ef

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

RISEBY

手記
篇

粉絲

71

獲贊與收藏

318

關注作者，訂閱最新文章

閱讀免費教程

ThinkPHP 入門教程

28個小節 12718 127

后端通用面試教程

41個小節 32074 358

網絡編程入門教程

20個小節 13213 249

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

PHP正則處理遇到的幾個問題

閱讀免費教程