首頁猿問是否值得使用Python的re.編譯？

是否值得使用Python的re.編譯？

Python 正則表達式

茅侃侃 2019-07-12 16:49:27

是否值得使用Python的re.編譯？在Python中使用用于正則表達式的編譯有什么好處嗎？h = re.compile('hello')h.match('hello world')VSre.match('hello', 'hello world')

查看完整描述

3 回答

HUX布斯

TA貢獻1876條經驗獲得超6個贊

對我來說，最大的好處是re.compile能夠將正則表達式的定義與它的使用分開。

甚至一個簡單的表達式，比如0|[1-9][0-9]*(基數10中沒有前導零的整數)可能足夠復雜，因此您寧愿不必重新鍵入它，檢查是否輸入了任何類型，然后在開始調試時必須重新檢查是否有排字。另外，使用變量名(如num或num_b10)比使用變量名要好得多0|[1-9][0-9]*.

當然可以存儲字符串并將它們傳遞給re.Match；但是，這是較少可讀性：

num = "..."# then, much later:m = re.match(num, input)

相對于匯編：

num = re.compile("...")# then, much later:m = num.match(input)

雖然它是相當接近，第二行感覺更自然和簡單的重復使用。

反對回復 2019-07-12

守著一只汪

TA貢獻1872條經驗獲得超4個贊

FWIW：

$ python -m timeit -s "import re" "re.match('hello', 'hello world')"100000 loops, best of 3: 3.82 usec per loop

$ python -m timeit -s "import re; h=re.compile('hello')" "h.match('hello world')"1000000 loops, best of 3: 1.26 usec per loop

所以，如果要使用同很多事，也許值得去做re.compile(特別是對于更復雜的正則表達式)。

反對過早優化的標準論點是適用的，但我認為您不會因為使用re.compile如果您懷疑您的regexp可能成為性能瓶頸。

最新情況：

在Python3.6(我懷疑上面的時間是使用Python2.x完成的)和2018硬件(MacBookPro)下，我現在得到了以下時間：

% python -m timeit -s "import re" "re.match('hello', 'hello world')"1000000 loops, best of 3: 
0.661 usec per loop% python -m timeit -s "import re; h=re.compile('hello')" "h.match('hello world')"1000000 loops, best of 3:
 0.285 usec per loop% python -m timeit -s "import re" "h=re.compile('hello'); h.match('hello world')"1000000 loops, best of 3:
  0.65 usec per loop% python --versionPython 3.6.5 :: Anaconda, Inc.

我還添加了一個大小寫(注意前兩次運行之間的引號差異)，它表明re.match(x, ...)從字面上[大致]相當于re.compile(x).match(...)也就是說，編譯后表示的幕后緩存似乎不會發生。

反對回復 2019-07-12

3 回答
0 關注
721 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

是否值得使用Python的re.編譯？

是否值得使用Python的re.編譯？

3 回答

添加回答

是否值得使用Python的re.編譯？

是否值得使用Python的re.編譯？