亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

是否值得使用Python的re.編譯?

是否值得使用Python的re.編譯?

茅侃侃 2019-07-12 16:49:27
是否值得使用Python的re.編譯?在Python中使用用于正則表達式的編譯有什么好處嗎?h = re.compile('hello')h.match('hello world')VSre.match('hello', 'hello world')
查看完整描述

3 回答

?
HUX布斯

TA貢獻1876條經驗 獲得超6個贊

對我來說,最大的好處是re.compile能夠將正則表達式的定義與它的使用分開。

甚至一個簡單的表達式,比如0|[1-9][0-9]*(基數10中沒有前導零的整數)可能足夠復雜,因此您寧愿不必重新鍵入它,檢查是否輸入了任何類型,然后在開始調試時必須重新檢查是否有排字。另外,使用變量名(如num或num_b10)比使用變量名要好得多0|[1-9][0-9]*.

當然可以存儲字符串并將它們傳遞給re.Match;但是,這是較少可讀性:

num = "..."# then, much later:m = re.match(num, input)

相對于匯編:

num = re.compile("...")# then, much later:m = num.match(input)

雖然它是相當接近,第二行感覺更自然和簡單的重復使用。


查看完整回答
反對 回復 2019-07-12
?
守著一只汪

TA貢獻1872條經驗 獲得超4個贊

FWIW:

$ python -m timeit -s "import re" "re.match('hello', 'hello world')"100000 loops, best of 3: 3.82 usec per loop

$ python -m timeit -s "import re; h=re.compile('hello')" "h.match('hello world')"1000000 loops, best of 3: 1.26 usec per loop

所以,如果要使用很多事,也許值得去做re.compile(特別是對于更復雜的正則表達式)。

反對過早優化的標準論點是適用的,但我認為您不會因為使用re.compile如果您懷疑您的regexp可能成為性能瓶頸。

最新情況:

在Python3.6(我懷疑上面的時間是使用Python2.x完成的)和2018硬件(MacBookPro)下,我現在得到了以下時間:

% python -m timeit -s "import re" "re.match('hello', 'hello world')"1000000 loops, best of 3: 
0.661 usec per loop% python -m timeit -s "import re; h=re.compile('hello')" "h.match('hello world')"1000000 loops, best of 3:
 0.285 usec per loop% python -m timeit -s "import re" "h=re.compile('hello'); h.match('hello world')"1000000 loops, best of 3:
  0.65 usec per loop% python --versionPython 3.6.5 :: Anaconda, Inc.

我還添加了一個大小寫(注意前兩次運行之間的引號差異),它表明re.match(x, ...)從字面上[大致]相當于re.compile(x).match(...)也就是說,編譯后表示的幕后緩存似乎不會發生。


查看完整回答
反對 回復 2019-07-12
  • 3 回答
  • 0 關注
  • 721 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號