我正在探索 Python 的itertools模塊,并遇到了itertools.product返回與((x,y) for x in A for y in B). for-loops我發現它是一種非常巧妙的方法,可以在列表理解可能不足的復雜環境中減少嵌套。但是,在繼續之前,我想檢查它使用替代方法的性能。這是我進行的一些測試。使用 Jupyter Notebook 的內置%%timeit來衡量性能。案例1:香草列表理解%%timeit -n 50 -r 5[(x,y) for x in range(1000) if x%2==0 for y in range(1000) if y%2==1]>>> 35.8 ms ± 1.3 ms per loop (mean ± std. dev. of 5 runs, 50 loops each)案例 2:列表理解中的 itertools.product刪除itertools了導入以避免在此處顯示導入時間。%%timeit -n 50 -r 5[(x,y) for (x,y) in itertools.product(range(1000), range(1000)) if x%2==0 and y%2==1]>>> 62.1 ms ± 1.16 ms per loop (mean ± std. dev. of 5 runs, 50 loops each)案例 3:香草嵌套 for 循環%%timeit -n 50 -r 5lst = []for x in range(1000): for y in range(1000): if x%2 == 0 and y%2 == 1: lst.append((x,y))>>> 72 ms ± 769 μs per loop (mean ± std. dev. of 5 runs, 50 loops each)案例 4:使用 itertools.product 進行 for 循環%%timeit -n 50 -r 5lst = []for x, y in itertools.product(range(1000),range(1000)): if x%2==0 and y%2==1: lst.append((x,y))>>> 74.5 ms ± 2.13 ms per loop (mean ± std. dev. of 5 runs, 50 loops each)但是,我想,這部分文檔聲稱比普通for循環有更好的性能。另外,case-2不應該比case-1快嗎?在case-3和case-4itertools.product中,隨著迭代大小的增加,性能差異會變得更糟。這里發生了什么?另外,請添加一些itertools.product可能比 listcomp 或嵌套 for 循環更好的示例。
1 回答

波斯汪
TA貢獻1811條經驗 獲得超4個贊
你在比較不同的東西:
[(x,y) for x in range(1000) if x%2==0 for y in range(1000) if y%2==1]
...不一樣
[(x,y) for x in range(1000) for y in range(1000) if x%2==0 and y%2==1]
第一個完全跳過第二個循環 if x%2 != 0
,第二個循環遍歷所有1000 ** 2 == 1,000,000
組合。案例 2 到 4 與這里的第二個理解屬于同一類,因此它們本質上是較慢的。
添加回答
舉報
0/150
提交
取消