1 回答

TA貢獻1847條經驗 獲得超11個贊
長話短說:
from random import uniform
def gen_coords(x1, y1, x2, y2, n):
result = set()
# loops for each addition, avoiding duplicates
while len(result) < n:
result.add((uniform(x1, x2), uniform(y1, y2)))
return result
可以說,實際上:
from random import uniform
def gen_coords(x1, y1, x2, y2, n):
return [(uniform(x1, x2), uniform(y1, y2)) for _ in range(n)]
考慮到碰撞的可能性很小。
假設“起始坐標和終止坐標之間”是指在笛卡爾坐標系(即平面、2D)中這兩個角之間的矩形截面中。
并假設充分實現“均勻分布”,忽略浮點值的非均勻分布。(即,在任何相等長度的間隔上,浮點值的數量不是完全相同,也不是連續體中浮點值之間的恒定距離)
基本上有三種方法可以確保隨機生成的點不重復:
從可能值的集合中選擇它們,刪除每個選擇以避免再次選擇;
在允許的空間內生成值,將每個選擇與之前的選擇進行檢查,以避免添加重復項(并重新選擇值,直到生成新值);
生成值并添加到集合中,直到達到所需的集合大小,生成后刪除重復項(如果有)并重復該過程直至完成。
如果從中選取值的空間大小與目標集大小相似,第一個選項可能是一個不錯的選擇。然而,當在某些空間中選取具有隨機浮點坐標的點時,這種情況不太可能發生。
第二種選擇是最直接的,但如果目標集大小很大,則計算成本可能會很高,因為每個新選擇都會導致更多比較。
第三種選擇涉及更多一些,但在候選目標集完成之前避免進行比較,如果沖突的可能性很小,這當然是最佳選擇。
作為第二個選擇的變體,您可以選擇一個目標數據結構,完全避免添加重復項,依靠語言/解釋器比用該語言編寫的任何算法更有效地執行檢查。
在Python中,這意味著使用 aset
而不是 a list
,這是實現結果的最快方法,并且可能是您在第三個選項中檢查重復項的方法 - 所以您也可以立即使用它并使用第二個選項的變體。
請注意,如果您嘗試在選擇函數的范圍內創建大于選擇函數域的集合,則第二個和第三個選項都有一個重大缺陷。但對于給定的問題,除了非常大的“n”之外,這是不可能的。
解決方案(將第二個選項與第三個選項進行比較):
from random import uniform
from timeit import timeit
def pick_coords_restricted(x1, y1, x2, y2, n):
result = set()
# loops for each addition, avoiding duplicates
while len(result) < n:
result.add((uniform(x1, x2), uniform(y1, y2)))
return result
def pick_coords_checked(x1, y1, x2, y2, n):
result = []
# loops once for attempt, checking after each iteration
while len(set(result)) < n:
if len(result) > 0:
result = list(set(result))
result += [(uniform(x1, x2), uniform(y1, y2)) for _ in range(n - len(result))]
else:
result = [(uniform(x1, x2), uniform(y1, y2)) for _ in range(n)]
return result
print(timeit(lambda: pick_coords_restricted(0, 0, 1, 1, 1000), number=10000))
print(timeit(lambda: pick_coords_checked(0, 0, 1, 1, 1000), number=10000))
結果(在我的硬件上):
4.3799341
3.9363368000000003
我得到了一致的、但稍微更好的函數結果pick_coords_checked——我贊成第一個實現的清晰度。
添加回答
舉報