我正在嘗試研究 fuzzywuzzy 如何計算這個簡單的模糊比率:print(fuzz.ratio("66155347", "12026599"))
25為什么模糊率不為 0,因為它們在每個位置都是完全不同的字符?編輯距離 = 8(因為每個值都需要被替換) a 為 8(字符串 1 的長度為 8) b 為 8(字符串 2 的長度為 8)fuzz.ratio 為 (a+b - 編輯距離)/(a+b)模糊比率為 (8+8 - 8)/(8+8) = .50模糊比率為 50我的數學也一定有問題;我快50了模糊率是如何達到 25 的?任何指導將不勝感激。
1 回答

素胚勾勒不出你
TA貢獻1827條經驗 獲得超9個贊
fuzzywuzzy 庫使用 Levenshtein 距離的加權版本,為替換賦予權重 2,從而使 Levenshtein 距離達到 12。則 (8 + 8 - 12) / (8 + 8) = 0.25。
添加回答
舉報
0/150
提交
取消