我想創建一個函數來計算兩個數組電影之間的距離。這是我的數據幀:movie_title movieId Action Adventure Fantasy Sci-Fi ThrillerAvatar 1 1.0 1.0 1.0 1.0 0.0Spectre 2 1.0 1.0 0.0 0.0 1 John Carter 3 1.0 1.0 0.0 1.0 0.0然后我將電影表示為一個數組:df_array = userGenreTable.as_matrix(columns=userGenreTable.columns[2:])輸出 :array([[1., 1., 1., ..., 0., 0., 0.], [1., 1., 1., ..., 0., 0., 0.], [1., 1., 0., ..., 0., 0., 0.]])我將數據集表示為字典:df_2_dict = userGenreTable_2.to_dict('records')所以我的問題是如何計算兩個數組電影之間的距離?
1 回答

函數式編程
TA貢獻1807條經驗 獲得超9個贊
要獲得 中所有可能對之間的距離df_array,您需要計算一個距離矩陣。使用scipy.spatial:
from scipy.spatial import distance_matrix
# p = 2 for euclidean distances
distance_matrix(df_array, df_array, p = 2)
添加回答
舉報
0/150
提交
取消