在usercf中并不是兩個用戶共同看的電影越多,兩個用戶相似度就越高?
如下圖所示:userid3和userid94共同看的電影最多,但是userid3與userid94的相似度卻不是最高的,我想這是因為兩者總共看的電影不同,計算相似度的時候因為userid94看的電影數太多而導致相似度下降
如下圖所示:userid3和userid94共同看的電影最多,但是userid3與userid94的相似度卻不是最高的,我想這是因為兩者總共看的電影不同,計算相似度的時候因為userid94看的電影數太多而導致相似度下降
2018-08-12
舉報
2018-08-13
對的,是的我們在計算相似度的時候是考慮個性化因素,舉例來說,如果A用戶和B用戶,A用戶與C用戶都是共同點擊了3個物品。那么很明顯,B和C誰點擊過的物品越少越能體現出與A用戶的相似。因為如果一個用戶點擊的物品太多,其實顯示的并不是個性化需求,而是范需求。
2018-08-12
輸出相應的total_movies可以看出相應的原因:
用戶userid94共看過148部電影,因此導致與userid3的相似度下降