亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

java實現關于文章相似度問題

java實現關于文章相似度問題

叮當貓咪 2018-07-24 11:18:39
CMS項目數據量大多超10w,有的數據量達到100w以上!這種大數據量的情況下如何實現計算每篇文章跟剩余文章的相似度?求大神指教下!之前的做法是先把所有數據從數據庫查出來,放在List里邊,然后遍歷循環跟剩余的對比,尷尬的是數據量一大直接卡死
查看完整描述

2 回答

?
梵蒂岡之花

TA貢獻1900條經驗 獲得超5個贊

你這應該使用算法或文本分析工具,比如使用Ansj分詞工具等等,這樣效率會很高,上傳的文檔可以離線比對后保存相似結果,查詢時直接查詢結果這不就快了


查看完整回答
反對 回復 2018-08-10
?
喵喔喔

TA貢獻1735條經驗 獲得超5個贊

有文本相似度計算的方法。使用數據挖掘的相關概念實現文本相似度計算


查看完整回答
反對 回復 2018-08-10
  • 2 回答
  • 0 關注
  • 1029 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號