現在要做的項目里也會有問答模塊,所以參考了一下百度知道,發現它有個“其他類似問題”,不明白百度是通過什么算法來找出類似問題的,求思路……
2 回答

慕虎7371278
TA貢獻1802條經驗 獲得超4個贊
說下我的思路吧
1 提問通常都是會分類,所以第一次就可以大致確定,所提出的問題屬于哪一類,
2 提取問題關鍵字 比如 "C#如何使用反射" 通過算法去除不相關字段“如何” "使用",最后只留下 "C# 反射" 再根據這個關鍵詞去已有題庫中去匹配這樣得到的結果都是與提出的問題相關的貼子了。 這里有難度的就是提取關鍵字的算法了。
添加回答
舉報
0/150
提交
取消