我目前正在做一個項目,我希望對多維數據進行聚類。我嘗試了 K-Means 聚類和 DBSCAN 聚類,兩者都是完全不同的算法。K-Means模型返回了一個相當好的輸出,它返回了5個聚類,但我讀到過,當維度很大時,歐幾里得距離會失敗,所以我不知道我是否可以信任這個模型。在嘗試 DBSCAN 模型時,該模型生成了許多噪聲點,并在一個聚類中聚類了大量點。我嘗試了 KNN dist 繪圖方法來找到模型的最佳 eps,但我似乎無法使模型正常工作。這導致了我的結論,也許繪制的點的密度非常高,也許這就是我在一個聚類中獲得很多點的原因。對于聚類分析,我使用 10 個不同的數據列。我應該更改我正在使用的算法嗎?對于多維數據和密度變化較小的算法,什么是更好的算法?
添加回答
舉報
0/150
提交
取消