聚類算法實現:DBSCAN、層次聚類、K-means

  • 2019 年 10 月 28 日
  • 筆記

之前也做過聚類,只不過是用經典數據集,這次是拿的實際數據跑的結果,效果還可以,記錄一下實驗過程。 首先: 確保自己數據集是否都完整,不能有空值,最好也不要出現為0的值,會影響聚類的效果。 其次: 想好要用什麼算法去做,K-means,層次聚類還是基於密度算法,如果對這些都不算特別深入了解,那就都嘗試一下吧,我就是這樣做的。 好了,簡單開始講解實驗的過程吧。

一些庫的準備:

貼上了完整的代碼,只需要改文件路徑就可以了。

詳細源碼查看地址

https://blog.csdn.net/qq_39662852/article/details/81535371

可以運行看一下效果,下圖是使用K-means聚類出來的效果,K值設為4:

然後你可以去看輸出文件分出的類別,可以嘗試改變K值,直接改minK和maxK 的值就可以了。