聚类算法实现:DBSCAN、层次聚类、K-means
- 2019 年 10 月 28 日
- 筆記
之前也做过聚类,只不过是用经典数据集,这次是拿的实际数据跑的结果,效果还可以,记录一下实验过程。 首先: 确保自己数据集是否都完整,不能有空值,最好也不要出现为0的值,会影响聚类的效果。 其次: 想好要用什么算法去做,K-means,层次聚类还是基于密度算法,如果对这些都不算特别深入了解,那就都尝试一下吧,我就是这样做的。 好了,简单开始讲解实验的过程吧。
一些库的准备:

贴上了完整的代码,只需要改文件路径就可以了。
详细源码查看地址
https://blog.csdn.net/qq_39662852/article/details/81535371




可以运行看一下效果,下图是使用K-means聚类出来的效果,K值设为4:

然后你可以去看输出文件分出的类别,可以尝试改变K值,直接改minK和maxK 的值就可以了。