南京大学学报(自然科学版) ›› 2017, Vol. 53 ›› Issue (4): 791.
杨 洁1,2,王国胤1*,庞紫玲1
Yang Jie1,2,Wang Guoyin1*,Pang Ziling1
摘要: 相对于其他的密度聚类算法,密度峰值聚类(Density Peaks Clustering,DPC)算法思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性.但是,DPC仍然具有一定缺陷,例如存在截断阈值dc的定义模糊以及选取中心点失效等问题.在阐述了DPC的算法思想和原理的基础上,分析了DPC算法的缺陷,然后从多个改进的角度对其相关研究工作进行了综述.通过分析DPC与相关理论(数据场、图论、粒计算等)的联系,针对密度峰值的缺点,提出了基于粒计算的DPC算法改进框架,其中包括由细到粗、由细到粗和双向变粒度这三种机制以及基于网格粒化的密度峰值算法框架.最后对DPC今后的研究工作进行了展望,包括动态密度峰值聚类、利用密度峰值研究网络拓扑、处理复杂任务以及改进其他聚类等,希望为DPC的进一步研究提供新思想
[1] Jain A K,Murty M N,Flynn P J.Data clustering:A review.ACM Computing Surveys,1999,31(3):264-323. [37] Frey B J,Dueck D.Clustering by passing messages between data points.Science,2007,315(5814):972-976. |
No related articles found! |
|