南京大学学报(自然科学版) ›› 2017, Vol. 53 ›› Issue (6): 1033.
严丽宇1,魏 巍1,2*,郭鑫垚1,崔军彪1
Yan Liyu1,Wei Wei1,2*,Guo Xinyao1,Cui Junbiao1
摘要: 随机子空间聚类集成通过属性随机采样产生属性子空间,并将子空间上的基聚类结果进行集成得到最终聚类结果.在这一过程中,子空间产生的随机性虽然为聚类集成提供了很大的差异度,但是无法保证基聚类结果的有效性,这是因为随机产生的子空间有可能只包含极少的重要属性.针对这一不足,提出了一种带核随机子空间生成策略:首先依据粗糙集理论中的互补互信息选出对于刻画数据集整体信息至关重要的属性子集,作为每个属性子空间的“核心”,再从剩余属性集中随机选择一定数量的属性与核心属性共同构成聚类子空间.这种策略在兼顾子空间之间差异性的同时也提高了每个属性子空间对数据整体信息的刻画能力,从而得到更好的聚类集成结果.在大量UCI数据集上的实验证实了所提方法的合理性和有效性.
[1] Agresti A.An introduction to categorical data analysis.The 2nd Edition.New Jersey:Wiley,2007,400. |
No related articles found! |
|