Two⁃way clustering algorithms produce clusters with clear and sharp boundaries,which does not truly reflect the fact that a cluster may not necessarily have a well⁃defined boundary in many real world situations. To tackle this deficiency,three⁃way clustering uses three regions through a pair of sets to represent a cluster instead of using two regions to represent a cluster by a single set,which reflects the three types of relationship between an object and a cluster,namely,belong⁃to definitely,uncertain and not belong⁃to definitely. In this paper,we propose a three⁃way clustering algorithm by using the stability of each sample. We use clustering ensemble results to compute the sample’s stability and divide the universe into cluster core and cluster halo based on sample’s stability. The elements in the cluster core are assigned into the core region of each cluster by using traditional clustering algorithm. The elements in the cluster halo are assigned into the fringe region of corresponding cluster according to distances between the elements and the centers of the cluster core region. Therefore,a three⁃way clustering is naturally formed. Experimental results on UCI datasets show that this method can improve the structure of the clustering results.
Yang Xin, Shi Hong, Wang Pingxin, Xu Gang. Three⁃way clustering based on sample‘s stability. Journal of nanjing University(Natural Science)[J], 2019, 55(4): 546-552 doi:10.13232/j.cnki.jnju.2019.04.004
传统的聚类方法都是一种二支决策,如果获取的信息不充分,直接运用传统的聚类算法可能会带来较高的决策风险.为了解决传统聚类算法存在的问题,许多新方法被提出.Hoppner et al[1]提出模糊聚类.Yao et al[2]用区间集来表示聚类结果中的一个类.Yu et al[3,4]提出三支决策方法,将类用核心域、边界域和琐碎域来表示.
现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富.
传统的聚类大多是硬聚类,然而在许多实际问题中,一个对象和类别可能会有三种关系:即确定属于、确定不属于和无法确定.如果把无法确定的点强制划分到某类中可能会带来决策风险,这样的做法不十分合理.于是Yu et al[16]将三支决策思想引入到聚类中,提出了三支决策聚类方法.三支决策聚类用三个集合,分别表示类的核心域、边界域和琐碎域.核心域的点表示这些点确定属于这个类,边界域的点表示这些点可能属于这个类,而琐碎域的点表示这些点不属于这个类.
Some methods for classification and analysis of multivariate observations∥Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability
Berkeley,CA,USA:University of California Press,1967:281-297.
Fuzzy cluster analysis:methods for classification,data analysis and image recognition
1
1999
... 传统的聚类方法都是一种二支决策,如果获取的信息不充分,直接运用传统的聚类算法可能会带来较高的决策风险.为了解决传统聚类算法存在的问题,许多新方法被提出.Hoppner et al[1]提出模糊聚类.Yao et al[2]用区间集来表示聚类结果中的一个类.Yu et al[3,4]提出三支决策方法,将类用核心域、边界域和琐碎域来表示. ...
Interval set cluster analysis:A re?formulation∥Sakai H,Chakraborty M K,Hassanien A E,
1
2009
... 传统的聚类方法都是一种二支决策,如果获取的信息不充分,直接运用传统的聚类算法可能会带来较高的决策风险.为了解决传统聚类算法存在的问题,许多新方法被提出.Hoppner et al[1]提出模糊聚类.Yao et al[2]用区间集来表示聚类结果中的一个类.Yu et al[3,4]提出三支决策方法,将类用核心域、边界域和琐碎域来表示. ...
Autonomous knowledge?oriented clustering using decision?theoretic rough set theory
1
2012
... 传统的聚类方法都是一种二支决策,如果获取的信息不充分,直接运用传统的聚类算法可能会带来较高的决策风险.为了解决传统聚类算法存在的问题,许多新方法被提出.Hoppner et al[1]提出模糊聚类.Yao et al[2]用区间集来表示聚类结果中的一个类.Yu et al[3,4]提出三支决策方法,将类用核心域、边界域和琐碎域来表示. ...
An automatic method to determine the number of clusters using decision?theoretic rough set
1
2014
... 传统的聚类方法都是一种二支决策,如果获取的信息不充分,直接运用传统的聚类算法可能会带来较高的决策风险.为了解决传统聚类算法存在的问题,许多新方法被提出.Hoppner et al[1]提出模糊聚类.Yao et al[2]用区间集来表示聚类结果中的一个类.Yu et al[3,4]提出三支决策方法,将类用核心域、边界域和琐碎域来表示. ...
Clustering ensemble based on sample’s stability
2
2019
... 2019年,Li et al[5]提出了基于稳定性的集成算法.本文利用其中一种基于稳定性的方法将硬聚类转化为三支聚类,即利用稳定性把数据分为核与环,对核内数据进行传统的硬聚类,再对环中数据做三支聚类,从而进一步提高聚类质量,降低决策风险. ...
A framework of three?way cluster analysis∥Proceedings of International Joint Conference on Rough Sets
1
2017
... 现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富. ...
Detecting and refining overlapping regions in complex networks with three?way decisions
1
2016
... 现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富. ...
A tree?based incre?mental overlapping clustering method using the three?way decision theory
1
2016
... 现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富. ...
Three?way decision model with two types of classification errors
1
2017
... 现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富. ...
Three?way cognitive concept learning via multi?granularity
1
2017
... 现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富. ...
Optimal scale selection in dynamic multi?scale decision tables based on sequential three?way decisions
1
2017
... 现在,三支决策理论的发展越来越快,并在许多领域得到了应用.例如:Yu et al[9,10,11]提出了三支决策的框架,即用核心域和边界域来表示一个类.Zhang et al[12]提出了分类误差的三支决策模型.Li et al[13]提出了面向多粒度的三支认知概念学习.Hao et al[14]提出了基于序列三支决策的动态多尺度决策表的最优尺度选择.正是这些努力和研究,三支决策理论的内容越来越丰富. ...
Autonomous knowledge?oriented clustering using decision?theoretic rough set theory∥Yu J,Greco S,Lingras P,
1
2010
... 传统的聚类大多是硬聚类,然而在许多实际问题中,一个对象和类别可能会有三种关系:即确定属于、确定不属于和无法确定.如果把无法确定的点强制划分到某类中可能会带来决策风险,这样的做法不十分合理.于是Yu et al[16]将三支决策思想引入到聚类中,提出了三支决策聚类方法.三支决策聚类用三个集合,分别表示类的核心域、边界域和琐碎域.核心域的点表示这些点确定属于这个类,边界域的点表示这些点可能属于这个类,而琐碎域的点表示这些点不属于这个类. ...
Cluster ensembles:a knowledge reuse framework for combining multiple partitions
1
2002
... 2002年Strehl and Ghosh[17]提出聚类集成(Clustering Ensemble)的概念,给出聚类集成的定义:将两个或多个对同一组对象的数据划分得到的不同结果进行合并,而不使用对象原有的特征.现在对聚类集成问题的研究主要包括集成生成、集成选择和整体集成三个方面. ...
Some methods for classification and analysis of multivariate observations∥Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability