Attribute reducts are an essential notion in rough set theory and one of the most distinguishing features of the rough set approaches to data mining. A reduct construction algorithm is to find a minimal set of attributes that has some property. However, it does not consider the complementary relationship between attributes. This paper proposes a general definition of complementary attribute pairs and complementary attribute reduct pairs to model a reciprocal relationship between subsets of attributes in real applications. Three primary definitions are adapted for different situations. A reduct construction algorithm is proposed for finding a complementary pair of subsets of attributes in an information table. A diagnosis and treatment example that combines traditional Chinese medicine and Western medicine is used to illustrate the practicality and usefulness of the proposed concepts at the end of this paper.
Keywords:rough set
;
attribute reduct
;
complementary pair of attributes
;
complementary reduct pair
;
uncertainty measure
Wang Baoli, Yao Yiyu. A definition of complementary attribute reduct pairs in an information table. Journal of nanjing University[J], 2020, 56(4): 461-468 doi:10.13232/j.cnki.jnju.2020.04.004
苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态.
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... 划分知识的熵与知识粒度[8]分别为: ...
知识约简的一种启发式算法
2
1999
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... 划分知识的熵与知识粒度[8]分别为: ...
基于条件信息熵的决策表约简
2
2002
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
属性序下的快速约简算法
1
2007
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
Positive approximation:an accelerator for attribute reduction in rough set theory
2
2010
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... 和,则条件熵[11-13]为: ...
An efficient rough feature selection algorithm with a multi?granulation view
2
2012
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
Feature selection using fuzzy neighborhood entropy?based uncertainty measures for fuzzy neighborhood multigranulation rough sets
3
2020
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
... Zhao et al[14]总结各类约简的基本形态,给出了信息表约简的一般定义. ...
... 定义2[14] 给定一个信息表, ...
Generalized attribute reduct in rough set theory
1
2016
... 苗夺谦和胡桂荣[8]提出一种以互信息为启发式信息具有多项式时间复杂度的决策表约简算法.王国胤等[9]比较代数观及信息观下决策表约简得到二者的等价性质及不同特征,提出基于条件熵的约简算法.胡峰和王国胤[10]提出给定属性序,采用分治策略计算定属性序下的唯一约简,降低算法的时空复杂度,可用来高效计算海量数据的属性约简.Qian et al[11]通过正向近似的策略不断缩小粗糙集的边界域,减少当前计算启发式信息的数据量,从而获取与原信息表相同的属性约简,极大地提高了大数据的属性约简效率.Liang et al[12]从多粒度视角采用统计抽样计算各个对象子集的约简后进行约简集成,从而高效获取决策表的约简.Sun et al[13]以模糊邻域熵为启发式信息求取邻域多粒度粗糙集框架下的属性约简.这些算法虽然采用不同的启发式信息求取信息表或者决策表的约简,但它们均有相同的结构,其本质均为保持信息表或决策表的某种性质不变为基础,求取能够代表所有属性集的约简属性.Zhao et al[14]分析了各种约简的特征与模式,给出了属性约简的通用定义,将各类属性约简进行统一描述,形成通用框架.Jia et al[15]分析现有约简特征,提出了结合数据及用户需求的通用属性约简定义并讨论现有约简在其一般定义框架下的特殊形态. ...
Attribute reduction in decision?theoretic rough set models