南京大学学报(自然科学版) ›› 2020, Vol. 56 ›› Issue (4): 461–468.doi: 10.13232/j.cnki.jnju.2020.04.004

• • 上一篇    下一篇

信息表中约简补集对及其一般定义

王宝丽1(),姚一豫2   

  1. 1.运城学院数学与信息技术学院,运城,044000
    2.加拿大里贾纳大学计算机系,里贾纳,S4S 0A2,加拿大
  • 收稿日期:2020-06-24 出版日期:2020-07-30 发布日期:2020-08-06
  • 通讯作者: 王宝丽 E-mail:pollycomputer@163.com
  • 基金资助:
    国家自然科学基金(61703363);山西省自然科学基金(201901D211462);山西省高等学校科技创新项目(2019L0864);山西省重点实验室开放课题(CICIP2018008)

A definition of complementary attribute reduct pairs in an information table

Baoli Wang1(),Yiyu Yao2   

  1. 1.School of Mathematics & Information Technology, Yuncheng University, Yuncheng, 044000, China
    2.Department of Computer Science, University of Regina, Regina, S4S 0A2, Canada
  • Received:2020-06-24 Online:2020-07-30 Published:2020-08-06
  • Contact: Baoli Wang E-mail:pollycomputer@163.com

摘要:

约简是粗糙集理论的核心研究内容,也是粗糙集区分于其他数据挖掘算法最精彩的部分.现有约简以信息表中满足某种性质的最小属性子集为主要特征,不考虑属性集之间的相互作用和相互补充关系.从一对满足某种性质的互补属性子集出发,寻找其最小互补属性子集对,从而保障所求约简属性集对满足一定的互补性,可对实际应用中的限制条件约简进行建模.其次,从约简需保持的性质与特定划分不确定度量之间的关系出发,提出几类基本的约简补集对的一般化定义.此外,结合经典启发式约简算法,提出约简补集对的通用求解算法.最后运用一个中西医结合诊断肺炎的约简补集对求解实例说明所提算法的实用性及有效性.

关键词: 粗糙集, 约简, 属性补集对, 约简补集对, 不确定性度量

Abstract:

Attribute reducts are an essential notion in rough set theory and one of the most distinguishing features of the rough set approaches to data mining. A reduct construction algorithm is to find a minimal set of attributes that has some property. However, it does not consider the complementary relationship between attributes. This paper proposes a general definition of complementary attribute pairs and complementary attribute reduct pairs to model a reciprocal relationship between subsets of attributes in real applications. Three primary definitions are adapted for different situations. A reduct construction algorithm is proposed for finding a complementary pair of subsets of attributes in an information table. A diagnosis and treatment example that combines traditional Chinese medicine and Western medicine is used to illustrate the practicality and usefulness of the proposed concepts at the end of this paper.

Key words: rough set, attribute reduct, complementary pair of attributes, complementary reduct pair, uncertainty measure

中图分类号: 

  • TP391

表1

一个发热病人诊断表达信息系统"

脉象听诊体质咳嗽X光像血沉诊断
u1水泡阳虚剧烈片状正常肺炎
u2水泡阳虚剧烈片状正常肺炎
u3干鸣阴虚轻微片状肺炎
u4干鸣阳虚中度片状正常肺炎
u5啰音阳虚轻微片状正常肺炎
u6正常痰湿轻微索条状正常肺炎
u7啰音阴虚剧烈空洞肺结核
u8啰音阴虚轻微索条状正常肺结核
u9干鸣阴虚轻微点状肺结核
u10干鸣痰湿中度片状肺结核
u11干鸣阴虚轻微点状正常肺炎
u12啰音阴虚剧烈空洞肺结核
1 Pawlak Z. Rough sets. International Journal of Computer & Information Sciences,1982,11(5):341-356.
2 Yao Y Y. Two views of the theory of rough sets in finite universes. International Journal of Approximate Reasoning,1996,15(4):291-317.
3 Skowron A,Rauszer C. The discernibility matrices and functions in information systems∥Intelligent Decision Support. Springer Berlin Heidelberg,1992:331-362.
4 Yao Y Y,Zhao Y. Discernibility matrix simplification for constructing attribute reducts. Information Sciences,2009,179(7):867-882.
5 杨明,杨萍. 差别矩阵浓缩及其属性约简求解方法. 计算机科学,2006,33(9):181-183,269.
Yang M,Yang P. Discernibility matrix enriching and computation for attributes reduction. Computer Science,2006,33(9):181-183,269.
6 冯琴荣,胡競丹. 利用浓缩布尔矩阵重排技术求所有约简. 控制与决策,https:∥kns.cnki.net/KCMS/detail/21.1124.tp.20200114.1555.013.html,2020-01-15.
7 Miao D Q,Zhao Y,Yao Y Y,et al. Relative reducts in consistent and inconsistent decision tables of the Pawlak rough set model. Information Sciences,2009,179(24):4140-4150.
8 苗夺谦,胡桂荣. 知识约简的一种启发式算法. 计算机研究与发展,1999,36(6):681-684.
Miao D Q,Hu G R. A heuristic algorithm for reduction of knowledge. Journal of Computer Research and Development,1999,36(6):681-684.
9 王国胤,于洪,杨大春. 基于条件信息熵的决策表约简. 计算机学报,2002,25(7):759-766.
Wang G Y,Yu H,Yang D C. Decision table reduction based on conditional information entropy. Chinese Journal of Computers,2002,25(7):759-766.
10 胡峰,王国胤. 属性序下的快速约简算法. 计算机学报,2007,30(8):1429-1435.
Hu F,Wang G Y. Quick reduction algorithm based on attribute order. Chinese Journal of Computers,2007,30(8):1429-1435.
11 Qian Y H,Liang J Y,Pedrycz W,et al. Positive approximation:an accelerator for attribute reduction in rough set theory. Artificial Intelligence,2010,174(9-10):597-618.
12 Liang J Y,Wang F,Dang C Y,et al. An efficient rough feature selection algorithm with a multi?granulation view. International Journal of Approximate Reasoning,2012,53(6):912-926.
13 Sun L,Wang L Y,Ding W P,et al. Feature selection using fuzzy neighborhood entropy?based uncertainty measures for fuzzy neighborhood multigranulation rough sets. IEEE Transactions on Fuzzy Systems,2020,doi:10.1109/TFUZZ.2020.2989098.
doi: 10.1109/TFUZZ.2020.2989098
14 Zhao Y,Luo F,Wong S K M,et al. A general definition of an attribute reduct∥International Conference on Rough Sets and Knowledge Technology. Springer Berlin Heidelberg,2007:101-108.
15 Jia X Y,Shang L,Zhou B,et al. Generalized attribute reduct in rough set theory. Knowledge?Based Systems,2016,91:204-218.
16 Yao Y Y,Zhao Y. Attribute reduction in decision?theoretic rough set models. Information Sciences,2008,178(17):3356-3373.
17 Yao Y Y,Zhao L Q. A measurement theory view on the granularity of partitions. Information Sciences,2012,213:1-13.
18 王宝丽,梁吉业. 信息系统中的知识距离与知识粗糙熵. 计算机科学,2007,34(3):151-154.
Wang B L,Liang J Y. Knowledge distance and rough entropy in information systems. Computer Science,2007,34(3):151-154.
[1] 李同军,于洋,吴伟志,顾沈明. 经典粗糙近似的一个公理化刻画[J]. 南京大学学报(自然科学版), 2020, 56(4): 445-451.
[2] 刘鑫,胡军,张清华. 属性组序下基于代价敏感的约简方法[J]. 南京大学学报(自然科学版), 2020, 56(4): 469-479.
[3] 任睿,张超,庞继芳. 有限理性下多粒度q⁃RO模糊粗糙集的最优粒度选择及其在并购对象选择中的应用[J]. 南京大学学报(自然科学版), 2020, 56(4): 452-460.
[4] 李俊余, 李星璇, 王霞, 吴伟志. 基于三元因子分析的三元概念约简[J]. 南京大学学报(自然科学版), 2020, 56(4): 480-493.
[5] 张龙波, 李智远, 杨习贝, 王怡博. 决策代价约简求解中的交叉验证策略[J]. 南京大学学报(自然科学版), 2019, 55(4): 601-608.
[6] 姚宁, 苗夺谦, 张远健, 康向平. 属性的变化对于流图的影响[J]. 南京大学学报(自然科学版), 2019, 55(4): 519-528.
[7] 程永林, 李德玉, 王素格. 基于极大相容块的邻域粗糙集模型[J]. 南京大学学报(自然科学版), 2019, 55(4): 529-536.
[8] 李藤, 杨田, 代建华, 陈鸰. 基于模糊区分矩阵的结直肠癌基因选择[J]. 南京大学学报(自然科学版), 2019, 55(4): 633-643.
[9] 徐秀芳, 徐 森, 花小朋, 徐 静, 皋 军, 安 晶. 一种基于t-分布随机近邻嵌入的文本聚类方法[J]. 南京大学学报(自然科学版), 2019, 55(2): 264-271.
[10] 张 婷1,2,张红云1,2*,王 真3. 基于三支决策粗糙集的迭代量化的图像检索算法[J]. 南京大学学报(自然科学版), 2018, 54(4): 714-.
[11] 敬思惠,秦克云*. 决策系统基于特定决策类的上近似约简[J]. 南京大学学报(自然科学版), 2018, 54(4): 804-.
[12] 胡玉文1,2,3*,徐久成1,2,张倩倩1,2. 决策演化集的膜结构抑制剂[J]. 南京大学学报(自然科学版), 2018, 54(4): 810-.
[13] 陶玉枝1,2,赵仕梅1,2,谭安辉1,2*. 一种基于决策表约简的集覆盖问题的近似解法[J]. 南京大学学报(自然科学版), 2018, 54(4): 821-.
[14]  严丽宇1,魏 巍1,2*,郭鑫垚1,崔军彪1.  一种基于带核随机子空间的聚类集成算法[J]. 南京大学学报(自然科学版), 2017, 53(6): 1033-.
[15] 赵天娜1,米据生1*,解 滨2,梁美社1,3. 基于多伴随直觉模糊粗糙集的三支决策[J]. 南京大学学报(自然科学版), 2017, 53(6): 1081-.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 林 銮,陆武萍,唐朝生,赵红崴,冷 挺,李胜杰. 基于计算机图像处理技术的松散砂性土微观结构定量分析方法[J]. 南京大学学报(自然科学版), 2018, 54(6): 1064 -1074 .
[2] 韩明鸣, 郭虎升, 王文剑. 面向非平衡多分类问题的二次合成QSMOTE方法[J]. 南京大学学报(自然科学版), 2019, 55(1): 1 -13 .
[3] 范 君, 业巧林, 业 宁. 基于线性鉴别的无参数局部保持投影算法[J]. 南京大学学报(自然科学版), 2019, 55(2): 211 -220 .
[4] 陈晓冬, 底晓强, 李锦青. 基于多混沌和分数Fourier的光学图像加密算法[J]. 南京大学学报(自然科学版), 2019, 55(2): 251 -263 .
[5] 叶 超,田 芳,罗 勇,王新惠,田苗壮,崔文君,王立发,雷坤超. 北京地面沉降控制区划及防控措施[J]. 南京大学学报(自然科学版), 2019, 55(3): 440 -448 .
[6] 丁晓冬,张 陆,耿洪斌,陈庆民. 基于芳香族端氨基聚四亚甲基醚软段的聚脲弹性体结构与性能[J]. 南京大学学报(自然科学版), 2019, 55(3): 498 -503 .
[7] 程永林, 李德玉, 王素格. 基于极大相容块的邻域粗糙集模型[J]. 南京大学学报(自然科学版), 2019, 55(4): 529 -536 .
[8] 李黎, 张瑞芳, 杜娜娜, 柳寰宇. 基于有限临时删边的病毒传播控制策略[J]. 南京大学学报(自然科学版), 2019, 55(4): 651 -659 .
[9] 徐扬,周文瑄,阮慧彬,孙雨,洪宇. 基于层次化表示的隐式篇章关系识别[J]. 南京大学学报(自然科学版), 2019, 55(6): 1000 -1009 .
[10] 刘作国,陈笑蓉. 汉语句法分析中的论元关系模型研究[J]. 南京大学学报(自然科学版), 2019, 55(6): 1010 -1019 .