协调多源决策表的规则提取

doi:10.13232/j.cnki.jnju.2020.04.007

协调多源决策表的规则提取

万青^,¹^,³, 魏玲²^,³, 任睿思²^,³

1.西安工程大学理学院，西安，710048

2.西北大学数学学院，西安，710127

3.西北大学概念、认知与智能研究中心，西安，710127

Rule acquisition of consistent multi⁃source decision tables

Wan Qing^,¹^,³, Wei Ling²^,³, Ren Ruisi²^,³

1.School of Science，Xi'an Polytechnic University，Xi'an，710048，China

2.School of Mathematics，Northwest University，Xi'an，710127，China

3.Institute of Concepts，Cognition and Intelligence，Northwest University，Xi'an，710127，China

通讯作者: E⁃mail：wqysbe@163.com

收稿日期: 2020-06-20 网络出版日期: 2020-08-05

基金资助:

国家自然科学基金.  61772021.  61976130
陕西省教育厅专项基金.  19JK0380
西安工程大学博士科研启动基金.  BS1528

Received: 2020-06-20 Online: 2020-08-05

摘要

规则提取是知识发现的一个重要研究方向.多源数据是一类重要的数据集，从不同的角度对多源数据进行规则提取可为决策行为提供更加可信的依据.以多源决策表为数据基础，首先以数据源和决策规则的结论为切入点，提出两类多源决策规则的概念及其支持度和覆盖度的刻画方式；其次，分析这两类多源决策规则之间的联系；最后通过引入单源化决策表的定义，研究这两类多源决策规则的获取方法，并基于此讨论了两类多源决策规则的简化方法.

关键词： 多源决策表 ; 多源决策规则 ; 支持度 ; 覆盖度 ; 规则简化

Abstract

Rule acquisition is one of important research fileds of knowledge discovery. Multi⁃source data is an important data set，and obtaining rules in multi⁃source data from different perspectives can provide a more reliable basis for decision making. In this paper，based on multi⁃source decision tables，the definitions of two types of multi⁃source decision rules are presented from the perspectives of the data source and the conclusion of decision rule. Then，the support degree and the coverage degree of two types of rules are proposed. After that，the relationships between two types of multi⁃source decision rules are discussed. Finally，the approach to rule acquisition and rule simplification of the first and second types of multi⁃source decision rules are investigated by introducing the unisource decision table of multi⁃source decision table.

Keywords： multi⁃source decision table ; multi⁃source decision rule ; support degree ; coverage degree ; rule simplification

PDF (739KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

万青, 魏玲, 任睿思. 协调多源决策表的规则提取. 南京大学学报（自然科学）[J], 2020, 56(4): 494-504 doi:10.13232/j.cnki.jnju.2020.04.007

Wan Qing, Wei Ling, Ren Ruisi. Rule acquisition of consistent multi⁃source decision tables. Journal of nanjing University[J], 2020, 56(4): 494-504 doi:10.13232/j.cnki.jnju.2020.04.007

粗糙集理论(Rough Set Theory)^[1]是知识发现的重要工具，而规则提取是粗糙集理论的研究热点.在粗糙集理论中，数据的具体表现形式为信息系统.信息系统是一个二维数据表，记为(U,A,F)，其中U是对象集，A是属性集，F是U和A之间的关系集.进一步，若将属性分为条件属性A和决策属性d，则可得到决策表(U,A,F,d).在决策表中，通过研究两类属性的关系可以获得决策知识，即决策规则.

目前，针对决策表，已有许多学者研究了其决策规则提取问题.例如，常犁云等^[2]从属性约简和值约简两方面同时出发简化了决策表的决策规则；Kryszkiewicz^[3]针对不完备决策表提出了获取所有最优确定决策规则的方法；黄兵和周献中^[4]基于矩阵的方法，利用条件属性矩阵和决策矩阵研究不协调决策表的决策规则提取方法；钱宇华等^[5]探讨了决策表中的粒度思想，并建立了知识粒度与决策规则置信度之间的动态关系；Hao et al^[6]将多粒度粗糙集中的决策规则与形式概念分析中的决策规则进行了比较研究；Chen et al^[7]在不协调决策表中研究了由属性值的粗化和细化所引起的决策规则更新问题；Wu et al^[8]针对不完备多粒度标记决策表在协调和不协调两种情况下研究了决策规则提取问题；Zhang et al^[9]在区间集决策表中引入一个评估决策规则覆盖能力的度量，通过设置阈值得到了具有较高置信度且具有较强覆盖能力的决策规则.

规则提取是知识发现的一个重要研究方向，通过提取潜在的有效规则可为决策行为提供可靠依据.上述关于决策规则的研究方法仅限于针对单一来源数据构成的数据表，对于由多个源头的数据构成的数据表，若直接使用上述方法则提取的决策规则不能完全体现此类数据源头多的特点.该类多源数据在实际生活中普遍存在，是复杂数据类型之一，而且是一类重要的数据集.从不同的角度对多源数据进行知识获取研究，可进一步丰富复杂数据分析的方法.

现今，针对多源数据的研究主要集中在信息融合和约简两个方面^[10-19]，而关于多源决策表的决策规则，目前的研究相对较少.其中，林国平等^[18]基于多粒度粗糙集研究了决策规则评价函数的融合方法，给出了决策规则的整体评价指标.万青等^[19]基于新提出的多源决策表，从乐观策略的角度给出了多源决策规则的定义.而对于多源决策表，从多个层次、多个粒度对其展开分析，可以同时从不同角度挖掘数据中潜在的有用知识，进而对其进行有效融合，可为决策行为提供更多有效的依据.

为了达到从多个角度、多个层次出发分析多源数据的目的，本文在万青等^[19]研究的基础上，进一步研究多源决策表的决策规则获取问题.首先针对协调多源决策表，分别以数据源和决策规则的结论为切入点，定义第一类多源决策规则和第二类多源决策规则的概念；其次，为了刻画这两类多源决策规则的数字特征，给出了其支持度和覆盖度的定义，并讨论了这两类多源决策规则之间的联系；最后，提出了单源化决策表的定义，基于此研究了两类多源决策规则的获取方法，继而提出保持两类多源决策规则不变的约简.

1 预备知识

本节主要回顾多源信息系统与多源决策表的相关概念.

定义1^[19] 称 $M I S = \{I S_{k}| I S_{k} = (U, A, F_{k}),$

$k = 1,2, \dots, s\}$ 是多源信息系统.其中 $I S_{k} = (U, A, F_{k})$ 为信息系统, $U = \{x_{1}, x_{2}, \dots, x_{m}\}$ 为对象集，每个 $x_{i} (i \leq m)$ 称为一个对象； $A = \{a_{1}, a_{2}, \dots, a_{n}\}$ 为属性集，每个 $a_{j} (j \leq n)$ 称为一个属性； $F_{k} = \{f_{k l} : U \to V_{l} (l \leq |A|, a_{l} \in A)\}$ 为关系集, $V_{l}$ 是 $a_{l}$ 的值域.

称 $I S_{k} = (U, A, F_{k})$ 为多源信息系统 $M I S$ 的第 $k$ 个信息系统.记：

R_{k A} = \{(x_{i}, x_{j}) \in U \times U |f_{k l} (x_{i}) = f_{k l} (x_{j}), a_{l} \in A\}

称 $R_{k A}$ 为 $U$ 在第 $k$ 个信息系统 $I S_{k}$ 上关于 $A$ 的一个等价关系.记：

{[x_{i}]}_{k A} = \{x_{j} |(x_{i}, x_{j}) \in R_{k A}\}

则称 $U / R_{k A} = \{{[x_{i}]}_{k A} |x_{i} \in U\}$ 为 $U$ 在第 $k$ 个信息系统 $I S_{k}$ 上关于 $A$ 的一个划分.

定义2^[19] 称 $M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,$

$F_{k}, d_{k}), k = 1,2, \dots, s\}$ 是多源决策表.其中 $D T_{k} =$

$(U, A ⋃ d, F_{k}, d_{k})$ 为决策表， $A$ 为条件属性集， $d$ 为决策属性； $d_{k} : U \to V_{d}$ 为关系集， $V_{d}$ 为 $d$ 的值域.

称 $D T_{k} = (U, A ⋃ d, F_{k}, d_{k})$ 为多源决策表 $M D T$ 的第 $k$ 个决策表.记：

R_{k d} = \{(x_{i}, x_{j}) \in U \times U |f_{k d} (x_{i}) = f_{k d} (x_{j})\}

U / R_{k d} = \{{[x_{i}]}_{k d} |x_{i} \in U\}

称 $R_{k d}$ 为 $U$ 在第 $k$ 个决策表 $D T_{k}$ 上关于 $d$ 的一个等价关系， $U / R_{k d}$ 为 $U$ 在第 $k$ 个决策表 $D T_{k}$ 上关于 $d$ 的一个划分.

记 $ℱ = \{F_{k}| k = 1,2, \dots, s\}$ ，称 $ℱ$ 为 $M D T$ 的数据源集合，从而也称 $D T_{k} = (U, A ⋃ d, F_{k}, d_{k})$ 为 $M D T$ 的第 $k$ 个数据源.

定义3^[19] 设 $M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,$

$F_{k}, d_{k}), k = 1,2, \dots, s\}$ 是多源决策表. $\forall k \in \{1,2,$

$\dots, s\}$ ，若 $R_{k A} \subseteq R_{k d}$ ，则称 $M D T$ 为协调多源决策表.否则，称 $M D T$ 为不协调多源决策表.

需要指出，本文约定对于 $M D T$ 中任意两个不同的决策表，若一个对象在条件属性下的取值完全相等，则它们在决策属性下的取值也一定相等.

针对上述相关概念，通过一个例子来解释.

例1^[19]表1是一个中学教师课堂教学评议表.其中 $U = \{x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}, x_{7}, x_{8}, x_{9}\}$ 是对象集，分别代表语文、数学、英语、历史、地理、政治、生物、化学和物理共九门课程的代课教师； $A = \{a_{1}, a_{2}, a_{3}, a_{4}\}$ 是条件属性集，分别代表教学态度、教学内容、教学方法和教学效果四个指标，其值域均为 $\{1,2, 3,4\}$ ，分别代表 $[60,70]$ $(70, 80]$ $(80, 90]$ $(90, 100]$ 四个分数段; $ℱ = \{F_{1}, F_{2}, F_{3}\}$ 是数据源的集合，分别代表三个教学班级； $d$ 是决策属性，表示评价结果，其值域为 $V_{d} = \{1,2, 3\}$ ，分别表示中、良和优.

表1 多源决策表MDT

Table 1 A multi⁃source decision table MDT

U	F₁					F₂					F₃
U	a₁	a₂	a₃	a₄	d	a₁	a₂	a₃	a₄	d	a₁	a₂	a₃	a₄	d
x₁	4	3	3	3	3	4	3	3	2	3	4	3	3	4	3
x₂	4	3	3	3	3	4	3	3	2	3	4	3	3	3	3
x₃	4	3	3	3	3	3	3	3	2	2	4	3	3	3	3
x₄	4	3	3	2	3	3	2	3	2	2	3	2	3	2	2
x₅	3	2	3	2	2	3	3	3	2	2	4	3	3	4	3
x₆	3	2	2	1	1	2	2	2	1	1	2	2	2	1	1
x₇	4	3	3	2	3	3	3	3	2	2	3	2	3	2	2
x₈	3	2	3	2	2	2	2	2	1	1	2	2	2	1	1
x₉	3	2	2	1	1	2	2	2	1	1	2	2	2	1	1

新窗口打开| 下载CSV

由表1可得下述结果：

\begin{array}{l} U / R_{1 A} = \{\{x_{1}, x_{2}, x_{3}\}, \{x_{4}, x_{7}\}, \{x_{5}, x_{8}\}, \{x_{6}, x_{9}\}\} = \\ \{E_{11}, E_{12}, E_{13}, E_{14}\} \end{array}

\begin{array}{l} U / R_{2 A} = \{\{x_{1}, x_{2}\}, \{x_{3}, x_{5}, x_{7}\}, \{x_{4}\}, \{x_{6}, x_{8}, x_{9}\}\} = \\ \{E_{21}, E_{22}, E_{23}, E_{24}\} \end{array}

\begin{array}{l} U / R_{3 A} = \{\{x_{1}, x_{5}\}, \{x_{2}, x_{3}\}, \{x_{4}, x_{7}\}, \{x_{6}, x_{8}, x_{9}\}\} = \\ \{E_{31}, E_{32}, E_{33}, E_{34}\}, \end{array}

U / R_{1 d} = \{\{x_{1}, x_{2}, x_{3}, x_{4}, x_{7}\}, \{x_{5}, x_{8}\}, \{x_{6}, x_{9}\}\}

U / R_{2 d} = \{\{x_{1}, x_{2}, x_{4}\}, \{x_{3}, x_{5}, x_{7}\}, \{x_{6}, x_{8}, x_{9}\}\}

U / R_{3 d} = \{\{x_{1}, x_{2}, x_{3}, x_{5}\}, \{x_{4}, x_{7}\}, \{x_{6}, x_{8}, x_{9}\}\}

于是可得 $R_{1 A} \subseteq R_{1 d},$ $R_{2 A} \subseteq R_{2 d}$ 和 $R_{3 A} \subseteq R_{3 d}$ .因此，根据定义3可知表1是协调多源决策表.

2 两类多源决策规则及其支持度、覆盖度

在协调决策表中，通过对比分析条件属性和决策属性之间的关系，可以得到决策规则如下.

定义4^[20] 设 $D T = (U, A, F, d)$ 为协调决策表.对于任意 $x \in U$ ，必有 $[x] {}_{d}$ 存在，使得 $[x] {}_{A}\subseteq [x] {}_{d}$ ，于是得到决策规则r，即：

I f \underset{a_{l} \in A}{\land} (a_{l}, f_{l} (x)), t h e n d = f_{d} (x)

简记为：

(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \Rightarrow d = f_{d} (x)

对于决策规则r，记其支持度为 $μ (r)$ ，即 $μ (r) = \frac{|[x] {}_{A}⋂ [x] {}_{d}|}{|U|}$ ，其前提记作pre(r)，结论记作con(r)，所有决策规则构成的集合记作 $Ω$ .

此外，由定义4可知，在协调决策表中，决策规则的个数等于条件等价类的个数，即 $|Ω| = |U / R_{A}|$ .由此可以得出结论：协调决策表中信息系统的划分约简不仅可以简化决策规则的前件，还可以保持该决策表的决策规则个数不变.

记 $D T_{k}$ 的所有决策规则构成的集合为 $Ω_{k}$ ，称 $Ω_{M} = \cup_{k = 1}^{s} Ω_{k}$ 为 $M D T$ 的决策规则集.也就是说，称所有数据源中的决策规则构成的集合为多源决策表的决策规则集.

例2（续例1）针对表1的协调多源决策表，每一个决策表 $D T_{k} (k = 1,2, 3)$ 的决策规则集及相应的支持度如下所示.

$D T_{1}$ 中的决策规则及相应的支持度为：

r₁₁:(3,2,2,1)⇒d=1， $μ (r_{11}) = \frac{2}{9}$

r₁₂:(3,2,3,2)⇒d=2， $μ (r_{12}) = \frac{2}{9}$

r₁₃:(4,3,3,2)⇒d=3， $μ (r_{13}) = \frac{2}{9}$

r₁₄:(4,3,3,3)⇒d=3， $μ (r_{14}) = \frac{3}{9}$

$D T_{2}$ 中的决策规则及相应的支持度为：

r₂₁:(2,2,2,1)⇒d=1， $μ (r_{21}) = \frac{3}{9}$

r₂₂:(3,2,3,2)⇒d=2， $μ (r_{22}) = \frac{1}{9}$

r₂₃:(3,3,3,2)⇒d=2， $μ (r_{23}) = \frac{3}{9}$

r₂₄:(4,3,3,2)⇒d=3， $μ (r_{24}) = \frac{2}{9}$

$D T_{3}$ 中的决策规则及相应的支持度为：

r₃₁:(2,2,2,1)⇒d=1， $μ (r_{31}) = \frac{3}{9}$

r₃₂:(3,2,3,2)⇒d=2， $μ (r_{32}) = \frac{2}{9}$

r₃₃:(4,3,3,3)⇒d=3， $μ (r_{33}) = \frac{2}{9}$

r₃₄:(4,3,3,4)⇒d=3， $μ (r_{34}) = \frac{2}{9}$

于是， $M D T$ 的决策规则集 $Ω_{M}$ 为：

r₁:(2,2,2,1)⇒d=1

r₂:(3,2,2,1)⇒d=1

r₃:(3,2,3,2)⇒d=2

r₄:(3,3,3,2)⇒d=2

r₅:(4,3,3,2)⇒d=3

r₆:(4,3,3,3)⇒d=3

r₇:(4,3,3,4)⇒d=3

由例2的结果可以看出，多源决策表的决策规则与决策表的决策规则在结构上没有任何区别，这使得多源数据源头多的这一特点并未充分的体现在获取的决策规则中.

为解决这一问题，针对协调多源决策表，分别从数据源和决策规则的结论出发，对其决策规则集进行融合，给出第一类多源决策规则和第二类多源决策规则的概念.

2.1　第一类多源决策规则

定义5 设 $M D T$ 是协调多源决策表， $Ω_{M}$ 是其决策规则集， $ℱ = \{F_{k}| k = 1,2, \dots, s\}$ 是其数据源集合， $N \subseteq ℱ$ ， $N \neq \emptyset$ .若对任意的 $F_{h} \in N$ ，都有 $Ω_{M}$ 中的决策规则 $(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \Rightarrow d = f_{d} (x)$ 成立，则记：

(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \overset{N}{\Rightarrow} d = f_{d} (x)

进一步，若对任意的 $F_{z} \in ℱ - N$ ，有

(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \overset{N \cup F_{z}}{\Rightarrow} d = f_{d} (x)

不成立，则称 $(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \overset{N}{\Rightarrow} d = f_{d} (x)$ 为第一类多源决策规则，记作 $r_{p r e}^{M}$ .

第一类多源决策规则实质上是在多源决策表的决策规则中增加了数据源的信息，该类多源决策规则 $(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \overset{N}{\Rightarrow} d = f_{d} (x)$ 可解释为：决策规则 $(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \Rightarrow d = f_{d} (x)$ 在 $N \subseteq ℱ$ 中的每一个数据源下都成立，且 $N$ 是最大的满足此条件的数据源子集.

称 $M D T$ 的所有第一类多源决策规则构成的集合为第一类多源决策规则集，记作 $Ω_{M}^{Ι}$ .由定义5可知 $M D T$ 的第一多源决策规则的个数与其决策规则的个数相同，即 $|Ω_{M}^{Ι}| = |Ω_{M}|$ .于是， $Ω_{M}^{Ι}$ 可表示为：

Ω_{M}^{Ι} = \{p r e (r) \overset{N}{\Rightarrow} c o n (r) |r \in Ω_{M}, N \subseteq ℱ\}

由于第一类多源决策规则融入了数据源的信息，比决策规则包含的知识更为丰富，从而此类多源决策规则的度量方式也应当加入数据源这个因素.根据第一类多源决策规则和决策规则之间的关系，将决策规则 $(f_{1} (x), f_{2} (x), \dots, f_{|A|} (x)) \Rightarrow d = f_{d} (x)$ 在 $N \subseteq ℱ$ 的各个数据源中支持度的最大值定义为第一类多源决策规则的支持度，将决策规则在所有数据源 $ℱ$ 中出现的频率定义为其覆盖度.具体的定义形式如下.

定义6 设 $M D T$ 是协调多源决策表， $Ω_{M}^{Ι}$ 是其第一类多源决策规则集， $N \subseteq ℱ$ .则：

(1) $\forall p r e (r) \overset{N}{\Rightarrow} c o n (r) \in Ω_{M}^{Ι}$ ，定义其支持度为：

μ (p r e (r) \overset{N}{\Rightarrow} c o n (r)) = \underset{i \leq |N|}{m a x} \{μ_{i} (r) : r \in Ω_{M}\}

其中 $μ_{i} (r)$ 是决策规则 $r$ 在第 $i$ 个数据源中的支持度；

(2) $\forall p r e (r) \overset{N}{\Rightarrow} c o n (r) \in Ω_{M}^{Ι}$ ，定义其覆盖度为：

ψ (p r e (r) \overset{N}{\Rightarrow} c o n (r)) = \frac{|N|}{|ℱ|}

例3（续例2）结合例2的结果，根据定义5可得表1所示协调多源决策表的第一类多源决策规则为：

r_{1}_{p r e}^{M} : (2,2, 2,1) \overset{(F_{2}, F_{3})}{\Rightarrow} d = 1

r_{2}_{p r e}^{M} : (3,2, 2,1) \overset{(F_{1})}{\Rightarrow} d = 1

r_{3}_{p r e}^{M} : (3,2, 3,2) \overset{ℱ}{\Rightarrow} d = 2

r_{4}_{p r e}^{M} : (3,3, 3,2) \overset{(F_{2})}{\Rightarrow} d = 2

r_{5}_{p r e}^{M} : (4,3, 3,2) \overset{(F_{1}, F_{2})}{\Rightarrow} d = 3

r_{6}_{p r e}^{M} : (4,3, 3,3) \overset{(F_{1}, F_{3})}{\Rightarrow} d = 3

r_{7}_{p r e}^{M} : (4,3, 3,4) \overset{(F_{3})}{\Rightarrow} d = 3

进一步，根据定义6，可得每一个第一类多源决策规则的支持度和覆盖度分别为：

μ (r_{1}_{p r e}^{M}) = \frac{3}{9}

，

ψ (r_{1}_{p r e}^{M}) = \frac{2}{3}

μ (r_{2}_{p r e}^{M}) = \frac{2}{9}

，

ψ (r_{2}_{p r e}^{M}) = \frac{1}{3}

μ (r_{3}_{p r e}^{M}) = \frac{2}{9}

，

ψ (r_{3}_{p r e}^{M}) = 1

μ (r_{4}_{p r e}^{M}) = \frac{3}{9}

，

ψ (r_{4}_{p r e}^{M}) = \frac{1}{3}

μ (r_{5}_{p r e}^{M}) = \frac{2}{9}

，

ψ (r_{5}_{p r e}^{M}) = \frac{2}{3}

μ (r_{6}_{p r e}^{M}) = \frac{3}{9}

，

ψ (r_{6}_{p r e}^{M}) = \frac{2}{3}

μ (r_{7}_{p r e}^{M}) = \frac{2}{9}

，

ψ (r_{7}_{p r e}^{M}) = \frac{1}{3}

2.2　第二类多源决策规则

接下来，以决策规则的结论为切入点，给出第二类多源决策规则的定义.为了叙述方便，在此先给出以下记号.

设 $Ω_{M}$ 是协调多源决策表 $M D T$ 的决策规则集，记：

R_{d (v)} = \{(r_{p}, r_{q}) |c o n (r_{p}) = c o n (r_{q}), r_{p}, r_{q} \in Ω_{M}\}

{[r_{p}]}_{d (v)} = \{r_{q} |(r_{p}, r_{q}) \in R_{d (v)}\}

Ω_{M} / R_{d (v)} = \{{[r_{p}]}_{d (v)} |r_{p} \in Ω_{M}\}

则 $R_{d (v)}$ 是 $Ω_{M}$ 的一个等价关系， ${[r_{p}]}_{d (v)}$ 是其等价类， $Ω_{M} / R_{d (v)}$ 是 $Ω_{M}$ 的一个划分.其中 $d (v)$ 表示决策属性 $d$ 的取值为 $v$ .

定义7^[19] 设 $M D T$ 是协调多源决策表， $Ω_{M}$ 为其决策规则集. $\forall r_{p} \in Ω_{M}$ ，称：

(\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v

为协调多源决策表的第二类多源决策规则，记作 $r_{d (v)}^{M}$ .

由定义7可知，第二类多源决策规则是依据决策属性的取值将多源决策表的部分决策规则的前件通过逻辑“或”运算“ $\lor$ ”进行融合而得到的.第二类多源决策规则 $(\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v$ 可解释为： ${[r_{p}]}_{d (v)}$ 中所有决策规则的前提，其结论都为 $d = v$ .

称 $M D T$ 的所有第二类多源决策规则构成的集合为第二类多源决策规则集，记作 $Ω_{M}^{Ι Ι}$ .则由定义7可知 $|Ω_{M}^{Ι Ι}| = |V_{d}|$ .将 $Ω_{M}^{Ι Ι}$ 表示为：

Ω_{M}^{Ι Ι} = \{(\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v |r_{p}, r_{q} \in Ω_{M}, v \in V_{d}\}

第二类多源决策规则反映了多源决策表中决策规则的共性，结合该特点，将 ${[r_{p}]}_{d (v)}$ 中决策规则支持度的最大值定义为第二类多源决策规则 $r_{d (v)}^{M}$ 的支持度，将 ${[r_{p}]}_{d (v)}$ 中决策规则在全体数据源中出现频率的最大值定义为 $r_{d (v)}^{M}$ 的覆盖度.下面给出第二类多源决策规则集的支持度和覆盖度的概念.

定义8 设 $M D T$ 是协调多源决策表， $Ω_{M}^{Ι Ι}$ 是其第二类多源决策规则集.则:

(1) $\forall (\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v \in Ω_{M}^{Ι Ι}$

定义其支持度为：

\begin{array}{l} μ ((\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v) = \\ \underset{j \leq |{[r_{p}]}_{d (v)}|}{m a x} \{μ^{j} (r_{q}) : r_{q} \in {[r_{p}]}_{d (v)}\} \end{array}

其中, $μ^{j} (r_{q})$ 是 ${[r_{p}]}_{d (v)}$ 中第 $j$ 个决策规则 $r_{q}$ 的支持度.

(2) $\forall (\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v \in Ω_{M}^{Ι Ι}$

定义其覆盖度为：

\begin{array}{l} ψ ((\underset{r_{q} \in {[r_{p}]}_{d (v)}}{\lor} p r e (r_{q})) \Rightarrow d = v) = \\ m a x \{\frac{|H_{q}|}{|ℱ|} : r_{q} \in {[r_{p}]}_{d (v)}\} \end{array}

其中 $H_{q} = \{k |r_{q} \in Ω_{k}\}$ 是具有决策规则 $r_{q}$ 的数据源集合.

例4（续例2）针对表1的协调多源决策表，由例2和定义7可得第二类多源决策规则集 $Ω_{M}^{Ι Ι}$ 为：

r_{d (1)}^{M} :

(2,2,2,1)∨(3,2,2,1)⇒d=1

r_{d (2)}^{M} :

(3,2,3,2)∨(3,3,3,2)⇒d=2

r_{d (3)}^{M} :

(4,3,3,3)∨(4,3,3,2)∨(4,3,3,4)⇒d=3

根据定义8可得第二类多源决策规则的支持度和覆盖度如下所示：

μ (r_{d (1)}^{M}) = \frac{3}{9}

，

ψ (r_{d (1)}^{M}) = \frac{2}{3}

μ (r_{d (2)}^{M}) = \frac{3}{9}

，

ψ (r_{d (2)}^{M}) = 1

μ (r_{d (3)}^{M}) = \frac{3}{9}

，

ψ (r_{d (3)}^{M}) = \frac{2}{3}

2.3　两类多源决策规则之间的联系

第一类多源决策规则与决策规则相比增加了数据源的信息，而第二类多源决策规则与决策规则相比前件包含的信息量更多.除此之外，这两类多源决策规则之间具有下述的关系.

定理1 设 $M D T$ 是协调多源决策表， $Ω_{M}^{Ι}$ 是其第一类多源决策规则集. $\forall r_{p r e}^{M} \in Ω_{M}^{Ι}$ ，记：

Y_{d (v)} = \{p r e (r_{p r e}^{M}) |c o n (r_{p r e}^{M}) = (d = v)\}

则一定存在 $r_{d (v)}^{M} \in Ω_{M}^{Ι Ι}$ ，有 $(\lor Y_{d (v)}) = p r e (r_{d (v)}^{M})$ .

证明 $\forall r_{q}_{p r e}^{M} \in Ω_{M}^{Ι}$ ， $\exists r_{q} \in Ω_{M}$ ，由定义5知 $p r e (r_{q}_{p r e}^{M}) = p r e (r_{q})$ ， $c o n (r_{q}_{p r e}^{M}) = c o n (r_{q})$ .因此可得：

Y_{d (v)} = \{p r e (r_{q}) |c o n (r_{q}) = (d = v)\}

从而有：

Y_{d (v)} = \{p r e (r_{q}) |r_{q} \in {[r_{p}]}_{d (v)}\}

进一步，根据定义7可得：

(\lor Y_{d (v)}) \Rightarrow d = v

为第二类多源决策规则，即：

(\lor Y_{d (v)}) = p r e (r_{d (v)}^{M})

定理1表明可以通过第一类多源决策规则得到第二类多源决策规则.

根据多源决策表的两类多源决策规则之间的联系以及它们与决策规则之间的关系，下面给出两类多源决策规则的另一种获取方法.

3 两类多源决策规则的获取及其简化

3.1　两类多源决策规则的获取

从多源信息系统 $M I S = \{I S_{k}| I S_{k} = (U, A, F_{k}), k = 1,2, \dots, s\}$ 的结构上分析，其可以看作是将构成 $M I S$ 的 $s$ 个信息系统 $I S_{k} = (U, A, F_{k})$ 按水平方向放置得到的数据表.如果将这 $s$ 个信息系统按竖直方向放置，并将 $I S_{k}$ 中的对象集记为 $\{(k, x) |x \in U\}$ ，则 $I S_{k}$ 可表示为 $(\{(k, x) |x \in U\}, A, F)$ .继而，该多源信息系统可表示为：

(\cup_{k = 1}^{s} \{(k, x) |x \in U\}, A, F)

其中，

F = \{f_{l} : \cup_{k = 1}^{s} \{(k, x) |x \in U\} \to V_{l} (l \leq |A|, a_{l} \in A)\}

该数据表的结构与信息系统的一致，称该数据表为 $M I S$ 的单源化信息系统，记为 $M_{I S}$ ，并称这一过程为多源信息系统的单源化.

对于任意一个多源信息系统，都可以转化为一个与其对应的信息系统.类似地，对于任意一个多源决策表，也都可以转化为一个与其对应的决策表.为了便于叙述，下面给出单源化决策表的形式化定义.

定义9 设 $M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,$

$F_{k}, d_{k}), k = 1,2, \dots, s\}$ 是多源决策表， $(\overset{\cdot}{U}, A, F, d)$

是决策表，其中，

\overset{\cdot}{U} = \cup_{k = 1}^{s} \{(k, x) |x \in U\}, d : \overset{\cdot}{U} \to V_{d}

为关系集.若 $\forall x \in U$ ， $\exists k \in \{1,2, \dots, s\},$ 使 $f_{k l} (x) =$

$f_{l} ((k, x)) (a_{l} \in A)$ ， $d_{k} (x) = d ((k, x))$ ，则称 $(\overset{\cdot}{U}, A, F, d)$ 为 $M D T$ 的单源化决策表，记为：

M_{D T} = (\cup_{k = 1}^{s} \{(k, x) |x \in U\}, A, F, d)

由定义2和定义9可得，对任意 $k \in \{1,2, \dots, s\}$ ，有：

\begin{array}{l} \{f_{k l} : U \to V_{l} (l \leq |A|, a_{l} \in A)\} = \\ \{f_{l} : \cup_{k = 1}^{s} \{(k, x) |x \in U\} \to V_{l} (l \leq |A|, a_{l} \in A)\} \end{array}

即： $ℱ = F$ .

记单源化决策表 $M_{D T}$ 的条件属性集对应的划分为 $\overset{\cdot}{U} / R_{A} = \{E_{t} |t \in τ\}$ ，决策属性对应的划分为 $\overset{\cdot}{U} / R_{d} = \{H_{w} |w \in σ\}$ ，其中 $τ$ 和 $σ$ 为指标集.

由单源化决策表的定义可知：若 $M D T$ 是协调多源决策表，则 $M_{D T}$ 为协调决策表；反之亦然.因此，可以通过判断单源化决策表 $M_{D T}$ 的协调性得到多源决策表 $M D T$ 的协调性.

例5（续例1）考查表1的多源决策表，其单源化决策表如表2所示.

表2 表1的单源化决策表 $M_{D T}$

Table 2 A unisource decision table $M_{D T}$ of Table 1

	a₁	a₂	a₃	a₄	d
(1,x₁)	4	3	3	3	3
(1,x₂)	4	3	3	3	3
(1,x₃)	4	3	3	3	3
(1,x₄)	4	3	3	2	3
(1,x₅)	3	2	3	2	2
(1,x₆)	3	2	2	1	1
(1,x₇)	4	3	3	2	3
(1,x₈)	3	2	3	2	2
(1,x₉)	3	2	2	1	1
(2,x₁)	4	3	3	2	3
(2,x₂)	4	3	3	2	3
(2,x₃)	3	3	3	2	2
(2,x₄)	3	2	3	2	2
(2, x₅)	3	3	3	2	2
(2,x₆)	2	2	2	1	1
(2,x₇)	3	3	3	2	2
(2,x₈)	2	2	2	1	1
(2,x₉)	2	2	2	1	1
(3,x₁)	4	3	3	4	3
(3,x₂)	4	3	3	3	3
(3,x₃)	4	3	3	3	3
(3,x₄)	3	2	3	2	2
(3,x₅)	4	3	3	4	3
(3,x₆)	2	2	2	1	1
(3,x₇)	3	2	3	2	2
(3,x₈)	2	2	2	1	1
(3,x₉)	2	2	2	1	1

新窗口打开| 下载CSV

由表2可得， $\overset{\cdot}{U} / R_{A}$ 中的元素分别为：

E_{1} = \{(1, x_{6}), (1, x_{9})\}

E_{2} = \{(2, x_{6},) (2, x_{8}), (2, x_{9}), (3, x_{6}), (3, x_{8},), (3, x_{9})\}

E_{3} = \{(1, x_{5}), (1, x_{8}), (2, x_{4}), (3, x_{4}), (3, x_{7})\},

E_{4} = \{(2, x_{3}), (2, x_{5}), (2, x_{7})\},

E_{5} = \{(1, x_{1}), (1, x_{2}), (1, x_{3}), (3, x_{2}), (3, x_{3})\}

E_{6} = \{(1, x_{4}), (1, x_{7}), (2, x_{1}), (2, x_{2})\}

E_{7} = \{(3, x_{1}), (3, x_{5})\} .

$\overset{\cdot}{U} / R_{d}$ 中的元素分别为：

\begin{array}{l} H_{1} = \{(1, x_{6}), (1, x_{9}), (2, x_{6}), (2, x_{8}), (2, x_{9}), (3, x_{6}), \\ (3, x_{8}), (3, x_{9})\} \end{array}

\begin{array}{l} H_{2} = \{(1, x_{5}), (1, x_{8}), (2, x_{3}), (2, x_{4}), (2, x_{5}), (2, x_{7}), \\ (3, x_{4}), (3, x_{7})\} \end{array}

\begin{array}{l} H_{3} = \{(1, x_{1}), (1, x_{2}), (1, x_{3}), (1, x_{4}), (1, x_{7}), (2, x_{1}), \\ (2, x_{2}), (3, x_{1}), (3, x_{2}), (3, x_{3}), (3, x_{5})\} \end{array}

由此可以判定表2所示的决策表是协调的.

对于协调单源化决策表，由于 $\overset{\cdot}{U} / R_{A}$ 中每一个元素对应一条决策规则.因此，若记 $r_{E}^{i}$ 为等价类 $E_{i}$ 对应的决策规则，则 $E_{i}$ 与 $r_{E}^{i}$ 之间是一一对应关系.于是，记 $M_{D T}$ 的决策规则集为 $Ω_{E}$ ，且将 $Ω_{E}$ 可表示为：

Ω_{E} = \{r_{E}^{i} |E_{i} \in \overset{\cdot}{U} / R_{A}, i \leq |\overset{\cdot}{U} / R_{A}|\}

下面给出协调多源决策表的决策规则与其单源化决策表的决策规则之间的联系.

定理2 设 $M_{D T}$ 是协调多源决策表 $M D T$ 的单源化决策表.则有 $Ω_{E} = Ω_{M}$ .

证明根据定义4可知，协调决策表中每一个条件等价类对应一条决策规则.因此，对于协调多源决策表 $M D T$ 中的每一个决策表 $D T_{k} = (U, A ⋃ d, F_{k}, d_{k})$ ，均有：

Ω_{k} = \{r_{k E}^{j} |E_{k j} \in U / R_{k A}, j \leq |U / R_{k A}|\}

其中， $r_{k E}^{j}$ 是由第 $j$ 个条件等价类 $E_{k j}$ 确定的决策规则，继而可得：

Ω_{M} = \cup_{k = 1}^{s} Ω_{k} = \cup_{k = 1}^{s} \{r_{k E}^{j} |E_{k j} \in U / R_{k A}, j \leq |U / R_{k A}|\}

又由定义2和定义9可得 $ℱ = F$ ，即：

\begin{array}{l} \{f_{k l} : U \to V_{l} (l \leq |A|, a_{l} \in A)\} = \\ \{f_{l} : \cup_{k = 1}^{s} \{(k, x) |x \in U\} \to V_{l} (l \leq |A|, a_{l} \in A)\} \end{array}

且有：

Ω_{E} = \{r_{E}^{i} |E_{i} \in \overset{\cdot}{U} / R_{A}, i \leq |\overset{\cdot}{U} / R_{A}|\}

因此可知：

⋃ \{p r e (r_{k E}^{i}) |r_{k E}^{i} \in Ω_{M}\} = ⋃ \{p r e (r_{E}^{i}) |r_{E}^{i} \in Ω_{E}\}

从而可证 $Ω_{E} = Ω_{M}$ .

定理2表明可由协调多源决策表 $M D T$ 的单源化决策表 $M_{D T}$ 获取其决策规则集.

结合定理2以及第一类多源决策规则的定义，可得下述由协调多源决策表的单源化决策表获取第一类多源决策规则的方法.

定理3 设：

M_{D T} = (\cup_{k = 1}^{s} \{(k, x) |x \in U\}, A, F, d)

是协调多源决策表 $M D T$ 的单源化决策表， $\overset{\cdot}{U} / R_{A}$ 是其条件属性集对应的划分， $Ω_{E}$ 是其决策规则集.定义映射 $g : \overset{\cdot}{U} / R_{A} \to ℱ$ 如下：

g (E_{i}) = \{F_{k} |(k, x) \in E_{i}, \forall E_{i} \in \overset{\cdot}{U} / R_{A}\}

则有：

Ω_{M}^{Ι} = \{p r e (r_{E}^{i}) \overset{g (E_{i})}{\Rightarrow} c o n (r_{E}^{i}) |E_{i} \in \overset{\cdot}{U} / R_{A}, i \leq |\overset{\cdot}{U} / R_{A}|\}

其中， $ℱ = \{F_{k}| k = 1,2, \dots, s\}$ 为 $M D T$ 的数据源集合.

证明由定理2知 $Ω_{E} = Ω_{M}$ ，即对任意 $r_{E}^{i} \in Ω_{E}$ ，存在 $r \in Ω_{M}$ ，使得 $p r e (r) = p r e (r_{E}^{i}),$

$c o n (r) = c o n (r_{E}^{i})$ ，进而由 $|Ω_{M}| = |Ω_{M}^{I}|$ ，可得：

|Ω_{M}^{I}| = |Ω_{E}| = |\overset{\cdot}{U} / R_{A}|

进一步，由映射 $g$ 的定义以及等价类与决策规则的关系可知， $g (E_{i})$ 是最大的使得 $p r e (r_{E}^{i}) \overset{g (E_{i})}{\Rightarrow} c o n (r_{E}^{i})$ 成立的数据源子集，因此，根据定义5可知 $p r e (r_{E}^{i}) \overset{g (E_{i})}{\Rightarrow} c o n (r_{E}^{i})$ 是第一类多源决策规则.从而可证：

\begin{array}{l} Ω_{M}^{Ι} = \\ \{p r e (r_{E}^{i}) \overset{g (E_{i})}{\Rightarrow} c o n (r_{E}^{i}) |E_{i} \in \overset{\cdot}{U} / R_{A}, i \leq |\overset{\cdot}{U} / R_{A}|\} \end{array}

此外，通过结合定理1和定理2，可得由协调多源决策表的单源化决策表获取第二类多源决策规则的方法如下.

定理4 设：

M_{D T} = (\cup_{k = 1}^{s} \{(k, x) |x \in U\}, A, F, d)

是协调多源决策表 $M D T$ 的单源化决策表， $Ω_{E}$ 是 $M_{D T}$ 的决策规则集. $\forall v \in V_{d}$ ，定义：

Y_{d (v)} = \{p r e (r_{E}^{i}) |c o n (r_{E}^{i}) = d (v)\}

则有：

Ω_{M}^{Ι Ι} = \{(\lor Y_{d (v)}) \Rightarrow d = v |v \in V_{d}\}

证明由定理1和定理2易证.

例6（续例5）对于表2的单源化决策表，其等价类所对应的数据表如表3所示.

表3 表2的简化表

Table 3 A simplified table of Table 2

$\overset{\cdot}{U} / R_{A}$	a₁	a₂	a₃	a₄	d
E₁	2	2	2	1	1
E₂	3	2	2	1	1
E₃	3	2	3	2	2
E₄	3	3	3	2	2
E₅	4	3	3	2	3
E₆	4	3	3	3	3
E₇	4	3	3	4	3

新窗口打开| 下载CSV

根据表3，由条件等价类与决策规则之间的联系，易得表2单源化决策表的决策规则为：

r_{E}^{1} :

(2,2,2,1)⇒d=1

r_{E}^{2} :

(3,2,2,1)⇒d=1

r_{E}^{3} :

(3,2,3,2)⇒d=2

r_{E}^{4} :

(3,3,3,2)⇒d=2

r_{E}^{5} :

(4,3,3,2)⇒d=3

r_{E}^{6} :

(4,3,3,3)⇒d=3

r_{E}^{7} :

(4,3,3,4)⇒d=3

该结果与例2中多源决策表的决策规则集是完全相同的.由此也验证了定理2的结论.

此外，由映射 $g$ 可得：

g (E_{1}) = \{F_{2}, F_{3}\}

g (E_{2}) = \{F_{1}\}

g (E_{3}) = \{F_{1}, F_{2}, F_{3}\}

g (E_{4}) = \{F_{2}\}

g (E_{5}) = \{F_{1}, F_{2}\}

g (E_{6}) = \{F_{1}, F_{3}\}

g (E_{7}) = \{F_{3}\}

从而根据定理3便可得到第一类多源决策规则集，其结果与例3一致.

因 $V_{d} = \{1,2, 3\}$ ，故根据定理4可得：

Y_{d (1)} = \{(2,2, 2,1), (3,2, 2,1)\}

Y_{d (2)} = \{(3,2, 3,2), (3,3, 3,2)\}

Y_{d (3)} = \{(4,3, 3,2), (4,3, 3,3), (4,3, 3,4)\}

进而可得到第二类多源决策规则集，其结果与例4一致.

3.2　两类多源决策规则的简化

在决策表中，通过删除冗余的条件属性可以获取简洁、紧凑的决策规则.因此，针对多源决策表，讨论两类多源决策规则的简化问题也非常必要.

下面以保持多源决策表决策规则的恒真性及其个数不变为目标，对其前件进行简化.在本文中称其为保持决策规则不变的约简.

定义10 设：

\begin{array}{l} M D T = \\ \{D T_{k}| D T_{k} = (U, A ⋃ d, F_{k}, d_{k}), k = 1,2, \dots, s\} \end{array}

是多源决策表. $\forall k \in \{1,2, \dots, s\}$ ，若存在 $B \subseteq A$ ，使得 $R_{k B} \subseteq R_{k A}$ 且 $|Ω_{k B}| = |Ω_{k A}|$ ，则称 $B$ 为 $M D T$ 的保持决策规则不变的协调集.进一步，若 $B$ 为保持决策规则不变的协调集，且 $B$ 的任何真子集都不是保持决策规则不变的协调集，则称 $B$ 为 $M D T$ 的保持决策规则不变的约简.其中 $Ω_{k B}$ 是 $(U, B ⋃ d, F_{k}, d_{k})$ 中决策规则的集合.

对于多源决策表：

\begin{array}{l} M D T = \\ \{D T_{k}| D T_{k} = (U, A ⋃ d, F_{k}, d_{k}), k = 1,2, \dots, s\} \end{array}

为方便描述与分析，给出下述一些记号.

$\forall B \subseteq A$ ，记 $Ω_{M_{B}}$ 为由属性子集 $B$ 得到的决策规则集.类似地，记 $Ω_{M_{B}}^{Ι}$ 和 $Ω_{M_{B}}^{Ι Ι}$ 分别为由属性子集 $B$ 得到的第一类和第二类多源决策规则集.对于 $Ω_{M_{B}}$ 中的任意一条决策规则：

I f \underset{a_{l} \in B}{\land} (a_{l}, f_{l} (x)), t h e n d = f_{d} (x)

简记为：

{(f_{l_{1}} (x), f_{l_{2}} (x), \dots, f_{|B|} (x))}_{l_{1} l_{2} \dots |B|} \Rightarrow d = f_{d} (x)

其中，序列 $l_{1} l_{2} \dots l_{|B|}$ 是 $B$ 中属性的下角标对应的

数值.例如，取 $B = \{a_{1}, a_{2}, a_{4}\}$ ，则决策规则 $(a_{1}, 2) \land$

$(a_{2}, 2) \land (a_{4}, 1) \Rightarrow d = 1$ 简记为 ${(2,2, 1)}_{124} \Rightarrow d = 1$ .类似地，对于 $Ω_{M_{B}}^{Ι}$ 和 $Ω_{M_{B}}^{Ι Ι}$ 中的多源决策规则，也有相同的解释.

事实上，根据协调多源决策表 $M D T$ 的定义和多源信息系统 $M I S$ 划分约简的定义可知， $M D T$ 的保持决策规则不变的约简就是其 $M I S$ 的保持划分不变的约简.进一步，根据 $M D T$ 的两类多源决策规则与其决策规则之间的关系，给出这样的定义：若 $B \subseteq A$ 为 $M D T$ 保持决策规则不变的约简，则称 $B$ 为 $M D T$ 的保持第一类和第二类多源决策规则不变的约简.

由于这两类多源决策规则是在多源决策表的决策规则集的基础上得到的，而多源决策表与其单源化决策表具有相同的决策规则集，所以借助单源化决策表中信息系统的划分约简，易得这两类多源决策规则的简化方法如下.

定理5 设：

M_{D T} = (\cup_{k = 1}^{s} \{(k, x) |x \in U\}, A, F, d)

是协调多源决策表 $M D T$ 的单源化决策表， $B \subseteq A$ 是

M_{I S} = (\cup_{k = 1}^{s} \{(k, x) |x \in U\}, A, F)

的划分约简.则 $B$ 为 $M D T$ 的保持第一类和第二类多源决策规则不变的约简.

例7（续例6）对于表2， $B = \{a_{1}, a_{2}, a_{4}\}$ 是其信息系统 $M_{I S}$ 的划分约简.因此， $B = \{a_{1}, a_{2}, a_{4}\}$ 也是保持第一类和第二类多源决策规则不变的约简.根据表3，属性子集B所对应的简化表格如表4所示.

表4 由 $B$ 产生的 $\overset{\cdot}{U}$ 的划分

Table 4 A partition of $\overset{\cdot}{U}$ based on $B$

$\overset{\cdot}{U} / R_{B}$	a₁	a₂	a₄	d
E₁	2	2	1	1
E₂	3	2	1	1
E₃	3	2	2	2
E₄	3	3	2	2
E₅	4	3	2	3
E₆	4	3	3	3
E₇	4	3	4	3

新窗口打开| 下载CSV

简化的决策规则为：

{(2,2, 1)}_{124} \Rightarrow d = 1, {(3,2, 1)}_{124} \Rightarrow d = 1,

{(3,2, 2)}_{124} \Rightarrow d = 2, {(3,3, 2)}_{124} \Rightarrow d = 2,

\begin{array}{l} {(4,3, 3)}_{124} \Rightarrow d = 3, {(4,3, 2)}_{124} \Rightarrow d = 3, \\ {(4,3, 4)}_{124} \Rightarrow d = 3, \end{array}

进而可得简化的第一类多源决策规则为：

r_{1 p r e}^{M_{B}} : {(2,2, 1)}_{124} \overset{(F_{2}, F_{3})}{\Rightarrow} d = 1

r_{2 p r e}^{M_{B}} : {(3,2, 1)}_{124} \overset{(F_{1})}{\Rightarrow} d = 1

r_{3 p r e}^{M_{B}} : {(3,2, 2)}_{124} \overset{ℱ}{\Rightarrow} d = 2

r_{4 p r e}^{M_{B}} : {(3,3, 2)}_{124} \overset{(F_{2})}{\Rightarrow} d = 2

r_{5 p r e}^{M_{B}} : {(4,3, 2)}_{124} \overset{(F_{1}, F_{2})}{\Rightarrow} d = 3

r_{6 p r e}^{M_{B}} : {(4,3, 3)}_{124} \overset{(F_{1}, F_{3})}{\Rightarrow} d = 3

r_{7 p r e}^{M_{B}} : {(4,3, 4)}_{124} \overset{(F_{3})}{\Rightarrow} d = 3

简化的第二类多源决策规则为：

r_{d (1)}^{M_{B}} :

{(2,2, 1)}_{124} \lor {(3,2, 1)}_{124} \Rightarrow d = 1

r_{d (2)}^{M_{B}} :

{(3,2, 2)}_{124} \lor {(3,3, 2)}_{124} \Rightarrow d = 2

r_{d (3)}^{M_{B}} :

{(4,3, 3)}_{124} \lor {(4,3, 2)}_{124} \lor {(4,3, 4)}_{124} \Rightarrow d = 3

需要说明的是，一般情况下信息系统的划分约简不唯一,因此通过删除两类多源决策规则前件中的冗余属性，不仅可以简化规则,还可以增加规则的个数，为决策行为提供更多的有效依据.

4 结论

本文借助多源决策表数据源头多的特点，分别以数据源和决策规则的结论为切入点，提出了第一类和第二类多源决策规则的概念，给出了这两类多源决策规则支持度和覆盖度的度量方法以及两者之间的联系.最后，通过单源化多源决策表，研究了获取两类多源决策规则的方法和保持决策规则不变的约简.后续将进一步基于单源化多源决策表研究不协调多源决策表中的知识获取以及知识融合问题.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

Pawlak

Rough sets

International Journal of Computer & Information Science，1982，11(5)：341-356.

[本文引用: 1]

[2]

常犁云，王国胤，吴渝.

一种基于Rough Set理论的属性约简及规则提取方法

软件学报，1999，10(11)：1206-1211.

[本文引用: 1]

Chang

L Y

，Wang

G Y

，Wu

An approach for attribute reduction and rule generation based on rough set theory

Journal of Software，1999，10(11)：1206-1211.

[本文引用: 1]

[3]

Kryszkiewicz

Rules in incomplete information systems

Information Sciences，1999，113(3-4)：271-292.

[本文引用: 1]

[4]

黄兵，周献中.

不一致决策表中规则提取的矩阵算法

系统工程与电子技术，2005，27(3)：441-445.

[本文引用: 1]

Huang

，Zhou

X Z

Matrix computation for rule extraction in inconsistent decision tables

Systems Engineering and Electronics，2005，27(3)：441-445.

[本文引用: 1]

[5]

钱宇华，梁吉业，曹付元等.

决策表决策规则与知识粒度

电脑开发与应用，2006，19(3)：27-29.

[本文引用: 1]

Qian

Y H

，Liang

J Y

，Cao

F Y

，et al.

Decision rule in decision table and knowledge granulation

Computer Development & Applications，2006，19(3)：27-29.

[本文引用: 1]

[6]

Hao

，Li

J H

，Fan

，et al.

Optimal scale selection in dynamic multi⁃scale decision tables based on sequential three⁃way decisions

Information Sciences，2017，415-416：213-232.

[本文引用: 1]

[7]

Chen

H M

，Li

T R

，Luo

，et al.

A rough set⁃based method for updating decision rules on attribute values' coarsening and refining

IEEE Transactions on Knowledge and Data Engineering，2014，26(12)：2886-2899.

[本文引用: 1]

[8]

W Z

，Qian

Y H

，Li

T J

，et al.

On rule acquisition in incomplete multi⁃scale decision tables

Information Sciences，2017，3781：282-302.

[本文引用: 1]

[9]

Zhang

，Mei

C L

，Chen

D G

，et al.

Multi⁃confidence rule acquisition and confidence⁃preserved attribute reduction in interval⁃valued decision systems

International Journal of Approximate Reasoning，2014，55(8)：1787-1804.

[本文引用: 1]

[10]

Khan

M A

，Banerjee

Formal reasoning with rough sets in multiple⁃source approximation systems

International Journal of Approximate Reasoning，2008，49(2)：466-477.

[本文引用: 1]

[11]

Qian

Y H

，Liang

J Y

，Yao

Y Y

，et al.

MGRS：a multi⁃granulation rough set

Information Sciences，2010，180(6)：949-970.

[12]

Qian

Y H

，Li

S Y

，Liang

J Y

，et al.

Pessimistic rough set based decisions：a multigranulation fusion strategy

Information Sciences，2014，264：196-210.

[13]

Lin

G P

，Liang

J Y

，Qian

Y H

An information fusion approach by combining multigranulation rough sets and evidence theory

Information Sciences，2015，314：184-199.

[14]

Che

X Y

，Mi

J S

，Chen

D G

Information fusion and numerical characterization of a multi⁃source information system

Knowledge⁃Based Systems，2018，145：121-133.

[15]

Che

X Y

，Mi

J S

Attributes set reduction in multigranulation approximation space of a multi⁃source decision information system

International Journal of Machine Learning and Cybernetics，2019，10(9)：2297-2311.

[16]

W H

，Yu

J H

A novel approach to information fusion in multi⁃source datasets：a granular computing viewpoint

Information Sciences，2017，378：410-423.

[17]

Guo

Y T

，Xu

W H

Attribute reduction in multi⁃source decision systems

∥Flores V. Rough Sets. Springer Berlin Heidelberg，2016：558-568.

[18]

林国平，梁吉业，李进金.

多源决策信息系统的决策规则性能评价

模式识别与人工智能，2015，28(7)：657-664.

[本文引用: 1]

Lin

G P

，Liang

J Y

，Li

J J

Evaluation of decision rules performance for multi⁃source decision information systems

Pattern Recognition and Artificial Intelligence，2015，28(7)：657-664.

[本文引用: 1]

[19]

万青，马盈仓，魏玲.

基于多粒度的多源数据知识获取

山东大学学报(理学版)，2020，55(1)：41-50.

[本文引用: 8]

Wan

，Ma

Y C

，Wei

Knowledge acquisition of multi⁃source data based on multigranularity

Journal of Shandong University (Natural Science)，2020，55(1)：41-50.

[本文引用: 8]

[20]

张文修，仇国芳. 基于粗糙集的不确定决策. 北京：清华大学出版社，2005：66-67.

[本文引用: 1]

Rough sets

1982

... 粗糙集理论(Rough Set Theory)^[1]是知识发现的重要工具，而规则提取是粗糙集理论的研究热点.在粗糙集理论中，数据的具体表现形式为信息系统.信息系统是一个二维数据表，记为(U,A,F)，其中U是对象集，A是属性集，F是U和A之间的关系集.进一步，若将属性分为条件属性A和决策属性d，则可得到决策表(U,A,F,d).在决策表中，通过研究两类属性的关系可以获得决策知识，即决策规则. ...

一种基于Rough Set理论的属性约简及规则提取方法

1999

... 目前，针对决策表，已有许多学者研究了其决策规则提取问题.例如，常犁云等^[2]从属性约简和值约简两方面同时出发简化了决策表的决策规则；Kryszkiewicz^[3]针对不完备决策表提出了获取所有最优确定决策规则的方法；黄兵和周献中^[4]基于矩阵的方法，利用条件属性矩阵和决策矩阵研究不协调决策表的决策规则提取方法；钱宇华等^[5]探讨了决策表中的粒度思想，并建立了知识粒度与决策规则置信度之间的动态关系；Hao et al^[6]将多粒度粗糙集中的决策规则与形式概念分析中的决策规则进行了比较研究；Chen et al^[7]在不协调决策表中研究了由属性值的粗化和细化所引起的决策规则更新问题；Wu et al^[8]针对不完备多粒度标记决策表在协调和不协调两种情况下研究了决策规则提取问题；Zhang et al^[9]在区间集决策表中引入一个评估决策规则覆盖能力的度量，通过设置阈值得到了具有较高置信度且具有较强覆盖能力的决策规则. ...

一种基于Rough Set理论的属性约简及规则提取方法

1999

Rules in incomplete information systems

1999

不一致决策表中规则提取的矩阵算法

2005

不一致决策表中规则提取的矩阵算法

2005

决策表决策规则与知识粒度

2006

决策表决策规则与知识粒度

2006

Optimal scale selection in dynamic multi?scale decision tables based on sequential three?way decisions

2017

A rough set?based method for updating decision rules on attribute values' coarsening and refining

2014

On rule acquisition in incomplete multi?scale decision tables

2017

Multi?confidence rule acquisition and confidence?preserved attribute reduction in interval?valued decision systems

2014

Formal reasoning with rough sets in multiple?source approximation systems

2008

... 现今，针对多源数据的研究主要集中在信息融合和约简两个方面^[10-19]，而关于多源决策表的决策规则，目前的研究相对较少.其中，林国平等^[18]基于多粒度粗糙集研究了决策规则评价函数的融合方法，给出了决策规则的整体评价指标.万青等^[19]基于新提出的多源决策表，从乐观策略的角度给出了多源决策规则的定义.而对于多源决策表，从多个层次、多个粒度对其展开分析，可以同时从不同角度挖掘数据中潜在的有用知识，进而对其进行有效融合，可为决策行为提供更多有效的依据. ...

MGRS：a multi?granulation rough set

2010

Pessimistic rough set based decisions：a multigranulation fusion strategy

2014

An information fusion approach by combining multigranulation rough sets and evidence theory

2015

Information fusion and numerical characterization of a multi?source information system

2018

Attributes set reduction in multigranulation approximation space of a multi?source decision information system

2019

A novel approach to information fusion in multi?source datasets：a granular computing viewpoint

2017

Attribute reduction in multi?source decision systems

2016

多源决策信息系统的决策规则性能评价

2015

多源决策信息系统的决策规则性能评价

2015

基于多粒度的多源数据知识获取

2020

... [19]基于新提出的多源决策表，从乐观策略的角度给出了多源决策规则的定义.而对于多源决策表，从多个层次、多个粒度对其展开分析，可以同时从不同角度挖掘数据中潜在的有用知识，进而对其进行有效融合，可为决策行为提供更多有效的依据. ...

... 为了达到从多个角度、多个层次出发分析多源数据的目的，本文在万青等^[19]研究的基础上，进一步研究多源决策表的决策规则获取问题.首先针对协调多源决策表，分别以数据源和决策规则的结论为切入点，定义第一类多源决策规则和第二类多源决策规则的概念；其次，为了刻画这两类多源决策规则的数字特征，给出了其支持度和覆盖度的定义，并讨论了这两类多源决策规则之间的联系；最后，提出了单源化决策表的定义，基于此研究了两类多源决策规则的获取方法，继而提出保持两类多源决策规则不变的约简. ...

... 定义1^[19] 称

M I S = \{I S_{k}| I S_{k} = (U, A, F_{k}),

...

... 定义2^[19] 称

M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,

...

... 定义3^[19] 设

M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,

...

... 例1^[19]表1是一个中学教师课堂教学评议表.其中

U = \{x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}, x_{7}, x_{8}, x_{9}\}

是对象集，分别代表语文、数学、英语、历史、地理、政治、生物、化学和物理共九门课程的代课教师；

A = \{a_{1}, a_{2}, a_{3}, a_{4}\}

是条件属性集，分别代表教学态度、教学内容、教学方法和教学效果四个指标，其值域均为

\{1,2, 3,4\}

，分别代表

[60,70]

(70, 80]

(80, 90]

(90, 100]

四个分数段;

ℱ = \{F_{1}, F_{2}, F_{3}\}

是数据源的集合，分别代表三个教学班级；

d

是决策属性，表示评价结果，其值域为

V_{d} = \{1,2, 3\}

，分别表示中、良和优. ...

... 定义7^[19] 设

M D T

是协调多源决策表，

Ω_{M}

为其决策规则集.

\forall r_{p} \in Ω_{M}

，称： ...

基于多粒度的多源数据知识获取

2020

... 定义1^[19] 称

M I S = \{I S_{k}| I S_{k} = (U, A, F_{k}),

...

... 定义2^[19] 称

M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,

...

... 定义3^[19] 设

M D T = \{D T_{k}| D T_{k} = (U, A ⋃ d,

...

... 例1^[19]表1是一个中学教师课堂教学评议表.其中

U = \{x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}, x_{7}, x_{8}, x_{9}\}

是对象集，分别代表语文、数学、英语、历史、地理、政治、生物、化学和物理共九门课程的代课教师；

A = \{a_{1}, a_{2}, a_{3}, a_{4}\}

是条件属性集，分别代表教学态度、教学内容、教学方法和教学效果四个指标，其值域均为

\{1,2, 3,4\}

，分别代表

[60,70]

(70, 80]

(80, 90]

(90, 100]

四个分数段;

ℱ = \{F_{1}, F_{2}, F_{3}\}

是数据源的集合，分别代表三个教学班级；

d

是决策属性，表示评价结果，其值域为

V_{d} = \{1,2, 3\}

，分别表示中、良和优. ...

... 定义7^[19] 设

M D T

是协调多源决策表，

Ω_{M}

为其决策规则集.

\forall r_{p} \in Ω_{M}

，称： ...

2005

... 定义4^[20] 设

D T = (U, A, F, d)

为协调决策表.对于任意

x \in U

，必有

[x] {}_{d}

存在，使得

[x] {}_{A}\subseteq [x] {}_{d}

，于是得到决策规则r，即： ...

〈

〉