南京大学学报(自然科学), 2022, 58(1): 82-93 doi: 10.13232/j.cnki.jnju.2022.01.009

基于极大相容块的不完备信息处理新方法及其应用

王敬前1, 张小红,1,2

1.陕西科技大学数学与数据科学学院, 西安, 710021

2.陕西省人工智能联合实验室, 陕西科技大学, 西安, 710021

A new method of incomplete information processing based on maximal consistent block and its application

Wang Jingqian1, Zhang Xiaohong,1,2

1.School of Mathematics and Data Science, Shanxi University of Science and Technology, Xi'an, 710021, China

2.Shanxi Joint Laboratory of Artificial Intelligence, Shanxi University of Science and Technology, Xi'an, 710021, China

通讯作者: E⁃mail:zhangxiaohong@sust.edu.cn

收稿日期: 2021-07-12  

基金资助: 国家自然科学基金.  61976130

Received: 2021-07-12  

摘要

针对不完备信息提出一种新的基于矩阵方法的极大相容块求取算法与属性约简方法,结合智能分类器给出不完备信息条件下的故障诊断方法.首先,通过矩阵方法计算不完备决策表中的极大相容块;然后,利用所求得的极大相容块,提出一种新的属性约简算法,并与其他方法做对比;最后,将所提出的基于极大相容块的属性约简方法与智能分类器(支持向量机、随机森林、决策树等)结合,建立优化的智能故障分类器,将它应用于不完备信息条件下的故障诊断.以汽轮机组的故障诊断为例进行仿真实验,实验结果表明提出的针对不完备信息条件下的故障诊断方法可行、有效.

关键词: 极大相容块 ; 覆盖粗糙集 ; 矩阵方法 ; 不完备信息 ; 故障诊断

Abstract

In this paper,a new maximum compatible block algorithm and attribute reduction method based on matrix method are proposed for incomplete information,and the fault diagnosis method under the condition of incomplete information is given by the maximal consistent block and intelligent classifiers. Firstly,the maximal consistent block in an incomplete decision table is calculated by matrices. Then,a new attribute reduction algorithm is proposed based on the maximal consistent block and compared with other methods. Finally,some optimized intelligent fault classifiers are established by the combination between the proposed attribute reduction method and corresponding classifiers,such as support vector machine,random forest and decision tree. It is applied to fault diagnosis under the condition of incomplete information. Moreover,the fault diagnosis of a steam turbine as an example for the simulation. Experimental results shows that the proposed method is feasible and effective.

Keywords: maximal consistent block ; covering⁃based rough set ; matrix approach ; incomplete information ; fault diagnosis of steam turbine

PDF (783KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王敬前, 张小红. 基于极大相容块的不完备信息处理新方法及其应用. 南京大学学报(自然科学)[J], 2022, 58(1): 82-93 doi:10.13232/j.cnki.jnju.2022.01.009

Wang Jingqian, Zhang Xiaohong. A new method of incomplete information processing based on maximal consistent block and its application. Journal of nanjing University[J], 2022, 58(1): 82-93 doi:10.13232/j.cnki.jnju.2022.01.009

随着科学技术的进步,现代工业生产向大型化、自动化等方向发展,各设备间的联系也更加紧密.因此,对设备的故障诊断面临新的挑战,其中一项是不完备信息条件下的故障诊断.对于故障诊断,不完备信息1指诊断系统中某一数据对象或多个数据对象的属性值(一般为条件属性)丢失、不完全或无法确定,表现为数据信息残缺.为了保证设备运行的安全稳定,对不完备信息条件下的故障诊断方法进行研究有一定现实意义.

粗糙集理论2是一种处理不精确、不确定和不完备数据的有效分析理论与方法,已在属性约简3、特征选择4、知识发现5等实际应用方面得到了深入的研究.目前,对不完备信息的处理方法主要包括删除法、数据补齐法和模型扩充法等6-8.删除法和补齐法都是通过对缺失信息进行处理,使不完备系统转换为完备信息系统再加以处理,但这两种方法都有一定局限性.扩充模型法则是对经典模型加以拓展,使之适应不完备系统的数据处理,这样既保持了信息系统的完整性,又避免了信息失真.因此,扩充模型法成为当今处理不完备信息的主流方法.

目前,将经典粗糙集模型进行拓展来处理不完备信息已经吸引了很多学者9-11.例如,Kryszkiewicz12提出不完备决策表中的容差关系,将经典粗糙集模型扩充为基于容差关系的粗糙集模型,并基于容差关系提出不完备决策表的属性约简.Leung and Li13在容差关系的基础上提出极大相容块的概念并将其用于解决不完备信息系统的属性约简问题.黄治国和王淼14基于极大相容块概念将原不完备决策表转化为极大相容块最全描述系统,进一步研究了属性约简问题.然而,在极大相容块最全描述系统时并未考虑原决策表中的决策属性,因此,本文进一步考虑带有决策属性的极大相容块最全描述系统.另一方面,极大相容块是不完备决策表的最小知识粒单元,对于不完备决策系统知识约简与决策分析有重要研究意义.然而,如何设计有效的基本知识粒(极大相容块)获取方法以及在此基础上设计快捷高效的知识约简方法,仍然是当前不完备决策系统数据分析与处理面临的重要问题.

本文通过设计新的不完备决策表中极大相容块的求取方法与属性约简方法,提出基于极大相容块与智能分类器的故障诊断方法,并将其应用于不完备信息条件下的汽轮机组故障诊断.首先提出不完备决策表中的相关矩阵表示,并用这些矩阵计算极大相容块;然后通过极大相容块将原不完备决策表转化为极大相容块最全描述决策表,在新的决策表基础上提出基于分辨矩阵的属性约简计算方法;最后,基于所提出的基于极大相容块的属性约简方法构建优化的故障分类器,为解决不完备信息条件下的故障诊断问题提供新方法.由于汽轮机组是石化、能源、冶金和航空等许多行业中的关键设备,因此,本文针对不完备信息条件下汽轮机组的故障诊断问题进行仿真实验.

1 基本概念

本节介绍不完备决策表和极大相容块的相关概念.令U是非空有限集合,称为论域.

定义112

设决策表DT=U,A=MD,

V,f,其中,U=x1,x2,,xn为论域;A=MD为非空有限属性集,MD分别为条件属性和决策属性;V=aAVaVa为属性a的值域;f:U×AV为映射函数,fxi,aVa

xiU,aA.若存在某对象xU的属性aaM上取值缺失(通常缺失值用“*”表示),则称该决策表为不完备决策表.

定义212

设不完备决策表DT=U,

A=MD,V,f,属性集BBM上的容差关系定义为:

TORB=u,vU×U:aBfu,a=fv,afu,a=*fv,a=*

容差关系TORB是论域U上的一个二元关系,由定义2可知容差关系TORB满足自反性、对称性,但不满足传递性.

定义312

设不完备决策表DT=U,

A=MD,V,fxU关于属性集BBM上的容差类定义为:

TBx=yU:x,yTORB

定义413

设不完备决策表DT=U,

A=MD,V,fBM,XU.若对x,yX均有x,yTORB成立,则称X为属性集B上的相容块;若不存在XX'B上的相容块,则称XB上的极大相容块.

把由BM确定的包含对象xU的所有极大相容块形成的集合表示为CxB.把由BM确定的所有极大相容块形成的集合表示为CB.

命题113

设不完备决策表DT=U,

A=MD,V,fBM,XU.XB上的极大相容块当且仅当X=xXTBx.

命题1表明,极大相容块是块中各元素容差类的交集,它是块中各元素容差类的公共部分.

2 基于极大相容块的不完备决策表属性约简

2.1 极大相容块的矩阵计算方法

极大相容块的计算是利用极大相容块技术在不完备信息系统中进行知识获取的重要前提,但在实际计算中它的求取过程总是复杂且耗时,因此,寻找更简便的计算方法非常必要.本节利用矩阵方法,提出新的计算极大相容块的方法.首先给出不完备决策表中两个矩阵表示的定义.

定义5

DT=U,A=MD,V,f为不完备决策表,其中U=x1,x2,,xn.FTM=aijn×nIFTM=bijn×n分别为关于条件属性M的容差关系矩阵表示和容差类交矩阵表示,其中,

aij=1,xi,xjTORM0,                             
bij=TMxiTMxj,xjTMxiΦ,                                        

例1 设不完备决策表DT=U,A=MD,

V,f表1所示,为了后续的对比研究,选取文献[14-15]中的不完备决策表.

表1   不完备决策表DT[14-15]

Table 1  An incomplete decision table DT[14-15]

UabcdefghD
x1*00**0201
x2*2**1*010
x3*2*1*2011
x4*2*112011
x51***10*00
x62320*1310
x723201*311
x8232131*11
x93**3102*0
x10321**0230
x11321110**0
x12321311211

新窗口打开| 下载CSV


根据定义5可得:

FTM=100010001000011100000010011100000000011100000000100010000000000001100000000001100000000000010000100000001100000000001110010000000110000000000001

关于条件属性M的容差类交矩阵表示IFTM此处暂不给出,将通过后续提出的矩阵计算方法得到.命题2与命题3给出定义5中矩阵FTMIFTM的性质.

命题2

设不完备决策表DT=U,

A=MD,V,f,其中U=x1,x2,,xn.FTMIFTM均为对称矩阵.

证明

FTM=aijn×nIFTM=bijn×n.因为关于属性集M的容差关系TORM满足对称性,所以xi,xjTORM蕴含xj,xi

TORM.根据定义5可知,对任意1i,jn总有aij=aji,故FTM为对称矩阵.另一方面,如果xjTMxi,则必有xiTMxj.因此,由定义5可知,IFTM为对称矩阵.

命题3

设不完备决策表DT=U,

A=MD,V,f,并且FTM=aijn×n.则:
aij=1,xjTMxi0,              

证明

对任意xi,xjUxi,xjTORM当且仅当xjTMxi.由此可见,该命题成立.

对于任意的不完备决策表DT=U,

A=MD,V,f,为了利用FTM计算IFTM提出如下矩阵计算.设布尔矩阵A=aijn×m,B=bijm×t,则D=AB=dijn×t,其中,

dij=1km:aijaikbkj=1

下面给出由FTM计算IFTM的矩阵方法.

命题4

设不完备决策表DT=U,

A=MD,V,f,其中U=x1,x2,,xn.IFTM=FTMFTMT,其中FTMTFTM的转置.

证明

FTM=aijn×nIFTM=bijn×n,并且FTMFTMT=cijn×n.故:

cij=1kn:aijaikajk=1=1kn:aij=aik=ajk=1=xkU:xjTMxixkTMxixkTMxj=TMxiTMxjxjTMxiΦ=bij

因此,IFTM=FTMFTMT.

例2 继续例1

IFTM=FTMFTMT=x1x5x9ΦΦΦx1x5ΦΦΦx1x9ΦΦΦΦx2x3x4x11x2x3x4x2x3x4ΦΦΦΦΦΦx2x11ΦΦx2x3x4x2x3x4x2x3x4ΦΦΦΦΦΦΦΦΦx2x3x4x2x3x4x2x3x4ΦΦΦΦΦΦΦΦx1x5ΦΦΦx1x5ΦΦΦΦΦΦΦΦΦΦΦΦx6x7x6x7ΦΦΦΦΦΦΦΦΦΦx6x7x6x7ΦΦΦΦΦΦΦΦΦΦΦΦx8ΦΦΦΦx1x9ΦΦΦΦΦΦΦx1x9x10x9x10ΦΦΦΦΦΦΦΦΦΦx9x10x9x10x11x10x11ΦΦx2x11ΦΦΦΦΦΦΦx10x11x2x10x11ΦΦΦΦΦΦΦΦΦΦΦΦx12

IFTM中元素省略对象间的标点,如x1x5x9表示x1,x5,x9.

推论1

设不完备决策表DT=U,

A=MD,V,f.则IFTM=FTMFTM.

证明

由命题2可知,FTM为对称矩阵,即FTM=FTMT.因此,该推论成立.

在上述矩阵计算的基础上,为了通过矩阵方法计算极大相容块,下面的引理1和引理2、命题5和命题6分别给出极大相容块的等价刻画.

引理1

设不完备决策表DT=U,

A=MD,V,fXU.如果XCxM,则对任意yX,总有TMxTMy=X.

证明 由命题1可知,该引理显然成立.

引理2

设不完备决策表DT=U,

A=MD,V,fXU,其中U=x1,x2,,xn.XCxM当且仅当以下(1)或(2)成立:

(1)对yX,总有TMxTMy

(2)对yX-x总有TMxTMy=X.

证明

由命题1可知,XCxM当且仅当X=yXTMy.又由定义3与定义4可知,XTMx.因此,XCxM当且仅当下列条件之一成立:

(1)当X=TMx时,对yX,总有TMxTMy

(2)当XTMx时,对yX-x,总有TMxTMy=X.

命题5

设不完备决策表DT=U,

A=MD,V,fXU.XCxM当且仅当以下(1)或(2)成立:

(1)yX:TMxTMy=X=X

(2)yX:TMxTMy=X=X-1.

证明

由引理2可知,当X=TMx时,对yX都满足TMxTMy,即:

yX:TMxTMy=yX:TMxTMy=TMx=TMx=X

XTMx时,yX-x都满足TMxTMy=X,即:

yX:TMxTMy=X=X-1

故该命题成立.

命题6 设不完备决策表DT=U,

A=MD,V,f,对xU,
CxM=TMyTMx:TMyTMx:yTMx=TMyTMxTMyTMx:yTMx=TMyTMx-1

证明

由命题5,

CxMTMxTMy:yTMx

再由命题5的(1)和(2)可知,该命题成立.

设集合AB,定义如下运算:

1A1B=1AB
1A1B=1A1BAB2AA=B

特别地,若AΦ,B=Φ,1A1B=1A.根据所定义的这两种矩阵运算,下面的定义给出两个矩阵交积的定义.

定义6

A=aijn×m,B=bijm×1为元素均为集合的矩阵.称D=AB=dijm×1为矩阵AB的交积,其中dij=k=1m1aik*1bkj.

基于上述结果,下面的命题给出极大相容块的矩阵计算方法.

命题7

设不完备决策表DT=U,

A=MD,V,fU=x1,x2,,xn.若IFTMU=din×1di=h1di1htdit,则:
CxiM=dij:1jtdij=hjdij=hj-1

其中U=Un×1.

证明

由定义5和定义6可知,

dij:1jt=TMxiTMy:yTMxi

hj表示与dij相等的交集TMxiTM(y),

yTMxi个数.由命题6可知,该命题成立.

例3 继续例1

IFTMU=1x1,x5,x91x1,x51x1,x91x2,x3,x4,x112x2,x3,x41x2,x113x2,x3,x43x2,x3,x42x1,x52x6,x72x6,x71x81x1,x91x1,x9,x101x9,x101x9,x101x9,x10,x111x10,x111x2,x111x10,x111x2,x10,x111x12

然后,根据命题7可计算出任意对象xiU的所有极大相容块CxiM,如表2所示.

表2   任意对象xiU的所有极大相容块CxiMi=1,2,,12

Table 2  CxiMi=1,2,,12

CxiMi=1,2,,6CxiMi=7,8,,12
Cx1Mx1,x5,x1,x9Cx7Mx6,x7
Cx2Mx2,x11,x2,x3,x4Cx8Mx8
Cx3Mx2,x3,x4Cx9Mx1,x9,x9,x10
Cx4Mx2,x3,x4Cx10Mx9,x10,x10,x11
Cx5Mx1,x5Cx11Mx2,x11,x10,x11
Cx6Mx6,x7Cx12Mx12

新窗口打开| 下载CSV


因此,

C(M)=x1,x5,x1,x9,x2,x3,x4,x2,x11,x6,x7,x8,x9,x10,x10,x11,x12

根据上述的极大相容块计算过程,下面给出不完备决策表中极大相容块的矩阵计算方法,如算法1所示.

算法1 不完备决策表中极大相容块的矩阵生成算法

输入:不完备决策表DT=U,A=MD,V,f.

输出:论域U关于M的全体极大相容块CM.

步骤1

CM=Φ

步骤2

根据定义5,计算FTM

步骤3

根据推论1,计算IFTM=FTMFTM

步骤4

根据命题5,计算全体极大相容块CM.

算法1中,默认不完备决策表DT为一致决策表.步骤1的时间复杂度为O1步骤2的时间复杂度为OMU2步骤3的时间复杂度为OU3步骤4的时间复杂度在最坏的情况下不超过OU3.一般情况下MU.因此,算法1的整体时间复杂度为OU3.

2.2 基于极大相容块的属性约简方法

利用2.1中计算的极大相容块,本节给出不完备决策表的属性约简新方法.黄治国和王淼14提出由原不完备决策表转化为极大相容块最全描述系统的方法,但在转化过程中没有考虑决策属性,即所求的属性约简与决策属性无关,这不符合决策表的属性约简规则.因此,下面给出极大相容块最全描述决策表的定义.

定义7

DT=U,A=MD,V,f为不完备决策表,则称CDT=CM,A=MD,

V',f'DT的极大相容块最全描述决策表.其中,CM=X1,X2,,Xt为关于属性M的极大相容块;MD分别为条件属性和决策属性;V'=aA'Va'Va'为属性a的值域;f':CM×AV'为映射函数,其中对任意aA,Yi

CM1it
f'Xi,a=fx,a:xXi,                        aD                        fx,a,        aMxXi,s.t.,fx,a**,                        aMxXi,fx,a=*   

例4 继续例1 例3已计算出不完备信息系统DT的所有极大相容块:

CM=x1,x5,x1,x9,x2,x3,x4,x2,x11,x6,x7,x8,x9,x10,x10,x11,x12

不妨令:

X1=x1,x5,X2=x1,x9,X3=x2,x3,x4,
X4=x2,x11,X5=x6,x7,X6=x8,
X7=x9,x10,X8=x10,x11,X9=x12

DT的极大相容块最全描述决策表CDT=CM,A=MD,V',f'表3所示.

表3   DT的极大相容块最全描述决策表 (CDT)

Table 3  The most fully described decision table of DT based on maximal compatible blocks (CDT)

abcdefghD'
X1100*10200, 1
X2300310200, 1
X3*2*112010, 1
X4321110010
X5232011310, 1
X6232131*11
X7321310230
X8321110230
X9321311211

新窗口打开| 下载CSV


定义8

DT=U,A=MD,V,f为不完备决策表,CDT=CM,A=MD,V',f'DT的极大相容块最全描述决策表,其中CM=Y1,Y2,,Yt.则称FCDT=aijt×t为极大相容块最全描述决策表的分辨矩阵,其中,

aij=aM:f'Yi,af'Yj,a,                                                f'Yi,Df'Yj,DΦ,                                           f'Yi,D=f'Yj,D

例5 继续例1

FCDT=ΦΦΦabcghΦabcefhabchabchabcfhΦΦbcdghΦabcdefhbchbcdhbcfhΦfΦbefdfghfghdfgΦabcdfgabcefΦΦdfgΦdeabcdfghabcdfghabcdgΦabcdefhabcefhΦΦΦfhΦdfhΦ

运用吸收律生成分辨范式:

defhbchbefdfgabcdg

将其转换为:

bdfbefcdfbdhcefdehdfheghaefh

因此,DT的约简集:

RED=b,d,f,b,e,f,c,d,f,b,d,h,c,e,f,d,e,h,d,f,h,e,g,h,a,e,f,h

由上述定义,便可求得不完备决策表DT的所有约简.具体算法如算法2所示.

算法2 不完备决策表的属性约简算法

输入:原不完备决策表DT中论域U关于M的全体极大相容块CM.

输出:不完备决策表的全体属性约简集RED.

步骤1

根据定义7,生成DT的极大相容块最全描述决策表CDT

步骤2

根据定义8,针对极大相容块最全描述决策表CDT,生成分辨矩阵FCDT=aijt×t

步骤3

生成分辨范式DNFM=aij:aijΦ

步骤4

DNFM转换为等价的极小吸取范式DNF'M=T1Tk

步骤5

得到约简集RED=T1,,Tk.

步骤1的时间复杂度最长为OMCM2步骤2的时间复杂度为OMCM2,步骤3的时间复杂度为OCM2步骤4和步骤5的时间复杂度都为O1.因此,算法2的整体时间复杂度为OMCM2.

表4给出本文提出的算法2与其他约简算法的比较,并以例1为例比较约简结果.可以看出,根据本文提出的算法2,取最简约简为d,f,h.若以“约简中属性个数越少越好”为评价指标,则本文算法比其他算法的约简效果都好.

表4   本文算法与其他不完备决策表属性约简算法的比较

Table 4  Comparison of our algorithm with other attribute reduction algorithms of incomplete decision tables

约简算法1[15]约简算法2[14]本文算法
例1的约简a,c,d,e,f,ha,d,f,hd,f,h
基于容差关系
基于极大相容块
基于分辨矩阵
转换为新的决策表
考虑决策属性

新窗口打开| 下载CSV


3 基于极大相容块与智能分类器的故障诊断方法

结合上节提出的基于极大相容块的属性约简方法与智能分类器,提出不完备信息条件下基于极大相容块与智能分类器的故障诊断方法,并对汽轮机组的故障诊断做仿真实验.

3.1 不完备信息条件下的故障诊断方法

首先,提出不完备信息条件下基于极大相容块与智能分类器(支持向量机、随机森林、决策树等)的故障诊断方法.如算法3所示.

算法3 不完备信息条件下的故障诊断

输入:不完备故障诊断信息.

输出:故障诊断结果及决策.

步骤1

不完备初始信息表的形成:从采集的样本数据中提取故障征兆,这些征兆对应的故障类别都是已知的.将这些征兆作为信息系统的条件属性,对应的故障类别作为信息系统的决策属性,形成不完备故障信息系统IS.

步骤2

样本数据的极大相容块预处理:对信息系统IS进行归一化和离散化处理,构成不完备故障诊断决策表DT,利用算法1计算极大相容块CM;利用算法2得到针对极大相容块的最全描述决策表CDT,并根据相应的差别矩阵对决策表进行约简,消除冗余的条件属性.

步骤3

“极大相容块+智能分类器”模型的确定及训练:选定智能分类器模型,建立智能分类器诊断模型.根据步骤2中确定的约简构造新的故障数据集并对其进行完备化,然后利用其对诊断模型进行训练.

步骤4

故障诊断:用训练好的智能分类器对测试样本征兆集进行故障分类,得到诊断结果.

图1给出不完备信息条件下基于极大相容块与智能分类器的故障诊断方法的流程图.

图1

图1   “极大相容块+智能分类器”的故障诊断方法流程

Fig 1   The fault diagnosis method of “Maximal compatibility block + Intelligent classifier”


3.2 汽轮机组故障诊断仿真实验

为了阐述3.1提出的故障诊断新方法,选择汽轮发电机组常见的振动故障作为诊断实例进行仿真实验.数据处理及运算所用设备:ThinkPad X390笔记本电脑,CPU为Intel 酷睿i7 8565U,Windows10系统.征兆属性为汽轮发电机组振动信号的频域特征频谱中<0.4f,0.4~0.5f,1f,2f,3ff为旋转频率)等五个不同频段上的幅值分量能量,分别表示为abcd,e;决策属性D表示汽轮机组的故障类别,D的取值为1,2和3,分别对应汽轮机组常见的三种故障:油膜振荡、不平衡、不对中.不完备汽轮机故障信息表如表516-17所示(表中数据已归一化处理).

表5   不完备汽轮机故障信息表

Table 5  Incomplete information of turbine faults

UabcdeD
10.0520.7830.225*0.0131
20.2320.9750.3140.056*1
30.161*0.2850.0230.0161
40.1060.858*0.0170.0281
5*0.8190.2010.0160.0121
60.0280.0610.98*0.0572
70.0450.022*0.3160.0652
80.010.0540.8750.183*2
9*0.0320.9230.2190.0372
100.023*0.7580.1150.0192
110.0330.0370.3860.5310.233
12*0.023*0.4580.1033
130.012*0.4270.4960.1753
140.0210.0170.2980.403*3
150.0170.0560.483*0.3013

新窗口打开| 下载CSV


由于应用粗糙集理论处理决策表时,要求决策表中的值用离散数据表达,因此需要进行连续征兆属性的离散化.本文根据工程实践以及R语言对数据的分析,采用下述断点来实现表5中条件属性值的离散化,如表6所示.

表6   离散化断点表

Table 6  The discrete breakpoint table

M012
a0,0.01970.0197,0.04370.0437,1
b0,0.03530.0353,0.3020.302,1
c0,0.3090.309,0.5750.575,1
d0,0.09530.0953,0.3450.345,1
e0,0.0250.025,0.0830.083,1

新窗口打开| 下载CSV


根据表6的离散化方法,表5离散化后的不完备故障诊断决策表DT=U,A=MD,V,f表7所示.

表7   不完备汽轮机故障诊断决策表

Table 7  The incomplete turbine fault diagnosis decision

UabcdeD
1110*01
21100*1
31*0001
411*001
5*10001
6001*02
700*002
80010*2
9*01002
100*1002
11000113
12*0*113
130*0113
140001*3
15000*13

新窗口打开| 下载CSV


根据算法1中的基于矩阵法的极大相容块求取方法,得到关于条件属性集M的极大相容块CM,如表8所示.

表8   关于条件属性集M的极大相容块C(M)

Table 8  The maximal compatibility block C(M) with respect to the conditional attribute set M

X11,3,5X610
X22,4X711
X36X812,13
X47,9X912,14
X58X1013,15

新窗口打开| 下载CSV


利用算法2,构造针对极大相容块的最全描述决策表CDT,并通过差别矩阵得到约简集.此处先给出由差别矩阵得到的极小吸取范式:

acbccdceadebde

因此,DT的约简集:

RED=a,c,b,c,c,d,c,e,a,d,e,b,d,e

此处,不妨选a,c为最简约简.

根据步骤3,只需将条件属性ac的属性值完备化,即可构建新的数据集,该数据集作为训练集进行智能故障分类器训练.此处智能分类器先选择支持向量机(Support Vector Machine,SVM).SVM网格法选择惩罚参数γ与核参数g,范围均为-10,10.但因为后续对比研究的需要,此处将表5都完备化,完备化的方法采用黄文涛等16的方法补齐.完备化后的数据集如表9所示,其中粗体数据表示最终所选的属性值与决策值,加下画线的数据表示补齐的数据.

表9   完备化的数据集

Table 9  The complete datasets

UabcdeD
10.0520.7830.2250.0280.0131
20.2320.9750.3140.0560.0171
30.1610.8590.2850.0230.0161
40.1060.8580.2560.0170.0281
50.1380.8190.2010.0160.0121
60.0280.0610.980.2080.0572
70.0450.0220.8840.3160.0652
80.0100.0540.8750.1830.0452
90.0270.0320.9230.2190.0372
100.0230.0420.7580.1150.0192
110.0330.0370.3860.5310.233
120.0210.0230.3990.4580.1033
130.0120.0330.4270.4960.1753
140.0210.0170.2980.4030.2023
150.0170.0560.4830.4720.3013

新窗口打开| 下载CSV


根据步骤4,对测试集进行测试,如表10所示.用本文提出的“极大相容块+智能分类器”的故障诊断方法只需要对条件属性ac以及决策属性D构成的测试信息进行测试.为突出这三组数据,它们在表10中用粗体表示.

表10   汽轮机组故障的测试集[17-18]

Table 10  A test set of turbine fault diagnosis[17-18]

UabcdeD
160.1610.7530.1280.0060.0031
170.2820.9050.3430.0460.0281
180.0170.0530.750.2520.1072
190.0450.2220.9890.3860.0152
200.0270.1270.8510.6190.2522
210.0260.0430.3570.5170.0983
220.0230.1370.3780.4210.1523
230.01840.00550.82050.1270.00313

新窗口打开| 下载CSV


测试结果如图2所示.图中“o”表示预测的故障结果,“*”表示实际的故障类型.两者重合部分说明诊断结果正确.图2a、图2c和图2e分别为采用“极大相容块+SVM”故障诊断方法时,核函数为不同类型的故障诊断结果.图2b、图2d和图2f则为直接将数据完备化后只采用SVM的故障诊断结果,此时的核函数也选用不同的类型.

图2

图2   “极大相容块+SVM”和SVM对测试集的故障分类图

Fig.2   Fault classification diagrams of “Maximal compatibility block +SVM” and SVM


表11为“极大相容块+SVM”(见表中黑体字)和SVM对测试集的故障分类情况的汇总与对比结果.

表11   “极大相容块+SVM”和SVM对测试集的故障分类情况

Table 11  Fault classification of test datasets by “Maximal compatible blocks+SVM”and SVM

极大相容块+SVMSVM
准确率运行时间(s)准确率运行时间(s)
Polynomial87.5%10.6375%11.15
RBF87.5%14.3375%15.56
Sigmoid87.5%12.6475%12.89

新窗口打开| 下载CSV


表11可以直观地看出,无论SVM故障分类器的核函数选择的是多项式(Polynomial)核函数、径向基(RBF)核函数或感知器(Sigmoid)核函数,未经过极大相容块方法约简的SVM故障诊断结果的准确率为75%,而约简后的故障诊断结果的准确率提升到87.5%,并且运行时间也有所减少.这表明经过极大相容块约简的属性对故障诊断更具有代表和准确性,而且减小了SVM的运算量,从而使得SVM的诊断效果优于没有约简的诊断结果.

为了进一步说明本文提出的“极大相容块+智能分类器”方法的有效性,选用其他类型的智能分类器进行仿真实验,实验结果如表12所示.由表可见,“极大相容块+随机森林”和“极大相容块+决策树”(表中黑体字)的准确率都高于不经过属性约简而直接选用相应分类器的准确率.这些结果充分说明所提出的针对不完备信息条件下的故障诊断方法可行、有效.

表12   其他类型的“极大相容块+智能分类器”的故障分类情况

Table 12  Fault classification by other types of “Maximal compatible blocks+Intelligent classififiers”

极大相容块+智能分类器准确率
极大相容块+随机森林87.5%
极大相容块+决策树87.5%
随机森林75%
决策树62.5%

新窗口打开| 下载CSV


4 结论

本文提出基于矩阵方法的极大相容块的矩阵计算方法,很好地解决了传统计算方法复杂、耗时等问题.基于极大相容块,提出不完备决策表的最全描述表,并通过分辨矩阵的方法提出新的约简方法,为不完备信息的处理提供了一种新的处理方法.借助提出的约简方法,给出不完备条件下“极大相容块+智能分类器”的故障诊断方法,并将其应用在汽轮机组的故障诊断中.实验结果证明提出的故障诊断方法科学地缩减了智能分类器的输入空间规模,减少了训练的时间,提高了诊断的准确率.

参考文献

陈泽华宋波闫继雄.

基于概念格的不完备信息系统最简规则提取算法

控制与决策,201934(5):1011-1017.

[本文引用: 1]

Chen Z HSong BYan J Xet al.

Concise rule extraction algorithm of incomplete information system based on concept lattice

Control and Decision,201934(5):1011-1017.

[本文引用: 1]

Pawlak Z.

Rough sets

International Journal of Computer and Information Science,198211(5):341-356.

[本文引用: 1]

Chen D GDong L JMi J S.

Incremental mechanism of attribute reduction based on discernible relations for dynamically increasing attribute

Soft Computing,202024(1):321-332.

[本文引用: 1]

Tawhid M AIbrahim A M.

Feature selection based on rough set approach,wrapper approach,and binary whale optimization algorithm

International Journal of Machine Learning and Cybernetics,202011(3):573-602.

[本文引用: 1]

韩朝苗夺谦任福继.

基于粗糙集知识发现的开放领域中文问答检索

计算机研究与发展,201855(5):958-967.

[本文引用: 1]

Han ZMiao D QRen F Jet al.

Rough set knowledge discovery based open domain Chinese question answering retrieval

Journal of Computer research and Development,201855(5):958-967.

[本文引用: 1]

姚晟汪杰徐风.

不完备邻域粗糙集的不确定性度量和属性约简

计算机应用,201838(1):97-103.

[本文引用: 1]

Yao SWang JXu Fet al.

Uncertainty measurement and attribute reduction in incomplete neighborhood rough set

Journal of Computer Applications,201838(1):97-103.

[本文引用: 1]

Zheng JWang Y MZhang Ket al.

A dynamic emergency decision⁃making method based on group decision making with uncertainty information

International Journal of Disaster Risk Science,202011(5):667-679.

Yang LZhang X YXu W Het al.

Multi⁃granulation rough sets and uncertainty measurement for multi⁃source fuzzy information system

International Journal of Fuzzy Systems,201921(6):1919-1937.

[本文引用: 1]

孙妍米据生冯涛.

变精度极大相容块粗糙集模型及其属性约简

计算机科学与探索,202014(5):892-900.

[本文引用: 1]

Sun YMi J SFeng Tet al.

Maximum consistent block based variable precision rough set model and attribute reduction

Journal of Frontiers of Computer Science & Technology,202014(5):892-900.

[本文引用: 1]

Sang B BYang LChen H Met al.

Generalized multi⁃granulation double⁃quantitative decision⁃theoretic rough set of multi⁃source information system

International Journal of Approximate Reasoning,2019115157-179.

杨霁琳秦克云裴峥.

不完备决策表中基于相似关系的属性约简

计算机工程,201036(20):10-12.

[本文引用: 1]

Yang J LQin K YPei Z.

Attributes reduction based on similarity relation in incomplete decision table

Computer Engineering,201036(20):10-12.

[本文引用: 1]

Kryszkiewicz M.

Rough set approach to incomplete information systems

Information Sciences,1998112(1-4):39-49.

[本文引用: 4]

Leung YLi D Y.

Maximal consistent block technique for rule acquisition in incomplete information systems

Information Sciences,2003(153):85-106.

[本文引用: 3]

黄治国王淼.

不完备决策表中基于容差关系的属性约简方法

微电子学与计算机,201633(6):147-151156.

[本文引用: 6]

Huang Z GWang M.

Attribute reduction based on tolerance relation in incomplete decision table

Microelectronics & Computer,201633(6):147-151156.

[本文引用: 6]

鄂旭邵良杉周津.

一种新的不完备信息系统属性约简算法

重庆邮电大学学报(自然科学版),201022(5):648-651664.

[本文引用: 4]

E XShao L SZhou Jet al.

A new attribute reduction algorithm in an incomplete information system

Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition),201022(5):648-651664.

[本文引用: 4]

黄文涛赵学增王伟杰.

基于不完备数据的汽轮机组故障诊断的粗糙集方法

汽轮机技术,200446(1):57-59.

[本文引用: 2]

Huang W TZhao X ZWang W Jet al.

Rough sets method of fault diagnosis for steam turbine based on incomplete data

Turbine Technology200446(1):57-59.

[本文引用: 2]

李化. 汽轮发电机组振动故障智能诊断模型的理论及方法研究. 博士学位论文. 重庆重庆大学1999.

[本文引用: 3]

Li H. Research on theory and method of intelligent diagnosis model for turbine generator vibration fault. Ph.D. Dissertation. ChongqingChongqing University1999.

[本文引用: 3]

邴汉昆.

基于小波分析和SVM的汽轮机非线性振动故障诊断研究

硕士学位论文. 北京华北电力大学2013.

[本文引用: 2]

Bing H K.

Research on nonlinear vibration fault diagnosis of steam turbine based on wavelet analysis and SVM

Master Dissertation. BeijingNorth China Electric Power University2013.

[本文引用: 2]

/