南京大学学报(自然科学), 2022, 58(3): 495-505 doi: 10.13232/j.cnki.jnju.2022.03.013

多尺度单值中智系统中基于优势粗糙集模型的最优尺度选择与约简

王文珏, 黄兵,

南京审计大学信息工程学院,南京,211815

Optimal scale selection and reduction based on dominant rough set model in multi⁃scale single⁃valued neutrosophic systems

Wang Wenjue, Huang Bing,

School of Information Engineering,Nanjing Audit University,Nanjing,211815,China

通讯作者: E⁃mail:hbhuangbing@126.com.

收稿日期: 2022-01-19  

基金资助: 江苏省高校自然科学研究项目.  20KJA520006
江苏省研究生科研与实践创新计划.  KYCX21_1946

Received: 2022-01-19  

摘要

单值中智集是处理不确定、不一致信息的有效工具,结合单值中智粗糙集和多尺度决策系统,提出基于优势关系的多尺度单值中智粗糙集模型的最优尺度选择和约简算法.首先,在构建基于优势关系的多尺度单值中智粗糙集模型时引入正理想点、负理想点和不确定点来刻画单值中智数大小关系;其次,结合证据理论中的信任函数和似然函数给出模型的最优尺度选择算法及约简算法;最后,利用五组UCI数据集对文中提出的模型与算法进行实例验证,分析算法的有效性.提出的算法在分类精度和算法效率两方面都有所提高,进一步扩展了单值中智粗糙集在多尺度决策系统下的应用,为后续该领域的研究提供参考.

关键词: 多尺度 ; 尺度约简 ; 单值中智粗糙集 ; 最优尺度选择 ; 证据理论

Abstract

Single⁃valued neutrosophic sets are effective tools to deal with uncertain and inconsistent information. Combined with single⁃valued neutrosophic rough set and multi⁃scale decision systems,this paper proposes the optimal scale selection and reduction algorithms based on multi⁃scale single⁃valued neutrosophic dominance rough set model. First,when constructing multi⁃scale dominant single⁃valued neutrosophic rough set model,we use the ideal positive point,ideal negative point and most uncertain point to describe the dominance relationship between neutrosophic numbers. Second,combining with the belief function and plausibility function in evidence theory,we examine the optimal scale selection algorithm and reduction algorithm of the presented model. Third,we utilize five groups of UCI datasets to verify the model and algorithm proposed in this paper,and analyze the effectiveness of the algorithm. The algorithm proposed in this paper improves the classification accuracy and algorithm efficiency,and furtherly expands the application of single⁃valued neutrosophic rough set in multi⁃scale decision⁃making system,which provides a reference for subsequent research in this field.

Keywords: multi⁃scale ; scale reduction ; single⁃valued neutrosophic rough sets ; optimal scale selection ; evidence theory

PDF (612KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王文珏, 黄兵. 多尺度单值中智系统中基于优势粗糙集模型的最优尺度选择与约简. 南京大学学报(自然科学)[J], 2022, 58(3): 495-505 doi:10.13232/j.cnki.jnju.2022.03.013

Wang Wenjue, Huang Bing. Optimal scale selection and reduction based on dominant rough set model in multi⁃scale single⁃valued neutrosophic systems. Journal of nanjing University[J], 2022, 58(3): 495-505 doi:10.13232/j.cnki.jnju.2022.03.013

粗糙集理论是由Pawlak1提出的针对不精确、不完备信息处理问题的数学工具.随后,针对经典粗糙集中存在的局限性,专家学者们相继提出模糊粗糙集2、直觉模糊粗糙集3、区间直觉模糊粗糙集4、优势模糊粗糙集5、单值中智粗糙集6等扩展模型.

针对经典粗糙集理论无法处理优势关系这一问题,1999年Greco et al5提出优势粗糙集理论(Dominance⁃based Rough Sets Approach,DRSA),DRSA弥补了经典粗糙集理论的不足并在之后的研究中得到了广泛应用.黄兵7及江效尧和黄兵8将优势关系与区间直觉模糊集结合,构建了优势区间直觉模糊粗糙集模型,并将其运用于信息系统设计风险判断.李佳等9利用属性重要度对优势度排序,解决并列的多属性决策排序问题.

由于一维隶属度表征的模糊信息无法解决大多数不确定性问题,因此学者们进一步提出直觉模糊集和中智集的概念.在Smarandache10首次提出中智集概念后,Dai et al11又进一步提出单值中智集的概念.此后,各国学者开始研究单值中智数的排序方法.Ye12对单值中智集的余弦相似度的公式进行了优化,进而比较单值中智数的大小.Huang et al13则结合现有的排序方法,利用相对距离有利度和相对相似度对单值中智集排序.

针对单一尺度分析的信息系统不能解决复杂的信息处理问题,Wu and Leung14提出多尺度信息系统概念,并由Li and Hu15进一步改进.在多尺度信息系统中,最优尺度选择一直都是研究的核心问题.例如,吴伟志等16-18利用证据理论中的似然函数和信任函数对最优尺度组合进行刻画;陈应生等19-20利用矩阵对尺度组合进行刻画;郑嘉文等21利用熵定义最优尺度,最后提出了基于熵的最优尺度选择;张清华等22从尺度代价和属性代价这两个不同的角度来刻画,并将尺度与属性代价结合,从而建立基于代价敏感的多尺度决策系统来选择最优尺度.

尽管多尺度系统和单值中智集的研究和应用能更好地处理复杂的信息问题以及更全面地描述系统信息,但目前针对多尺度决策系统环境下的单值中智粗糙集研究并不常见.因此,本文基于Huang et al13的相对距离有利度构建基于优势关系的多尺度单值中智粗糙集模型,并根据模型给出最优尺度选择和最优尺度约简算法.本文提出的算法以多尺度单值中智数据为研究对象,在分类精度和时间效率上都有所提高,且进一步扩展了单值中智粗糙集在多尺度决策系统下的应用,为后续该领域的研究提供参考.

1 预备知识

本节介绍单值中智集以及多尺度决策系统的基本概念,同时引入证据理论.

1.1 单值中智集

定义123

U为论域,在U上的一个单值中智集A由真值隶属度函数TAx、不确定隶属度函数IAx以及假值隶属度函数FAx组成,可表示为A=x,TAx,IAx,FAxxU.其中,TAx:U0,1IAx:U0,1FAx:U0,1.同时,将论域U上单值中智集A的元素称为单值中智数(SVNN),单值中智集记为SVNS,并给出如下性质:

A,BSVNSU,ABxU,TAxTBx,IAxIBx,FAxFBx

在对给定的两个单值中智数比较大小时,Huang et al13提出将单值中智数与理想正点、理想负点、最不确定点之间的欧式距离作为单值中智数大小关系判定的依据.

定义213

对于单值中智数x=Tx,Ix,Fx,令Mgx作为基于x的相对距离有利度,Dx,y表示xy之间的欧式距离.同时,引入理想正点1,0,0、理想负点0,1,1、最不确定点0,1,0x离理想正点越近,离理想负点和最不确定点越远,则x越有利.因此将相对距离有利度表示为:

Mgx=Dx,0,1,1+Dx,0,1,0-Dx,1,0,0

结合距离公式可以得到:

Mx=Tx2+Ix-12+Fx-12+Tx2+Ix-12+Fx2-(Tx-1)2+Ix2+Fx2

显然,Mx1-3,3+2.因此,令x=Ti,Ii,Fiy=Tk,Ik,Fk为是两个单值中智数,则它们的大小关系判定如下:若MxMy,则xy.

1.2 多尺度决策系统

本节引入多尺度决策系统的概念.

定义314

设属性集合为A=a1,a2,,am,论域U=x1,x2,,xnS=U,A为一个多尺度信息表,ajIj(1jm)个尺度,则S可以表示为:

U,ajkk=1,2,,Ij,j=1,2,,m

其中,ajk:UVjkVjk指属性ajk在第k个尺度下的值域.当1kIj-1xUgjk,k+1:VjkVjk+1,使得ajk+1=gjk,k+1ajk,即ajk+1x=gjk,k+1ajkx

gjk,k+1是粒度转化函数.

定义424-25

S=U,A为多尺度信息表的元组,论域U=x1,x2,,xn,属性A=a1,a2,,am,且ajIj(j=1,2,,m)个尺度,则分处在不同Ij阶层的属性a1,a2,,am构成一个单尺度信息表SK=U,AK,其中K=l1,l2,,lmAK=a1l1,a2l2,,amlm,索引集K称为SSK的尺度组合,记S的全体尺度组合l=l1,l2,,lm1ljIj,j=1,2,,m,Kl.

定义524-25

D=U,Cd为多尺度决策表,其中U,C为多尺度信息表,且dC,则d:UVd为决策属性.

1.3 证据理论

定义626

SK=U,AK,d为多尺度决策表S的一个单尺度决策表,对XUYU,且Y,则PXY=XYY.BelAKXPlAKX分别为论域U的信任函数和似然函数,定义为:

BelAKX=PRAK̲X=        RAK̲XU=AXmAKAPlAKX=PRAK¯X=        RAK¯XU=AXφmAKA

其中,对应的mass函数为:

mAKX=PX=XU,XU/RAK0,                       XU/RAK

依据决策属性d划分的等价类为Di,因此令:

BelAKd=DiU/dBelAKDi=DiU/dRAK̲DiUPlAKd=DiU/dPlAKDi=DiU/dRAK¯DiU

2 多尺度优势单值中智粗糙集

2.1 优势单值中智粗糙集模型

定义7

S=U,A,V,f,其中A=CDC为条件属性集合,D=d是决策属性集合,且CD=.对于xUaAV=VaVa为属性a的值域.f则表示为对象与属性值的映射,即f:U×CDV,且fx,cfx,d分别表示x在条件属性c、决策属性d下的取值.若fx,c=Tc,Ic,Fc,则称S为单值中智模糊信息系统,记作SVNFS.

定义8DSVNFS=U,CD,V,fxU,则条件属性子集BC下的优势关系为:

RB=x,yU×Ufx,bfy,b,bB

优势类为:

xB=yU(x,y)RB

其中,fx,bfy,b表示对象y在属性b下取值大于x在属性b下的取值,即y优于x,其中f取值的大小判断通过定义2的相关内容确定.

同理,可以定义劣势类为:

xB=yU(y,x)RB

f的大小关系同样可以通过定义2确定.

定义9

DSVNFS=U,CD,V,f,依据决策属性d划分等价类为U/d=D1,D2,,Dn,即DiU/d,此时,

D1D2DnDi=1kiDk1inDi=ikmDk1in

则由BC确定的下、上近似的定义如下:

Bd̲Di=xUxBDi
Bd¯Di=xUxBDi=xDixB
BNDBDi=Bd¯Di-Bd̲Di
Bd̲Di=xUxBDi
Bd¯Di=xUxBDi=xDixB
BNDBDi=Bd¯Di-Bd̲Di

2.2 多尺度优势单值中智粗糙集模型

定义10

设多尺度优势单值中智模糊信息系统U,A,F,其中论域U=x1,x2,,xnA=a1,a2,,am为非空条件属性集合,ajA都具有Ij(1jm)个尺度指标,即属性ajIj个尺度为aj1aj2,…,ajIj.同时,fajk:UP0Vajk,其中,Vajk表示属性ajk的值域(1kIj-1)F=fajkk=1,2,,Ij,j=1,2,,m,且gajkk,k+1:VajkkVajkk+1,使fajk+1=gajk,k+1fajk,即fajk+1x=gajk,k+1fajkx,且gajk,k+1是粒度转化函数.

MS-DSVNDS=U,A,F,d,g为多尺度优势单值中智模糊决策系统,其中U,A,F为多尺度优势单值中智模糊信息系统,d为决策属性集合,g:UP0VdVd为决策属性d的值域.

定义11

K1=l11,l21,,lm1K2=l12,

l22,,lm2,若对j=1,2,,mlj1lj2,则称尺度K1细于尺度K2,记作K1K2.K1K2j=1,2,,mlj1lj2,则称尺度K1严格细于尺度K2,记作K1K2.并得到以下定义:

K1=K2lj1=lj2,1jmK1K2lj1lj2,1jmK1K2K1K2K1K2K1K2=minl11,l12,minl21,l22,,minlm1,lm2K1K2=maxl11,l12,maxl21,l22,,maxlm1,lm2

其中K0=1,1,,1为最细尺度,I1,I2,,Im则为最粗尺度.

定义12

MS-DSVNDS=U,A,F,d,gajA具有Ij(1jm)个尺度指标.设l为全体尺度组合的集合,令K记为系统的一个尺度组合,则K对应的一个单尺度优势单值中智模糊决策系统为SK.RAK(1kIj)为系统在尺度组合K=l1,l2,,lm(1ljIj,1jm)下由属性集A导出的一个优势关系,表示为:

RAK=x,yx,yU×U,fx,ajljfy,ajlj

这里f的取值大小也由定义2确定.优势类记为:

xRAK=yUx,yRAK

劣势类则记为:

xRAK=yUy,xRAK

对于DiU/dKl,由Di导出的下、上近似表示如下:

RAK̲Di=xUxRAKDi
RAK¯Di=xUxRAKDi
RAK̲Di=xUxRAKDi
RAK¯Di=xUxRAKDi

因此对于DiU/d,令尺度组合K下的信任函数和似然函数为:

BelAKd=DiU/dBelAKDi=DiU/dRAK̲DiU
PlAKd=DiU/dPlAKDi=DiU/dRAK¯DiU

2.3 多尺度优势单值中智粗糙集模型最优尺度选择

在讨论多尺度优势单值中智决策系统MS⁃DSVNDS的最优尺度选择算法时,根据文献[26]可知最优尺度选择的基本算法:若K1l,使SK1是协调的,且对K2lK1K2SK2是不协调的,那么使系统协调的最优尺度组合为K1.

定义13

S=U,A,F,d,g为单值中智决策系统,K=(l1,l2,,lm)为多尺度决策系统的尺度组合,K0=1,1,,1,单尺度决策系统SK关于MS⁃DSVNDS协调和最优尺度组合的定义如下:

(1)若SK是关于S信任协调,即BelAKd=BelAK0d,且对任意的K'满足KK'(K'l),K'均不信任协调,则K为信任最优尺度组合;

(2)若SK是关于S似然协调,即PlAKd=PlAK0d,且对任意的K'满足KK'(K'l),K'均不似然协调,则K为似然最优尺度组合.

据定义13设计多尺度优势单值中智决策系统信任最优尺度选择算法,如算法1所示.

算法1

MS⁃DSNVDS信任最优尺度选择算法

输入:多尺度优势单值中智决策系统MS-DSVNDS=

U,A,F,d,g,其中A为非空属性集ajkk=1,2,,Ij,

j=1,2,,mU=x1,x2,,xnK0=1,1,,1

m为条件属性个数,Ij为尺度指标数量.

输出:MS⁃DSNVDS的信任最优尺度组合

Step 1.令M=l=l1,l2,,lm1ljIj,1jm

Step 2.计算BelAK0d;

Step 3.对KM,分别计算BelAKd;若BelAKd

BelAK0d,对K'M,若KK',则M=M\K'

Step 4.对KMK'M使K'K,则M=M\K'

Step 5.输出MS⁃DSVNDS所有的信任最优尺度组合M.

算法1利用信任函数来判断系统是否信任协调,其中信任函数的计算依据定义12.首先通过遍历所有尺度组合找出使系统不信任协调的尺度组合K,并用定义11中定义的偏序关系从M中删去自身和严格粗于K的尺度组合,最后再次遍历剩余尺度组合找出严格细于这次遍历中的K的所有尺度组合K'来不断缩小搜索空间并得到最优尺度组合.该算法的主要思想是逐步删去不是最优的和使系统不协调的尺度组合,最后得到最优尺度组合.经计算可得,算法的时间复杂度为On2j=1mIj,其中尺度总数为j=1mIjOn2为判断系统是否信任协调的时间复杂度.计算最差的时间复杂度为计算所有尺度下的信任函数,即算法1的时间复杂度.

同理可得MS⁃DSVNDS似然最优尺度选择算法.

将算法1运用到风险控制系统中得到例1.

例1

表1给出多尺度优势单值中智决策系统MS-DSVNDS=U,A,F,d,g.该系统是一个风险控制系统的实例,其中U=x1,x2,,x10为10个审计案例,而非空属性集合A=a1,a2,a3分别为数据的可靠性、系统控制、系统环境,其中数据可靠性有三个尺度,系统控制有两个尺度,系统环境有两个尺度.决策属性d=1表示系统风险控制效果差,d=2则表示系统存在较大风险,d=3表示系统风险控制效果不错.Tx,Ix,Fx表示在该属性尺度下审计案例x与属性ajk之间的真隶属度、不确定隶属度和假隶属度.

表1   多尺度优势单值中智决策系统

Table 1  Multi⁃scale dominant single⁃valued neutrosophic decision system

Ua11a12a13a21a22a31a32d
x10.4,0.5,0.30.5,0.4,0.30.5,0.3,0.20.4,0.5,0.40.5,0.4,0.20.8,0.2,0.30.8,0.1,0.22
x20.3,0.4,0.30.5,0.4,0.30.5,0.3,0.20.4,0.5,0.40.5,0.4,0.10.6,0.1,0.30.7,0.1,0.21
x30.3,0.4.0.40.5,0.4,0.20.5,0.3,0.20.4,0.4,0.40.5,0.4,0.10.8,0.1,0.20.8,0.1,0.21
x40.7,0.3,0.20.7,0.2,0.20.8,0.1,0.10.4,0.5,0.20.5,0.4,0.20.9,0.1,0.20.9,0.1,0.23
x50.4,0.6,0.30.5,0.4,0.20.5,0.3,0.20.7,0.3,0.30.8,0.2,0.20.9,0.1,0.20.9,0.1,0.23
x60.7,0.3,0.20.7,0.2,0.20.8,0.1,0.10.7,0.3,0.20.8,0.2,0.10.8,0.1,0.20.8,0.1,0.22
x70.4,0.5,0.30.5,0.4,0.20.5,0.3,0.20.4,0.5,0.30.5,0.4,0.20.8,0.2,0.30.8,0.1,0.22
x80.3,0.6,0.40.4,0.4,0.30.5,0.3,0.20.4,0.6,0.30.5,0.5,0.20.7,0.2,0.20.8,0.1,0.22
x90.1,0.8,0.50.3,0.6,0.30.4,0.5,0.10.1,0.8,0.40.2,0.7,0.30.4,0.5,0.30.5,0.5,0.21
x100.4,0.6,0.30.5,0.4,0.20.5,0.3,0.20.7,0.3,0.20.8,0.2,0.10.9,0.1,0.20.9,0.1,0.23

新窗口打开| 下载CSV


根据定义2对对应的单值中智数进行比较从而建立优势关系(其中相对距离有利度取小数点四位),如表2所示.

表2   基于相对距离有利度多尺度优势单值中智决策系统

Table 2  Multi⁃scale dominant single⁃valued neutrosophic decision system based on relative distance preference degree

Ua11a12a13a21a22a31a32d
x10.81911.17841.44150.75501.25342.08862.36632
x20.84421.17841.44150.75501.33101.90102.17631
x30.78101.25341.44150.93811.33102.36632.36631
x41.81371.99982.46670.88931.25342.54682.54683
x50.64031.25341.44151.72722.18812.54682.54683
x61.81371.99982.46671.81372.28152.36632.36632
x70.81911.25341.44150.81911.25342.08862.36632
x80.41631.00501.44150.64031.06771.99982.36632
x9-0.20840.47380.9652-0.17030.15190.81911.06771
x100.64031.25341.44151.81372.28152.54682.54683

新窗口打开| 下载CSV


K0=1,1,1K1=2,1,1K2=1,2,1K3=2,2,1.其中:

U/d=x2,x3,x9,x1,x6,x7,x8,x4,x5,x10

(1)令:

M=l=l1,l2,,lm1ljIj,1jm

(2)计算BelAK0d

BelAK0d=DiU/dRAK0Di̲U=1+610+310=1910

(3)分别对KM,计算BelAK(d)

BelAK1d=DiU/dRAK1̲DiU=1+410+310=17101910
BelAK2d=DiU/dRAK2̲DiU=1+610+310=1910
BelAK3d=DiU/dRAK3̲DiU=1+410+310=17101910

因此需将尺度集合M中比尺度K1粗的尺度组合删去,同时删去K1.共有12个尺度组合,循环遍历共删掉八个尺度组合,剩下尺度组合K0,K2,

K4=1,1,2,K5=(1,2,2).再计算剩下的尺度组合,得到的尺度组合K4与尺度组合K5的单尺度信息表是信任协调的,保留这四个尺度组合.

(4)KM,存在K0K2K5,则从尺度组合集合M中去除K0K2;又存在K4K5,则删去K4,到此遍历结束.

(5)此时,尺度组合M只剩下最优尺度K5=1,2,2.

2.4 多尺度优势单值中智粗糙集模型最优尺度约简

Zhang et al27将属性约简看成特殊的尺度选择,当J=0时表示属性约简和最优尺度选择是同时进行的,J=1则表示只进行最优尺度选择,并通过哈斯图计算边界域的极大元来优化算法.其算法的主要思想是令某属性的粒度为0,固定其他属性不变,逐渐增加属性粒度直至系统协调,最后重复操作得到最优尺度约简.该算法本质上通过减少检查系统协调性次数来提高算法效率,本节将讨论多尺度优势单值中智粗糙集模型尺度约简算法.

定义14

MS-DSVNDS=U,A,F,d,gA=ajkk=1,2,,Ij,j=1,2,,mK0=1,

1,,1lj=0表示该尺度下的属性aj被删除,

ζ为全体尺度组合,若尺度组合C=l1,l2,,lm

(0ljIj)满足:

(1)若SC是关于S信任协调,即BelACd=BelAK0d,且对任意删去一个属性后对应的尺度组合C'(C'ζ)总有BelAC'dBelAK0d,则称为信任最优尺度约简.

(2)若SC是关于S似然协调,即PlACd=PlAK0d,且对任意删去一个属性后对应的尺度组合C'(C'ξ),总有PlBC'dPlAK0d,则称为似然最优尺度约简.

算法2

MS⁃DSVNDS信任最优尺度约简算法

输入:多尺度优势单值中智决策系统MS-DSVNDS=

U,A,F,d,g其中A为非空属性集ajkk=1,2,,Ij,

j=1,2,,mU=x1,x2,,xnK0=1,1,,1

m为条件属性个数,Ij为尺度指标数量,I=I1,I2,,Im.

输出:MS⁃DSVNDS的信任最优尺度约简Kt.

Step 1.令RA=AKt=1,1,,1=K0.

Step 2.计算BelAK0d.

Step 3.对ajRA,令lj=0(1jm)时,分别计算BelAKtljd;若BelAKtd=BelAKtljd,则Kt=KtljRA=RA\aj;否则lj=Ij(ljIj).BelAKtd=BelAKtljd,则令Kt=KtljRA=RA\aj,否则令lj=lj-1.

Step 4.输出MS⁃DSVNDS的信任最优尺度约简Kt.

算法2中,若每个aj在删去该属性后的系统是信任协调的,则表示可以从该尺度组合中删去该属性;若删去后系统不信任协调,则此时该进行的操作是找到该尺度组合下能使系统信任协调达到最高层次的尺度.依次对所有属性进行上述操作,就能得到该系统信任最优尺度约简.经计算可得,该算法的时间复杂度为On2j=1mIj,其中On2为判断系统信任协调的时间复杂度,其与样本总数有关,且算法通过对每个属性分别进行计算而得到结果,则计算次数最多为各属性尺度指标数量之和,由此可得算法时间复杂度.

同理可得MS⁃DSVNDS的似然最优尺度约简.

例2

根据例1的实例可运用算法2从而得到信任最优尺度约简如下:

(1)令:

RA=A=a1,a2,a3,Kt=1,1,1=K0

(2)BelAKtd=DiU/dRAKtDi̲U=1+610+310=1910

(3)ajRA,令lj=0,计算BelAKtl1d

BelAKtl1d=DiU/dRAKtl1Di̲U=1+410+310=17101910

此时,BelAKtdBelAKtl1d,则不删属性a1.令该属性粒度l1=3,由例1可知不是信任协调的,因此令lj=lj-1直至l1=1使系统协调.

BelAKtl2d=DiU/dRAKtl2Di̲U=1+610+310=1910

由于BelAKtd=BelAKtl2d,故删去属性a2,此时令l2=0Kt=1,0,1.同理可得:

BelAKtl3d=DiU/dRAKtl3Di̲U=1+210=12101910

故令l3=2,此时系统信任协调.因此,最后得到信任最优尺度约简为Kt=1,0,2.

3 实验

为了对多尺度单值中智粗糙集的最优尺度选择算法和约简算法进行有效性验证,本文抽取了五个数据集,分别为IrisWineGlass,Somerville Happiness Survey和Algerian Forest Fires,数据集的具体信息如表3所示.本节中模型的构建以及算法的实现以Somerville Happiness Survey数据集为例,图1为该数据集可视化,且算法运行的软件环境是Matlab R2020b.

表3   预处理后的UCI数据集信息

Table 3  Information of preprocessed UCI datasets

编号数据集样本数条件属性尺度类别
1Iris15043,2,2,33
2Wine178133,2,2,3,3,1,2,3,2,3,3,1,23
3Glass21493,2,2,3,3,1,2,3,26
4Happiness14363,1,2,3,2,22
5Fire244103,2,3,3,1,2,3,2,2,32

新窗口打开| 下载CSV


图1

图1   Happiness数据集可视化

Fig.1   Visualization of Happiness dataset


Somerville Happiness Survey数据集共有六个条件属性和一个决策属性.决策属性分为不快乐和快乐两类,分别将这两类赋值为0,1,其中d=0共有66个样本,d=1共有77个样本.六个条件属性则为城市服务信息可用性、住房成本、公立学校的整体质量、对当地警察的信任、街道和人行横道的维护、社区活动可用性,这六个属性的值都为1~5.本实验利用数据集样本之间的优劣关系得到数据集的最优尺度,以下为实验过程:

首先需对Somerville Happiness Survey数据集完成多尺度决策系统与单值中智粗糙集的构建,在构建多尺度决策系统时依据Hao et al28提出的方法,即利用属性值所属不同的区间值划分尺度较粗的评价标准,并利用区间的合并再一步划分尺度更粗的评价标准.本节实验划分区间值时将i-14Vmax-Vmin,i4Vmax-Vmin(i=1,2,,4)作为4值区间,Vmax-Vmin为属性值的最大值减去最小值之后的属性值跨度,并通过将4值区间进一步合并为2值区间构建下一个层级的尺度系统,最后得到多尺度系统.本实验中将条件属性的尺度设定为3,1,2,3,2,2,如表3所示.在构建单值中智粗糙集时将各属性值与该属性列的最大值、平均值、最小值之间的欧式距离作为标准来确定肯定度、犹豫度和否定度,然后将归一化处理后的距离与1相减得到的绝对值作为数据集中该属性的肯定度、犹豫度和否定度,并以定义2中的相对距离有利度作为评价单值中智数优劣关系的标准,得到各样本的优势类.

其次,基于本文提出的算法2对前面构建的模型进行实验.第一步是对尺度组合初始化,即令Kt=K0=1,1,,1,并求出在最细尺度下的信任函数值.第二步,分别对各个条件属性进行约简,能否约简的判断标准为在删除该属性后构建的模型是否协调.若不能约简,则从最粗粒度开始,找出能使决策系统协调的最粗粒度.在对这六个条件属性依次完成约简后,最后得到的约简尺度组合为0,0,0,3,2,2.

最后,将本文算法与Li and Hu15LM算法进行对比,其结果如表4所示.显然,本文的算法在运行时间上有很大的优势,在处理条件属性较多的数据集时优势更明显.

表4   本文算法与LM算法在五个数据集上得到的最优尺度结果

Table 4  Optimal scale results of our algorithm and LM algorithm on five datasets

编号数据集最优尺度运行时间(s)
本文算法LM算法
1Iris3,1,1,10.374310.47409
2Wine2,1,0,1,0,0,0,1,2,0,1,1,113.501247640.03485
3Glass1,1,0,1,1,1,1,0,113.79049682.80907
4Happiness0,0,0,3,2,20.565211.18480
5Fire0,0,0,0,1,1,1,0,0,10.4203725.89407

新窗口打开| 下载CSV


表5为五个UCI数据集利用KNN算法在原始数据集与本文算法得到的分类精度,图2则为Glass数据集的原始数据集与本文算法分类精度对比图.可以看出,和原有数据集相比,本文算法的分类精度有明显的提高.因此,通过本文提出的模型算法能够有效地解决多尺度优势单值中智决策系统的属性约简与尺度选择问题,并有效地提高时间效率和分类精度,减少冗余属性.

表5   原始数据集与本文算法在五个UCI数据集上的分类精度比较

Table 5  Classification accuracy of original dataset and our algorithm on UCI datasets

编号数据集分类精度本文算法约简后条件属性数
原始数据集本文算法
1Iris95%96.67%4
2Wine97.75%98.88%8
3Glass47.62%52.38%7
4Happiness46.48%50.70%3
5Fire90.08%92.56%4

新窗口打开| 下载CSV


图2

图2   Glass数据集的原始数据集与本文算法的分类精度对比

Fig.2   Classification accuracy of original dataset and our algorithm on Glass dataset


4 结论

本文主要研究多尺度优势单值中智粗糙集的最优尺度选择和约简问题.首先,引入了相对距离有利度作为评判单值中智集优势关系的标准.其次,通过结合多尺度决策系统的概念,构建多尺度优势单值中智粗糙集模型,并给出在该模型下的信任函数和似然函数,讨论得出最优尺度的选择和约简算法.最后,利用Matlab R2020b软件分别对五组UCI数据集在时间效率和分类精度两个方面验证算法的有效性.实验结果表明,本文算法的时间效率和分类精度都有所提高,弥补了传统最优尺度选择算法的不足,能够有效解决多尺度优势单值中智粗糙集模型的最优尺度选择和约简问题,但在模型评估精度方面仍有待提高.考虑到信息系统代价信息的影响,在后续的

工作中将讨论基于代价敏感的多尺度单值中智粗糙集模型及其在审计中的应用,即通过测试代价和延迟代价刻画系统代价并解决在给定代价场景下的最优尺度选择问题.

参考文献

Pawlak Z.

Rough sets

International Journal of Computer & Information Sciences,198211(5):341-356.

[本文引用: 1]

Pang BMi J SXiu Z Y.

L⁃fuzzifying approximation operators in fuzzy rough sets

Information Sciences,2019(480):14-33.

[本文引用: 1]

Tan A HWu W ZQian Y Het al.

Intuitionistic fuzzy rough set⁃based granular structures and attribute subset selection

IEEE Transactions on Fuzzy Systems,201927(3):527-539.

[本文引用: 1]

Chen NXu Z SXia M M.

Interval⁃valued hesitant preference relations and their applications to group decision making

Knowledge⁃Based Systems,2013(37):528-540.

[本文引用: 1]

Greco SMatarazzo BSlowinski R.

Rough approximation of a preference relation by dominance relations

European Journal of Operational Research,1999117(1):63-83.

[本文引用: 2]

Zhang CLi D YKang X Pet al.

Neutrosophic fusion of rough set theory:An overview

Computers in Industry,2020115103117.

[本文引用: 1]

黄兵.

优势区间直觉模糊粗糙模型及应用

南京大学学报(自然科学),201248(4):367-375.

[本文引用: 1]

Huang B.

Dominance interval⁃valued intuitionistic fuzzy⁃rough set model and its application

Nanjing University (Natural Sciences),201248(4):367-375.

[本文引用: 1]

江效尧黄兵.

优势模糊区间目标粗糙集模型的群决策规则获取及应用

南京大学学报(自然科学),201248(4):429-435.

[本文引用: 1]

Jiang X YHuang B.

Rules acquisition of group decision⁃making based on dominance and fuzzy interval objective rough set model and its application

Nanjing University (Natural Sciences),201248(4):429-435.

[本文引用: 1]

李佳梁吉业庞天杰.

一种基于优势粗糙集的多属性决策排序方法

南京大学学报(自然科学),201652(5):844-852.

[本文引用: 1]

Li JLiang J YPang T J.

A sorting method of multi⁃attribute decision making based on dominance rough set theory

Nanjing University (Natural Sciences),201652(5):844-852.

[本文引用: 1]

Smarandache F.

A unifying field in logics:Neutrosophic logic

.American Research Press,1999.

[本文引用: 1]

Dai S SPei D WWang S M.

Perturbation of fuzzy sets and fuzzy reasoning based on normalized Minkowski distances

Fuzzy Sets and Systems,2011189(1):63-73.

[本文引用: 1]

Ye J.

Improved cosine similarity measures of simplified neutrosophic sets for medical diagnoses

Artificial Intelligence in Medicine,201563(3):171-179.

[本文引用: 1]

Huang BYang XFeng G Fet al.

Relative measure⁃based approaches for ranking single⁃valued neutrosophic values and their applications

International Journal of Machine Learning and Cybernetics,2021DOI:10.1007/s13042-021-01464-9 .

[本文引用: 4]

Wu W ZLeung Y.

Theory and applications of granular labelled partitions in multi⁃scale decision tables

Information Sciences,2011181(18):3878-3897.

[本文引用: 2]

Li FHu B Q.

A new approach of optimal scale selection to multi⁃scale decision tables

Information Sciences,2017(381):193-208.

[本文引用: 2]

吴伟志杨丽谭安辉,.

广义不完备多粒度标记决策系统的粒度选择

计算机研究与发展,201855(6):1263-1272.

[本文引用: 1]

Wu W ZYang LTan A Het al.

Granularity selections in generalized incomplete multi⁃granular labeled decision systems

Journal of Computer Research and Development,201855(6):1263-1272.

[本文引用: 1]

吴伟志庄宇斌谭安辉,.

不协调广义多尺度决策系统的尺度组合

模式识别与人工智能,201831(6):485-494.

Wu W ZZhuang Y BTan A Het al.

Scale combinations in inconsistent generalized multi⁃scale decision systems

Pattern Recognition and Artificial Intelligence,201831(6):485-494.

吴伟志孙钰王霞,.

不协调广义多尺度决策系统的局部最优尺度组合选择

模式识别与人工智能,202134(8):689-700.

[本文引用: 1]

Wu W ZSun YWang Xet al.

Local optimal scale combination selections in inconsistent generalized multi⁃scale decision systems

Pattern Recognition and Artificial Intelligence,202134(8):689-700.

[本文引用: 1]

陈应生李进金林荣德,.

多尺度集值决策信息系统

控制与决策. 2021,DOI:10.13195/j.kzyjc.2020.0882 .

[本文引用: 1]

Chen Y SLi J JLin R D,et al.

Multi⁃scale set valued decision information system

Control and Decision. 2021,DOI:10.13195/j.kzyjc.2020.0882 .

[本文引用: 1]

陈应生李进金林荣德,.

多尺度覆盖决策信息系统的布尔矩阵方法

模式识别与人工智能,202033(9):776-785.

[本文引用: 1]

Chen Y SLi J JLin R Det al.

Boolean matrix approach for multi⁃scale covering decision information system

Pattern Recognition and Artificial Intelligence,202033(9):776-785.

[本文引用: 1]

郑嘉文吴伟志包菡,.

基于熵的多尺度决策系统的最优尺度选择

南京大学学报(自然科学),202157(1):130-140.

[本文引用: 1]

Zheng J WWu W ZBao Het al.

Entropy based optimal scale selection for multi⁃scale decision systems

Journal of Nanjing University (Natural Science),202157(1):130-140.

[本文引用: 1]

张清华张雪秋庞国弘.

多尺度决策系统中代价敏感的最优尺度组合

控制与决策,202136(10):2369-2378.

[本文引用: 1]

Zhang Q HZhang X QPang G H.

Cost⁃sensitive optimal scale combination in multi⁃scale decision systems

Control and Decision,202136(10):2369-2378.

[本文引用: 1]

陈盼盼林梦雷.

基于包含度的单值中智决策信息系统属性约简

计算机工程与应用,202056(12):175-181.

[本文引用: 1]

Chen P PLin M L.

Attributes reduction of single valued neutrosophic decision information system based on inclusion degree

Computer Engineering and Application,202056(12):175-181.

[本文引用: 1]

Huang BWu W ZYan J Jet al.

Inclusion measure⁃based multi⁃granulation decision⁃theoretic rough sets in multi⁃scale intuitionistic fuzzy information tables

Information Sciences,2020(507):421-448.

[本文引用: 2]

Huang BLi H XFeng G Fet al.

Double⁃quantitative rough sets,optimal scale selection and reduction in multi⁃scale dominance IF decision tables

International Journal of Approximate Reasoning,2021(130):170-191.

[本文引用: 2]

牛东苒吴伟志李同军.

广义多尺度决策系统中基于可变精度的最优尺度组合

模式识别与人工智能,201932(11):965-974.

[本文引用: 2]

Niu D RWu W ZLi T J.

Variable precision based optimal scale combinations in generalized multi⁃scale decision systems

Pattern Recognition and Artificial Intelligence,201932(11):965-974.

[本文引用: 2]

Zhang Q HCheng Y LZhao Fet al.

Optimal scale combination selection integrating three⁃way decision with Hasse diagram

IEEE Transactions on Neural Networks and Learning Systems,20211-15DOI:10.1109/TNNLS.2021.3054063 .

[本文引用: 1]

Hao CLi J HFan Met al.

Optimal scale selection in dynamic multi⁃scale decision tables based on sequential three⁃way decisions

Information Sciences,2017415-416213-232.

[本文引用: 1]

/