决策演化集是处理决策规则在时间序列上演化问题的理论,它将着眼点从静态的决策信息系统转移到动态的时间序列上,研究决策信息系统随时间变化时的演化规律,是一种新的决策规则研究方法.在决策演化集理论体系下预测规则伴随实际规则产生,因此预测规则必然对实际规则产生影响.为了解释预测规则和实体规则之间的相互关系,引入卷积方法,在时间序列上构建预测规则和实际规则的演化混合矩阵,并利用该矩阵对决策信息系统进行预测分析.
属性约简是粗糙集理论的核心研究内容之一.为满足不同用户对约简的不同需求,针对多用户偏好改变的情形,提出一种面向多用户的三支动态属性约简方法.首先,融合多用户偏好,定义用户偏好矩阵描述多用户下各属性偏好度;然后,结合属性偏好度和现实问题的代价,提出用户偏好指标,表示属性在当前用户组下的重要程度,并作为启发信息选择属性;最后,利用三支决策理论对约简集合和非约简集合进行属性的三分而治,达到更新约简的目的.实例分析及实验结果验证了方法的可行性和有效性,并且得到的约简能较好地满足多用户需求.
三元概念的构造方法是三元概念分析的核心问题之一,当条件逐个增加时,研究三元概念的增量式构造方法.首先,详细分析增加一个新的条件后原三元背景中三元概念的变化以及新增加的条件对新背景的三元概念的影响.分别针对下述四种情况给出充分必要条件:(1)新添加的条件对原背景的三元概念不影响,它仍旧是新三元背景的三元概念;(2)原背景的三元概念被替换掉,它不再是新三元背景的三元概念,替换后的三元概念的外延和内涵与原来一致,但是方式增加了新的条件;(3)原背景的三元概念与新的条件共同生成一个新的三元概念;(4)新增加的条件不借助任何原背景的三元概念生成新的三元概念.在此基础上给出基于条件的三元概念的增量式构造算法.最后,通过实例阐明增量式方法生成三元概念的详细过程.
脑机接口(Brain Computer Interface,BCI)作为一种新型的信息沟通与控制手段,是一个涉及神经科学、信号处理以及模式识别等多个学科的交叉研究课题.基于运动想象的BCI系统被认为是最具发展前景的一种脑机接口系统.针对基于机器学习方法构建脑电特征与运动想象之间的映射关系进行分类时,现有方法仍存在无法兼顾脑电信号的时?空域特征并且分类精度难以提高的问题,提出一种基于注意力机制的双向长短时记忆网络(ABiLSTM)和卷积神经网络(Convolutional Neural Network,CNN)的运动想象脑电分析方法,通过ABiLSTM和CNN相结合的方式提取更具表征性的脑电信号深层特征.综合上述研究,最终构建的ABiLSTM?CNN分类模型在公共数据集上取得了90.72%的平均准确率,证明ABiLSTM?CNN运动想象脑电信号分类模型具有很理想的分类性能.
形式概念分析是一种有效的知识表示和知识发现的方法,形式背景和形式概念是形式概念分析中的两个基本概念.形式背景描述了对象集和属性集间的一个二元经典关系,隐含其中的知识通过概念格的形式表示出来.形式模糊背景是形式背景在模糊集理论下的自然推广,建立在其上的模糊概念格在实际应用中面临许多困难,为此,多种形式的模糊概念格的改进形式应运而生.单边模糊概念格就是一种具有较好应用前景的改进模糊概念格.主要研究基于经典?模糊概念格的形式模糊背景的属性约简问题,这里属性约简的概念具有保持相应的概念格整体结构不变的含义.关于属性约简,给出了多种形式的属性约简判定定理,针对属性约简,将所有属性分为三类,探究了不同类型属性的特征刻画.最后,通过引入模糊概念间的辨识属性集的概念,得到了基于辨识属性矩阵的属性约简方法,并通过示例验证了属性约简方法的可行性.
软集是利用参数化方法处理不确定性问题的重要工具,在决策领域其基本思想是在不同的参数下采取不同的决策,属于软决策模式.而软集的优势矩阵作为软集合的一种表示方法,蕴藏着丰富的信息,如何在软集的优势矩阵部分已知的情况下依旧能够完整还原软集是讨论的重点.专注于软集优势矩阵高低对角线的讨论,通过研究发现优势矩阵的高低对角线上的性质对于还原软集十分有帮助.首先给出优势矩阵高低对角线的基本定义及其结构特点;其次,针对软集合的不交性、单调性、分块等信息特征,给出高低对角线上对应的特征和性质;最后,依据优势矩阵高低对角线上的元素分两个阶段设计还原算法,并针对算法还原时间以及算法第一阶段还原率等指标进行仿真实验.实验结果显示,对于第一阶段还原率,在0,1元素个数比为0.5时,第一阶段还原率最高,而在软集中,0,1元素个数之比不变时,增加参数与对象的个数对于第一阶段还原率影响不大,即还原率依旧取决于0,1元素个数比.算法运行时间方面,在控制其他变量下,增加参数个数或对象个数都会直接的导致还原时间增加.
多标记学习广泛应用于图像分类、疾病诊断等领域,然而特征的高维性给多标记分类算法带来时间负担、过拟合和性能低等问题.基于多粒度邻域一致性设计相应的多标记特征选择算法:首先利用标记空间和特征空间邻域一致性来粒化所有样本,并基于多粒度邻域一致性观点定义新的多标记邻域信息熵和多标记邻域互信息;其次,基于邻域互信息构建一个评价候选特征质量的目标函数用于评价每个特征的重要性;最后通过多个指标验证了所提算法的有效性.
作为人工智能领域的一个重要方向,粒计算在数据挖掘和知识发现方面的研究呈现较大优势.针对具有多尺度决策的信息系统的知识获取问题,提出用证据理论研究具有多尺度决策的信息系统的最优尺度选择问题.首先介绍具有多尺度决策的信息系统及其尺度选择的概念,阐明尺度选择的全体构成一个格结构;其次,给出具有多尺度决策的信息系统在不同尺度选择下信息粒的表示及其相互关系;最后,定义协调的具有多尺度决策的信息系统的最优尺度选择概念,并用证据理论中的信任函数和似然函数刻画最优尺度选择的特征.
针对不完备信息提出一种新的基于矩阵方法的极大相容块求取算法与属性约简方法,结合智能分类器给出不完备信息条件下的故障诊断方法.首先,通过矩阵方法计算不完备决策表中的极大相容块;然后,利用所求得的极大相容块,提出一种新的属性约简算法,并与其他方法做对比;最后,将所提出的基于极大相容块的属性约简方法与智能分类器(支持向量机、随机森林、决策树等)结合,建立优化的智能故障分类器,将它应用于不完备信息条件下的故障诊断.以汽轮机组的故障诊断为例进行仿真实验,实验结果表明提出的针对不完备信息条件下的故障诊断方法可行、有效.
多示例学习(Multi?Instance Learning,MIL)研究对象的内部结构比单示例学习更加复杂.已有的MIL方法大都基于原始空间中的实例进行包映射,但这些方法通常忽略包的内部结构信息,难以保证所选实例与包在新特征空间中的关联性.提出一种多示例学习的两阶段实例选择和自适应包映射(TAMI)算法.首先,实例选择技术根据包中实例的密度值和关联性,挖掘包内结构特征,选取实例原型;其次,实例选择技术选取具有峰值密度的实例原型作为代表实例;最后,自适应包映射技术通过定义新的映射函数将包转换为单向量进行学习.实验利用显著性检验从统计学的角度验证了TAMI在图像检索、文本分类等基本数据集上的有效性.结果表明,TAMI在图像检索和医学图像数据集上取得了比其他MIL算法更好的效果,并在文本分类数据集上表现良好.
蛋白质的结构和功能特性由其氨基酸序列编码,控制序列结构映射的规则被认为是二级遗传密码,氨基酸字母表的简化可以减少蛋白质序列中的冗余,有助于揭示编码规则.基于氨基酸的单体特征、成对相互作用和相似性,可以简化氨基酸字母表.目前,仅基于蛋白质的序列信息,根据最近邻氨基酸的出现频率构建了一个氨基酸的嵌入表示.在此基础上,提出一种通过重构最近邻氨基酸的出现频率来压缩嵌入表示的模型,将此方法命名为AA2Vec.实验结果表明,与其他表示维相比,特定表示维(三维)具有显著的鲁棒性.提取的信息捕捉了氨基酸的物理化学和生化特性以及最近邻氨基酸之间的相互作用.值得注意的是,提出的方法对于具有不同序列标识的序列数据集(SCOPe)是稳定的.这种方法给出了氨基酸的最简表示,有助于生成蛋白质序列的简化表示和建立蛋白质的简化模型.
传统机器学习方法和深度神经网络在训练模型的过程中都需要大量标记样本作为支撑,然而标记大量样本是一个耗费巨大的过程,并且真实场景变化莫测,获得所有类别的标记样本是不现实的.因此,研究者开始突破标记样本的限制,提出一种更符合现实的场景——开放集识别(Open Set Recognition,OSR).OSR要求建立的模型不仅能分类训练过程中出现的类别,还可以有效地处理未见过的类别.近年来,OSR迅速发展成为热点领域,大量的工作围绕OSR展开.对现有的OSR工作进行总结:首先,从定义上将OSR与其他相关工作进行区分;其次,按照模型建立、度量选择、增量特点对OSR算法进行总结,并介绍了OSR的两种理论;最后展望了OSR未来的发展方向.
可解释性矩阵分解解决了概率矩阵分解缺乏可解释性的问题,然而概率矩阵分解假设评分数据是服从正态分布的,这与实际场景有一定的偏差.针对该问题,提出一种可解释性泛化矩阵分解推荐算法.首先采用一种新型的变换函数使原始评分近似服从正态分布,然后通过可解释性矩阵分解获得预测评分,最后利用对应的逆变换函数将预测评分映射回原始评分区间.在三个数据集上进行实验,结果表明,与多个主流矩阵分解算法相比,提出的算法在多个评价指标上占优.
随着互联网时代的到来,推荐系统已经成为人们在网络上筛选资源的得力助手,传统推荐系统通过用户的评分信息来计算用户相似度并为用户进行资源的推荐,但仍存在冷启动、数据稀疏性等各种问题,极大地影响推荐质量.近年来,标签的出现带给推荐系统新的机遇,它能够具体准确地描述用户的兴趣偏好,使推荐系统可以通过标签属性来更准确地了解用户喜好,从而为用户进行个性化推荐,极大提高了推荐精度和用户满意度.结合标签属性与评分的关系来计算用户标签相似度,结合用户和资源信息来计算用户相似度,将两者同时融入矩阵分解模型中,从而加强了推荐依据,提升了推荐的准确性.实验结果表明,在ml?latest?small数据集上,提出的算法UTagJMF的RMSE降低2%左右;在Hetrec2011?movielens?2k数据集上,UTagJMF的RMSE降低2.2%左右.证明提出的算法模型明显优于其他算法的预测效果.
物联网数据是当前一类典型的大数据,其应用正成为诸多行业领域的热点,围绕物联网数据的应用往往可以被表示为由一组大数据处理与分析任务构成的工作流.与传统工作流不同的是,IoT(Internet of Things)环境下这种数据驱动的工作流具有数据来源分散、数据规模大、云边协同分布执行等特点,给IoT数据工作流的执行带来了数据流控制管理、数据传输调度等方面的诸多挑战.针对IoT数据工作流的执行约束和数据传输优化问题,提出一种面向IoT数据工作流的分割与调度优化方法.首先对IoT数据工作流的执行约束条件、边缘节点负载以及数据传输量进行建模,进而以数据传输和执行时间优化为目标设计一种云边架构下IoT数据工作流的分割算法和子工作流执行调度算法.通过基于WorkflowSim的仿真实验结果表明,提出的算法与典型的HEFT和MINMIN算法相比,可以在保障边缘节点执行约束和负载均衡的条件下有效降低IoT数据工作流的执行时间.
智慧城市的迅速发展为人们的日常生活带来了极大的便捷,其中视频监控系统越来越智能化是信息技术逐渐成熟的必然结果.人体行为识别是智能安防监控领域的重要任务之一,但大量的边缘监控设备产生了井喷式图像视频数据,传统单一的云计算模式已无法全面有效地应对海量数据的计算与处理.提出一种大数据驱动下采用边云协同计算的人体行为识别机制,将以往中心化的计算扩展为边缘、云端协同处理.首先,在边缘节点
利用高通量测序筛选心房颤动(房颤)伴脑卒中患者外周血单核细胞中差异表达的lncRNAs,为从分子水平探讨房颤脑卒中发生发展机制提供实验依据,并寻找预测房颤脑卒中相关生物学标志物.应用高通量测序检测三例房颤伴脑卒中患者和三例房颤患者外周血单核细胞lncRNAs差异表达,进行基因本体论(Gene Ontology,GO)、代谢信号通路(Pathway)分析,建立lncRNAs?miRNAs共表达网络,并进行实时荧光定量PCR(qRT?PCR)验证.与对照组相比,房颤伴脑卒中患者差异表达301条lncRNA,其中上调143条,下调158条,上调和下调表达差异最大的是LINC01002,HCG18等基因.GO功能分析发现,差异表达基因参与疾病发生发展最主要的生物学过程包括结合、肽交联、高渗反应、内肽酶活性的调节、细胞体积的正向调节等.KEGG分析后发现,差异表达的lncRNA相关信号通路主要涉及免疫系统和炎症等相关.TCONS_00014860,TCONS_00020132,TCONS_00037601,TCONS_00003375,TCONS_00013755是lncRNAs?miRNAs共表达网络中结合节点最多的前五个lncRNAs,hsa?miR?619?5p是共表达网络中与lncRNAs作用最多的节点.qRT?PCR验证LINC01002,HCG18在两组人群中差异表达具有统计学意义.其与房颤相比,房颤伴脑卒中患者外周血存在差异表达lncRNA,与房颤发生脑卒中相关.XLOC_005045,XLOC_006945,XLOC_013107,XLOC_001139和XLOC_004677是共表达网络中结合节点最多的前五个lncRNAs,lncRNA?hsa?miR?619?5p可能在房颤伴脑卒中的发病机制中起到重要作用.同时,LINC01002,HCG18可以作为预测持续性房颤合并卒中的新型生物学标志物.