传统机器学习方法和深度神经网络在训练模型的过程中都需要大量标记样本作为支撑,然而标记大量样本是一个耗费巨大的过程,并且真实场景变化莫测,获得所有类别的标记样本是不现实的.因此,研究者开始突破标记样本的限制,提出一种更符合现实的场景——开放集识别(Open Set Recognition,OSR).OSR要求建立的模型不仅能分类训练过程中出现的类别,还可以有效地处理未见过的类别.近年来,OSR迅速发展成为热点领域,大量的工作围绕OSR展开.对现有的OSR工作进行总结:首先,从定义上将OSR与其他相关工作进行区分;其次,按照模型建立、度量选择、增量特点对OSR算法进行总结,并介绍了OSR的两种理论;最后展望了OSR未来的发展方向.
电子信息技术的飞速发展,使电磁污染问题日益严重,开发具有“薄、轻、宽、强”性质的吸波材料显得尤为重要.石墨烯材料有着大比表面积、高电导、密度低和强介电损耗等优点,但也存在阻抗匹配性差、损耗机制单一等缺陷.对石墨烯的形貌和结构等进行设计,能够有效改善阻抗失配的问题.此外,将石墨烯材料与其他损耗材料复合构造多元协同损耗的复合材料,能够实现对电磁波的高效、宽频吸收.简要讨论了电磁吸波机理,综述了近年来石墨烯基吸波材料的研究现状,并对其未来研究方向进行展望.
以锂电池二阶RC等效电路模型为研究对象,将电池模型RC参数的辨识问题归结为非线性最优化问题,建立非线性最小二乘优化模型,采用Levenberg?Marquard(LM)算法对其进行求解.该优化问题不仅是非线性的,而且非凸,因此需要对优化算法中的初始值进行选取,同时放电电流大小的变化也会影响参数求解结果的稳健性.为解决这两个问题,首次提出一种简单有效的RC参数初始值的选取方法和调整最优化模型中的目标函数的方法,保证该算法在不同放电电流情况下均能得到正确的解.仿真结果表明:在选定合适的初始值的情况下,该算法能够快速准确求解模型中的RC参数值.
纳米颗粒被广泛应用于社会生活的各个领域,其生物效应亟须研究.一旦纳米颗粒与生物体液接触,其表面会迅速吸附一层蛋白质分子(蛋白冠),从而使得纳米颗粒具有了新的生物学特性.不同于体外环境,含有蛋白冠的纳米颗粒才是它们在生物体内的真实状态.纳米颗粒的理化特性(例如粒径、形状、表面修饰等)可以影响蛋白冠的组成.与此同时,外界环境条件(例如培养基组成、培养时间、温度、pH等)也是影响蛋白冠组成的重要因素.蛋白冠的存在会影响纳米颗粒和生物体间的相互作用,改变纳米颗粒的生物吸收、生物分布以及生物毒性.尽管如此,不同蛋白质分子与纳米颗粒表面特异性结合的内在机制目前尚不清楚,同时生物体内蛋白冠?纳米颗粒复合体的动态变化研究手段还较少,这些都是未来需要解决的问题.
蒙脱石是地表最为常见的一种粘土矿物,层间阳离子交换是蒙脱石矿物的基本属性之一,并因此而成为被广泛应用的矿物材料.通过研究钠基蒙脱石(两层水状态)的阳离子交换特征,在分子层次上探究了K+,Mg2+,Ca2+,Ba2+从环境溶液进入蒙脱石层间并与Na+离子的交换行为.模拟结果显示不同离子交换量顺序为:Ba2+>Ca2+>K+>Mg2+,即水化能力弱的阳离子更容易和层间Na+离子发生交换;离子的水化能力还与其在蒙脱石层间的空间分布密切相关,水化能力最强的Mg2+离子远离蒙脱石表面而倾向于出现在层间区域的中间,Ca2+与Ba2+离子则部分出现在结构层表面四面体取代位置;K+离子的分布具有特殊性,被紧缚在硅氧烷六元环中央空穴处.阳离子进入蒙脱石层间是自由能下降的过程,进入层间的阳离子活动性远低于孔隙流体中的离子,其中Ba2+离子的自扩散系数最低.本文在原子层次上揭示的蒙脱石阳离子交换动力学过程有助于加深对粘土矿物?流体相互作用机制的理解.
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100?TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法.
知识追踪通过学习者历史作答数据动态追踪学习者的认知状态并预测他们未来的答题表现,然而,现有的知识追踪模型通常只利用试题中考查的知识点来表征,没有考虑试题本身蕴含的重要知识情境特征,这限制了模型的效果.此外,和融合教育先验的认知诊断方法相比,知识追踪模型的可解释性略有不足.为了解决上述问题,提出一种知识情境感知的深度知识追踪模型,通过知识情境表征模块来获取试题深层次的知识权重、试题难度等知识情境特征.在知识聚合模块中,模型将知识权重嵌入学习者面向试题的作答能力的计算,最后,在学习预测模型中引入猜测和失误因素,通过认知诊断模型来优化实际场景中的预测表现,进一步提高模型的预测性能.和现有方法相比,提出的模型在试题层级上取得了更好的预测结果,同时体现了模型可解释性方面的优势.
采用密度泛函理论的B3LYP方法,在6?31++G(d,p)基组水平研究第一系列过渡金属二价离子对甘氨酸的配位能力,在M06/6?311+G(d,p)水平上计算构型单点能量与前者对照.每种金属离子配合物的最稳定构型中甘氨酸以羧基的两个O原子配位.金属离子对甘氨酸的配位能力由大到小的次序为Cu2+>Ni2+> Co2+>Zn2+>Cr2+> Fe2+>V2+>Mn2+>Ti2+>Sc2+;结合能最大达到-1012.1 kJ·mol-1.每种构型中轨道相互作用能与静电相互作用能所占比率在50%左右(相差不多),色散作用仅为0.2%.轨道作用能越大的构型,电子转移数越多.
月壤处于固体月球与太阳系物质和能量之间的边界层,对认识月球及其空间环境有重要作用.自Apollo计划返回月球样品以来,由于月壤成因复杂、组分多样,文献中对月壤进行了不同的分类以进行不同内容的研究.与岩石不同,月壤的分类十分复杂,并且经常混用.我国嫦娥5号月壤样品的返回使得有必要对已有的月壤样品分类及其相关研究进行总结讨论.基于对文献中关于月壤分类方案的总结,从粒径和成分(颗粒)特征两方面论述了相关的研究方向和成果,并简述了一些新的分类方法及应用,以期为月壤样品的精细化分类研究提供科学依据.
二氧化碳管道运输技术是二氧化碳捕集技术和利用技术的纽带,连接着起源地和储存地,可以持续不间断地输送二氧化碳,经济效益高、性价比高,符合可持续发展的准则,其中超临界输送是未来二氧化碳管道输送的主要方式.从管道输送的原理、国内外CO2管道输送技术现状、国内外CO2管道安全输送控制技术研究以及典型CO2管道输送示范工程四个方面入手,系统、具体地介绍了CO2管道运输的发展,同时展望了未来发展的趋势.
近年来,深度学习在很多领域都得到了广泛的应用,然而基于深度学习的人工智能应用正面临严重的隐私泄露风险,虽然研究人员提出了很多相应的防御机制,但这些方法大都存在以下问题:对攻击者掌握的背景知识有过多的假设、不具有通用性以及高复杂度和高计算代价.尝试从差分隐私的角度出发构造一个通用隐私保护防御算法.目前在深度学习领域,应用最广泛的差分隐私算法是DPSGD(Stochastic Gradient Descent with Differential Privacy),但在应用DPSGD的过程中难以选择合适的参数以达到良好的拟合效果;此外,其隐私损失的度量机制也较为复杂.为解决这些问题,提出DPADAM(Adaptive Moment Estimation with Differential Privacy)算法,同时引入zCDP(Zero?Concentrated Differential Privacy)作为隐私损失的度量机制,使其在应用过程中更加简单灵活.实验证明,DPADAM算法能够有效解决参数依赖问题,在确保隐私性的同时提高模型的拟合效果.
微服务技术的快速发展为企业系统集成和网络化业务协同提供了技术支持,软件服务系统中的流程需要不断演化以适应业务变化的需求,而现有的研究多从单一维度评估服务流程演化的影响.提出包括流程层和服务层在内的服务系统双层依赖关系模型DoubleDM,从服务演化和流程演化两个方面分析服务系统演化问题.针对服务层演化,基于服务间的依赖关系分析服务变更的影响范围,给出了服务依赖关系表达、依赖关系演化影响范围及求解和相应算法;针对流程演化的不同类型,给出了流程依赖基础上的流程化简处理步骤和算法.最后给出了微服务系统中流程演化的实现逻辑,并以微服务系统处理供应链销售流程为例进行了分析.
电卡效应是一种新型凝聚态制冷效应,其来源于极性材料的电致相变导致的偶极有序度的可逆调控.由于使用电容型场效应(无载流子输运),电卡制冷循环能量可逆性好、介电损耗低,在单次极化?退极化循环中材料能量回复效率接近85%.因此,电卡制冷器件具有理论能效高、制冷功率密度大、器件集成度高、易维护、噪音低和尺寸缩放可控等优点.同时,由于其直接使用电能作为驱动,无需压缩机、永磁体等触发二次能量转换,能更方便地与民用、商用环境结合.综合各项指标,电卡效应具有的潜在技术优势不容忽视,被国际上多个组织认为有望成为一种大规模应用的替代制冷方式.然而,目前电卡制冷系统所使用的各类单相材料各自存在难以突破的缺陷.为了结合不同体系材料的优势,设计并制备复合材料是领域内重要的研究方向.综述电卡制冷复合材料的发展与其在柔性制冷/热泵系统中的应用,并展望电卡固态热管理技术在一揽子零碳技术中的未来发展方向与潜力.
在网络信息技术已非常成熟的今天,各类敏感词包括色情、暴力、政治敏感等有害词汇充斥网站和社交软件,对这些词语的检测与识别对营造健康的网络环境非常必要.这些敏感词绝大部分试图通过读音或者字形相近来进行伪装以逃避检测系统.现有的匹配算法可以检测出读音完全一样的词语,但不能准确识别读音相近和字形相近的异体字.为解决这一问题,提出针对模糊匹配的汉字相似度对比算法.首先通过对汉字进行特殊编码,提出一种综合考虑读音及字形特点的音形码汉字相似度改进算法,然后针对传统字典树,添加了精度参数来设置匹配精度,以此完成敏感词检测.实验结果计算表明,在常用相似汉字数据集上,匹配准确度提高8%~39%,错误率减少6%~38%.
邻域搜索算法的关键是邻域结构的选择,但每次迭代搜索的时间较长,缺少在解空间内自主搜索的能力.利用深度强化学习(DRL)模型对邻域搜索算法进行改进,设计了一个新的深度混合型邻域搜索(DHNS)模型来求解带容量的车辆路径问题(CVRP).首先,利用贪婪算法为DRL模型提供初始解;其次,采用指针网络以及Transformer混合编码,利用不同网络的优势,深层次地提取节点特征信息;最后,将修复算子的修复过程转至DHNS模型,自动完成邻域搜索修复解的过程,扩大解空间的自主搜索能力.同时,针对混合编码中复杂传输机制以及解码输出误导性信息的问题,进一步在编码和解码过程中添加AOA (Attention on Attention)机制.AOA负责筛选有价值的信息,过滤不相关或误导性信息,有效刻画了注意力结果和查询之间的相关性,并对节点间的关系进行建模.实验结果表明,DHNS模型在100规模CVRP的优化效果上,优于现有DRL模型和部分传统算法.采用CVRPlib数据集中的算例对该算法的效能进行验证,结果表明,采用DHNS模型能够极大地提升路径问题的优化效能.
智慧城市的迅速发展为人们的日常生活带来了极大的便捷,其中视频监控系统越来越智能化是信息技术逐渐成熟的必然结果.人体行为识别是智能安防监控领域的重要任务之一,但大量的边缘监控设备产生了井喷式图像视频数据,传统单一的云计算模式已无法全面有效地应对海量数据的计算与处理.提出一种大数据驱动下采用边云协同计算的人体行为识别机制,将以往中心化的计算扩展为边缘、云端协同处理.首先,在边缘节点
概念漂移是流数据的主要特征之一,如何检测概念漂移的发生以及调整预测模型去适应概念漂移现象备受研究者的关注.目前有关概念漂移的大多数算法仅仅针对单一类型的概念漂移检测,并且需限制输入数据服从某一分布,所以在检测多种类型概念漂移时效果不理想.提出一种在线集成自适应算法(KSHPR),在自适应随机森林(Adaptive Random Forests,ARF)算法和流随机补丁(Streaming Random Patch,SRP)算法的基础上进行优化改进,采用非参数检验与滑动窗口相结合的策略进行概念漂移检测,降低窗口平均值对算法性能的影响,并以此为基础建立四个基学习者的集成学习模型,根据基学习者预测准确率,动态分配权值,有效解决流式数据中学习模型精度低的问题.实验证明,提出的算法在真实数据集和合成数据集中均表现优良,与其他算法相比,该算法的稳定性、分类准确性与多类型概念漂移适应能力均有所提升.
互联网的普及使线上教育迅速发展,在缓解教育资源不均衡问题的同时,也为科研人员提供了大量的研究数据.教育数据挖掘是一个新兴学科,通过分析海量数据来理解学生的学习行为,为学生提供个性化学习建议.知识追踪是教育数据挖掘中的重要任务,其利用学生的历史答题序列预测学生下一次的答题表现.已有的知识追踪模型没有区分历史序列中的长期交互信息和短期交互信息,忽略了不同时间尺度的序列信息对未来预测的不同影响.针对该问题,提出一种基于多尺度注意力融合的知识追踪模型,使用时间卷积网络捕获历史交互序列的不同时间尺度信息,并基于注意力机制进行多尺度信息融合.针对不同学生及答题序列,该模型能自适应地确定不同时间尺度信息的重要性.实验结果表明,提出模型的性能优于已有的知识追踪模型.
针对聚类算法常见的难以确定参数、难以适应各种形状的数据集、在提高算法普适性时时间复杂度增大的问题,提出一种新的聚类算法:结合数据集全局和局部的特征寻找样本点距离的突变位置,通过计算样本点的簇内最小距离实现凸球型数据集的聚类;在此基础上提出子簇连结性强弱的概念,依据两个容易确定的参数进行子簇合并来适应各种形状的数据集.将该算法与DBSCAN (Density?Based Spatial Clustering of Applications with Noise)等多种聚类算法在四种经典数据集上比较,结果表明,该算法适用于类簇形状复杂的数据集,在同等聚类能力的算法中计算速度更快,且具有参数少、易确定的优点,在综合性能上表现优秀.
容量和内阻是评估锂离子电池健康状态和预测其剩余寿命的重要指标,然而电池容量和内阻难以直接在线测量.通过分析锂离子电池充电过程中电流和电压的变化特征后提取出两种健康因子,并且证明所提因子与电池容量高度相关,进一步建立了用于锂电池容量估计的两因子线性回归模型.在此基础上,通过结合BP (back propagation)神经网络和粒子群优化思想设计锂离子电池健康状态估计算法.考虑到锂电池的健康状态和剩余使用寿命之间存在一定的映射关系,因此再利用所提取的健康因子和其健康状态估计结果设计了锂电池的剩余使用寿命预测算法.实验结果表明,所提取的健康因子能够准确地进行电池容量估计并应用于在线评估锂离子电池的健康状态和预测其剩余使用寿命.
制造业在设计、生产、销售和服务环节中产生了文本、图像、音视频等海量多源异构数据,高效地管理与利用这些数据资源为制造业再生产创造价值是当前制造企业面临的重大难题.传统的数据存储与检索系统将多模态数据按不同形式或模态进行分类并单独处理,导致不同模态的数据之间缺乏语义关联(文本、图像、音视频数据之间无法互检),无法支持制造企业的设计、服务等业务流程的智能化.设计并实现了一种面向文本、图片等多源异构数据的跨模态存储与检索系统,实现智能制造多源异构数据的高效管理与检索.具体地,该系统将制造企业生产运营过程中产生的多源异构数据投影到统一的高维语义空间进行表示产生语义向量,并按不同的查询需求将数据存储到不同的模式中;其次,该系统设计了三级结构+分层联通朴素构图算法的高效检索方法,将多源异构数据按照语义向量进行索引,以满足制造业用户的语义查询需求.在flickr30k数据集上进行了实验,实验结果表明:(1)该系统可支持百万级别的跨模态数据存储与检索;(2)百万级别数据下系统检索速率为毫秒级;(3)检索的正确率比现有的向量检索方法更高.
张量分解和深度学习已被应用于推荐系统,并取得了较好的效果.张量分解较好地从用户对推荐对象评分中提取用户、推荐对象以及其他影响因素的隐性的特征,将这些特征进行匹配,给出推荐策略,但这种方法忽略了用户、推荐对象以及其他影响因素现有辅助数据信息中的显性特征.深度学习是从辅助信息中提取用户、推荐对象以及其他影响因素的特征,并进行匹配给出推荐策略,却忽略了用户评分数据中用户、推荐对象以及其他影响因素的隐性特征.将张量分解和深度学习两种推荐方法相融合,提出一种基于张量分解和深度学习的混合推荐算法.使用张量分解算法和深度学习分别从三阶用户评分数据和多源异构辅助信息中提取用户特征和推荐对象特征,并将它们匹配得出用户对推荐对象的需求或喜爱的预测评分,再将两种算法的预测评分进行融合给出最终综合评分,从而提高个性化推荐的精准度.对比实验证明混合推荐算法与传统的协同过滤算法相比误差降低了34.0%.
激光雷达被广泛地应用于云、气溶胶、大气成分、温度和风速的探测当中.应用于大气探测的激光雷达种类繁多,通常会使用不同的分类方法对激光雷达进行归类,使得同一台激光雷达可能会被赋予不同的名称,而被归类于同一类型的激光雷达之间又可能存在显著差异.按照激光雷达的测量角度和测距方式、光谱特征、探测目标、搭载平台等多种分类方法对现有的大气探测激光雷达进行了归纳,描述了各种不同类型激光雷达的特征,并介绍了不同类别激光雷达之间的联系.在实际科研和业务中,需要结合各种激光雷达的优、缺点,根据探测目标、数据质量要求和预算来选择最适合的激光雷达类型来进行大气探测.
近年来,随着全球经济的迅速发展,参与金融投资的投资者增多,如何在复杂的金融市场中自动选择交易策略使收益最大化成为研究热点.强化学习可以通过与实际环境的交互来寻找最优的交易策略,使投资收益最大化.现有的方法大都是将一到两个强化学习算法应用于金融市场并比较算法在单一交易任务上的表现,此外,这些研究大都针对国外的股票、证券市场或加密货币市场,对国内金融市场的研究甚少.针对上述问题,面向国内金融投资市场,系统性地验证了不同类型的多种深度强化学习代表性算法在单只股票交易、多只股票交易和投资组合分配三个投资任务上的有效性.通过观察在累计收益率、夏普比率、最大回撤等评价指标上的回测结果对算法进行比较,结果显示在不同的投资任务中选取合适的强化学习算法可以有效地提升收益.
以直觉模糊信息表为背景,利用粗糙集和模糊集,旨在筛除信息表中冗余的属性,提出获取决策规则的近似约简方法.首先,通过在直觉模糊集中引入带权重评分函数来定义加权直觉模糊序关系;进一步,为了提高模型分类的容错率,结合变精度粗糙集模型构建加权变精度直觉模糊序决策信息表;接着,在该决策表中提出上、下近似约简的判定定理和可辨识矩阵,进而生成两种求解上、下近似约简的方法;最后,通过具体案例和数值实验分析验证了该方法的有效性.
基于脑电图(Electroencephalography,EEG)信号的运动想象(Motor Imagery,MI)意图识别是脑机接口(Brain?Computer Interface,BCI)研究中的重要问题.然而,EEG信号存在严重的个体性差异,不同被试之间的EEG信号特征空间分布差异很大,不同被试之间的分类模型不能通用.针对这一问题,提出一种基于欧式空间的加权逻辑回归迁移学习方法,算法首先将不同被试的EEG数据进行欧几里得空间对齐,使各信号更加相似,减少差异性,然后计算特定被试共空间模式(Common Spatial Pattern,CSP)获得不同的特征值,并计算这些特征值的KL(Kullback?Leibler)散度,进而利用KL散度调整迁移学习的加权逻辑回归算法,得到分类模型.实验结果表明:对于BCI竞赛IV中的数据集2a,提出的方法可以极大地提升BCI的学习性能,算法分类准确率比基线算法(线性判别分析)高出15%.在数据样本增多的情况下,被试的分类准确性也得到了明显的提升,和同类算法相比,分类准确率提升4%,说明提出的算法能进一步提高BCI的学习性能,改善分类模型的通用性问题.
近十年来,通过社交网络(如微博、推特)分享信息已经成为人们日常生活中不可缺少的一个环节,如何有效地预测信息传播的影响力成为社交网络研究中的重要课题,不论是识别病毒式营销和虚假新闻还是精确推荐和在线广告都有许多应用.目前,一些应用深度学习进行社交网络影响力预测的方法已经取得了一定进展,但在进行深度学习时仍会面临以下难点:用户通常具有不同的行为和兴趣并且他们同时通过不同的渠道进行互动;用户之间的关系难以检测和形式化表达.传统的社交网络影响力预测方法通过设计复杂的规则来手动提取用户及其所处网络的特征信息,这一方法的有效性严重依赖于设置规则的专业性,所以很难将某一领域的规则推广到其他领域的应用中去.基于深度神经网络模型,设计一种端到端的神经网络来学习用户的隐藏特征信息以预测其社交网络影响力.首先通过图嵌入的方式对用户的局部网络进行特征提取,然后将特征向量作为输入对图神经网络进行训练,从而对用户的社会表征进行预测.该方法的创新之处:运用图卷积和图关注方法,将社交网络中用户的特征属性和其所处局域网络特征相结合,大大提高了模型预测的精度.通过在推特、微博、开放知识图谱等数据集上的大量实验,证明该方法在不同类型的网络中都有较好的表现.
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi?Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM?Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM?Net在VoiceBank?DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型.