随着机器学习技术的不断发展,深度学习在许多研究领域取得了巨大的突破.然而,多数深度学习方法需要大量的有标注数据进行模型拟合,不符合现实世界的一些应用场景,而零样本学习则可有效地缓解该问题.具体地,零样本学习主要针对样本数量稀少、新样本的出现和分类任务人工标注成本高等一系列问题给出有效的解决方案,对图像分类有重要意义.系统综述基于图像属性的零样本学习方法:首先,系统概述零样本学习的定义及零样本学习的发展历程;其次,对基于图像属性的零样本分类的三类主要方法进行介绍,并讨论了各方法的区别和联系;最后,指出了零样本学习现在仍存在的问题以及未来发展的方向.
将原始数据投影到一个包含几何一致性和簇分配一致性的空间,并且可以自适应学习几乎所有参数的多视图聚类算法,能够获得良好的聚类效果,但这样做没有考虑多视图中不同样本重要性不同的特点,忽视了噪声点与离群点对聚类效果造成的不利影响.针对上述问题,对样本重要性进行研究,提出一种自适应样本加权的多视图聚类算法.该算法对视图中不同的样本根据其重要性进行加权处理:首先给每个样本分配相同的权重,在之后的每次迭代中,不断进行自适应调整直至达到收敛条件.实验结果表明,该算法可以获得更好的实验效果.
针对现有图像去雾方法采用单一大气光值求解、复原图像难以兼顾亮度与远景去雾效果的问题,提出一种融合全局与区域大气光值图的暗通道图像去雾方法.首先提出一种基于最小方差投影的大气光估计方法,减少大气光估计值受极值点的影响,提高大气光估计精度;其次,提出一种基于场景深度的区域大气光估计方法,对不同景深区域独立求解大气光估计,引入景深信息,兼顾改善近景亮度与远景去雾效果;同时,将两者融合,按照大气光值图对高亮区域透射率进行调整优化,既增加了位置相关信息,又提高了区域间的相关性,增强了复原图像亮度的均匀程度,改善了图像质量.实验结果表明,提出的算法与多种文献去雾算法相比,能够较好地平衡复原图像亮度与远景区域去雾效果,有效提高复原图像能见度,雾霾浓度评价指标(FADE)、平均梯度、信息熵及模糊系数等指标均有显著提升,复原图像更加清晰.
为了提高细胞核图像分割的精确性和鲁棒性,提出一种基于改进卷积神经网络的多尺度多层次双注意力图像分割算法.使用SE(Squeeze?and?Excitation)和改进的条纹池化SP(Strip Pooling)整合通道和空间上的信息权重代替传统U?Net编码的最后一层操作以提升对有用信息的关注.在级联路径,提出轻量级的Inception模块,在增加感受野的同时减少参数以获得多尺度的特征.编码和解码信息拼接之前结合注意力机制提高分割精度,使用残差块作为解码部分的基础层,并增加一个侧边输出结构提供多层次的信息.每一层的损失采用阶梯的方式相加,指导监督多层次模型更好的训练,提高模型准确率.在细胞分割数据集上的实验结果表明,该方法的交并比和相似性系数的精度分别达到85.72%和92.02%,和其他网络相比,分割效果更好.
深度聚类在高维较大数据集中应用广泛,得益于神经网络强大的数据特征提取能力,但目前的深度聚类特征提取一般集中在神经网络的中间层,忽略了浅层特征的有用信息.为解决上述问题,提出一种基于神经网络多层特征提取的集成聚类算法(Deep Ensemble Clustering Based on Multi?Level Features,DCMLF),使用三个只有卷积层数不同而其他参数相同的网络结构提取同一个输入的不同层次特征,并进行集成聚类.通过不同层次特征组合实验验证浅层特征对聚类结果的影响,并证明该算法同经典的传统聚类算法以及经典的深度聚类算法相比,聚类性能有所提升.
为了解决传统分类算法在不平衡样本集上分类效果不佳的问题,提出一种新的欠采样boosting集成算法(FECBoost).首先,通过改进的模糊熵反映样本集原始分布的不确定性,并用此模糊熵判断多数类样本所在的区域,称为安全区域或边界区域;其次,利用密度峰值聚类算法选取安全区域的代表性样本以减少分类器的训练时间和样本间的重叠,降低样本的不平衡度,实现静态欠采样;最后,训 练新的boosting集成分类器,在算法每一次迭代之前,基于模糊熵和模糊支持度对多数类样本再次欠采样,使用于训练的样本集达到平衡.该动态欠采样依赖于分类器的训练过程,充分考虑了样本分布的不确定性和错分可能性.通过在真实样本集上的仿真实验验证了提出方法的有效性.
互联网的普及使线上教育迅速发展,在缓解教育资源不均衡问题的同时,也为科研人员提供了大量的研究数据.教育数据挖掘是一个新兴学科,通过分析海量数据来理解学生的学习行为,为学生提供个性化学习建议.知识追踪是教育数据挖掘中的重要任务,其利用学生的历史答题序列预测学生下一次的答题表现.已有的知识追踪模型没有区分历史序列中的长期交互信息和短期交互信息,忽略了不同时间尺度的序列信息对未来预测的不同影响.针对该问题,提出一种基于多尺度注意力融合的知识追踪模型,使用时间卷积网络捕获历史交互序列的不同时间尺度信息,并基于注意力机制进行多尺度信息融合.针对不同学生及答题序列,该模型能自适应地确定不同时间尺度信息的重要性.实验结果表明,提出模型的性能优于已有的知识追踪模型.
三支形式概念分析作为形式概念分析的推广,从正信息和负信息角度对概念进行了更精细和更完整的描述.针对决策形式背景,从三支决策思想的视角研究对象导出三支面向对象概念格(OEO?概念格,Object?induced three?way object?oriented)和属性导出三支面向属性概念格(AEP?概念格,Attribute?induced three?way property?oriented)的规则提取问题.首先,借助三支算子给出OEO?协调以及对象导出面向对象三支决策规则的概念,在此基础上研究其规则与面向对象概念格的决策规则之间的关系,研究结果显示当决策形式背景在OEO?协调和面向对象协调的前提下,两者之间存在包含关系.其次,对偶地,提出AEP?协调和属性导出面向属性三支决策规则的定义,并讨论其与面向属性概念格的决策规则之间的关系,进一步地刻画其与属性导出三支决策规则之间的联系.最后,结合实例详细解释所提出的理论.
为解决大规模异构低能力群组对目标的定位问题,提出一种基于概率融合的异构群组目标定位方法,将由节点传感器数据得到的目标概率分布图进行加权叠加融合后得到综合概率分布图,采用贝叶斯检查器对其中的显著区域进行检测识别,并提取出概率最大点,即为目标所在位置.仿真实验结果表明,所提方法能较好地解决大规模个体的定位问题,对静态目标的定位误差能较快地收敛到5 m左右,对运动目标的定位区域随目标的运动而增大,在某一时刻后误差范围稳定在65 m左右.
目前情绪识别的分类方法很多,但情绪分类模型多具有被试依赖性,基于SEED数据集探索了跨被试情绪识别模型.首先将所有被试的脑电(Electroencephalogram,EEG)数据合并为一个被试,共提取675个trial三类情绪(正性(positive)、中性(neutral)、负性(negative)情绪)的短时傅里叶变换(Short?Time Fourier Transform,STFT)、离散小波变换(Discrete Wavelet Transformation,DWT)特征,并使用ReliefF特征选择算法对特征进行权重排序.其次,从排序好的特征中选择600个trial作为训练集,剩余的作为测试集;然后将K最近邻(K?Nearest Neighbor,KNN)、二次判别分析法(Quadratic Discriminant Analysis,QDA)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、深度置信(信念)网络(Deep Belief Network,DBN)五种分类算法作为分类器,对比研究选出最优的分类框架.结果表明,五种分类器的平均分类精度分别为:KNN 69.21%±3.4%,QDA 52.17%±9.41%,SVM 78.41%±3.8%,RF 83.49%±2.6%,DBN 81.73%±2.22%,可见RF的分类效果最好.分别计算每个分类模型对负性、中性、正性情绪的分类准确率,结果如下:不同分类器对正性情绪的识别效果都比较好;KNN,QDA,SVM对负性和中性情绪的分类效果较差,准确率不高;DBN和RF对负性和中性情绪的识别率较高,能有效地进行情绪识别.以上研究可望为跨被试的情绪识别模型提供参考.
赖氨酸乙酰化(Lysine acetylation,Kace)普遍存在于人体代谢酶中,与多种代谢疾病密切相关,因此准确识别该位点对于代谢疾病治疗的研究具有重要意义.现有的Kace位点预测方法大多采用蛋白质序列层面的信息作为输入,蛋白质结构特性考虑不全面;特征提取时未关注氨基酸残基间顺序相关性,信息丢失严重,降低了预测准确度.提出一种新的Kace位点预测深度学习CL?Kace模型.CL?Kace引入蛋白质结构特性,并与蛋白质原始序列、氨基酸理化属性共同构建位点特征空间,采用卷积神经网络(Convolutional Neural Network,CNN)提取特征;引入双向长短期记忆(Bidirectional Long Short?Term Memory,BiLSTM)网络捕获残基间的顺序依赖关系,以提高网络的抽象能力,识别潜在的Kace位点.实验结果表明,CL?Kace模型优于现有的Kace位点预测器,能够有效地预测潜在的位点.
采用自制的聚?4?甲基?1?戊烯中空纤维膜组装成中空纤维膜式人工肺组件,以去离子水、生理盐水、甘油水溶液和Na2SO3水溶液来模拟血液,按照中空纤维膜内通氧气、中空纤维膜外走模拟液的方式进行体外性能测试,测定膜式人工肺组件在不同的液体流速、气体压力、中空纤维膜根数和模拟液种类下的氧气传输速率.实验表明:随着液体流速的加快、气体压力的变大和中空纤维膜根数的增多,膜式人工肺组件在四种模拟液下的氧气传质性能均对应不同幅度的强化.同时,依据质量守恒定律和双膜理论建立了一种膜式人工肺组件的氧气传质数学模型,为中空纤维膜传质性能研究和人工肺组件的结构优化提供了有益的参考.
通过构建对二甲苯(PX)空气液相氧化制对苯二甲酸(PTA)微界面体系构效调控数学模型,探讨体系气泡大小对气泡运动、氧气传质和PX宏观反应速率的影响.理论计算结果表明,随着体系气泡尺度的减小,气液相界面积和体积传质系数均大幅上升,PX宏观反应速率亦有较大增加.在操作温度和操作压力分别为186.3 ℃和1.2 MPa时,若体系气泡Sauter平均直径d32由5.0 mm减小至0.50 mm,气液相界面积、体积传质系数和PX宏观反应速率分别增大16倍、30倍和1.6倍.此外,冷模试验表明,模拟体系可形成典型的微界面体系.
醋酸异丁酯作为一种绿色溶剂在硝化纤维、涂料、油墨、黏合剂、增香剂和药物等化工产业中有广泛的应用.采用改造的强化固定床反应器,以醋酸甲酯和异丁醇为原料,阳离子交换树脂为催化剂,合成醋酸异丁酯,并对其工艺条件进行优化,探究循环流量、催化剂装载量、反应物摩尔比以及反应温度对合成醋酸异丁酯的影响,以指导工业放大化应用.采用UNIFC基团贡献法计算各个组分的活度系数,获得了不同温度下酯交换反应的平衡常数以及标准摩尔反应焓变、标准摩尔反应熵变、标准摩尔生成吉布斯自由能等热力学数据(
容量和内阻是评估锂离子电池健康状态和预测其剩余寿命的重要指标,然而电池容量和内阻难以直接在线测量.通过分析锂离子电池充电过程中电流和电压的变化特征后提取出两种健康因子,并且证明所提因子与电池容量高度相关,进一步建立了用于锂电池容量估计的两因子线性回归模型.在此基础上,通过结合BP (back propagation)神经网络和粒子群优化思想设计锂离子电池健康状态估计算法.考虑到锂电池的健康状态和剩余使用寿命之间存在一定的映射关系,因此再利用所提取的健康因子和其健康状态估计结果设计了锂电池的剩余使用寿命预测算法.实验结果表明,所提取的健康因子能够准确地进行电池容量估计并应用于在线评估锂离子电池的健康状态和预测其剩余使用寿命.
在频域操作的联合盲源分离算法可以有效解决频点间的内部排序问题,然而对于输出通道的排序,即全局排序,现有的基于频域的联合盲源分离算法仍无法有效确定.使用基于变分自编码器的声源模型,通过预先指定从注册语料中获得的各话者编码向量的排列顺序来调控分离后输出通道的顺序.该方法使用带有实例归一化和自适应实例归一化层的变分自编码器来确保这一排序方式的有效性.此外,为了减少频域上联合盲源分离算法可能出现的块排序问题,提出使用人为构造的两类含噪信号对变分自编码器中的解码器网络单独进行降噪训练的方案.利用实际录制的房间冲激响应的仿真结果表明,该方案可以在保证算法分离性能的同时,有效地按照预期的输出顺序调控输出通道.
研究了多通道分布式主动噪声控制(Distributed Active Noise Control,ANC)系统的空间平滑问题.传统的分布式ANC算法通过本地控制器之间的通信,可以大大提高系统稳定性.但由于每组控制器和误差麦克风分布位置不同,引入的估计偏差影响系统整体降噪性能.因此,旨在开发一种新型扩散滤波最小均方算法(Diffusion Filtered?x Least Mean Squares,Diff?FxLMS),该算法平衡了空间平滑度和信息交换强度之间的矛盾,从而减少估计偏差.通过对Diff?FxLMS算法性能进行的理论分析,揭示了扩散控制机制,为ANC算法设计提供了理论依据,并在此基础上发展出一种新型的可变平滑度的Diff?FxLMS(Varible Spatial Regularized Diff?FxLMS,VSR?Diff?FxLMS)算法.仿真结果验证了新算法的性能及理论分析的可靠性.
疲劳驾驶被认为是隧道交通安全事故的重要原因之一.在长隧道驾驶过程中,由于隧道的声学特性,司机长时间都处于高噪音环境中.采集隧道噪声后,通过隧道噪声室内模拟实验,发现噪声刺激后被试者α和θ波段能量出现明显的上升现象,β波段能量在前额区出现较为明显的下降现象.通过对前额区AF3电极产生的波段数据进行多因素方差分析,得到六位被试者之间的个体差异对结果没有显著影响.同时设计了隧道驾驶实地实验,实验数据显示α波段能量出现下降现象,θ和β波段能量变化趋势与室内模拟实验一致,其原因可能是室内模拟实验中要求被试者全程闭眼以避免视觉干扰.实验结果说明隧道噪声给被试者带来显著疲劳影响,因此考虑隧道噪声对疲劳的影响对制定隧道驾驶安全策略具有较大的实际意义.
近零折射率材料是一类等效质量密度和等效体模量的倒数同时趋于零或者其中之一趋于零的声学超构材料,在近零折射率声学超构材料中声波会表现出声速无穷大、高效声传输等特性,这些特性为声波调控带来了一些独特的应用.以圆形盘绕型结构为基本单元,该基本单元通过对空间的卷曲和盘绕,大大增加了声波在单元中的传播路径.通过对单个圆形盘绕型基本单元的等效参数进行计算,得到基本单元近零折射率特性所对应的频率点,以具有此近零折射率特性的结构为基本单元来构造声学超构材料.通过利用超构材料对刚性散射体进行不同方式的包裹以实现声隐身效应.此外,利用该基本单元对不同形状的弯曲波导管进行填充实现了声波隧穿效应.
为减弱电梯井噪声干扰,提出一种能应用于井内壁的复合吸声结构.基于Attenborough提出的“多孔材料表面声阻抗”理论和David and Colin提出的”穿孔板声阻抗”理论,探讨其吸声性能的参数优化方法.使用可与井壁一体化的阻尼石膏砂浆板为基材,复合岩棉板与水泥砂浆穿孔板组成井内壁吸声结构.基于理论分析、数值模拟与实验测量,通过分析该结构的岩棉板厚度、流阻、孔隙率等参数和穿孔板穿孔率、厚度、密度等参数对结构正入射吸声性能的影响,讨论了该吸声结构的参数优化方法.结果显示,岩棉板的孔隙率、流阻率和容重以及穿孔板的穿孔率、厚度对复合吸声结构性能起到关键性作用,增加穿孔板厚度、降低穿孔率、增加多孔材料的孔隙率可加强结构的低频吸声性能,反之则加强高频吸声性能;优化后的复合吸声结构,在600和1600 Hz的正入射吸声系数分别达到0.6和0.8.结果表明,提出的复合吸声结构在电梯井噪声控制中显然具有应用潜力.
通过语音实现疲劳度检测具有操作简单、无创伤和实时性等优点.为了提高语音疲劳度检测的性能,将韵律特征与动态倒谱特征相融合,采用高斯混合模型作为分类器进行语音疲劳度检测.分别考察了梅尔频率倒谱系数、滑动差分倒谱特征以及韵律特征的检测性能.实验结果表明,在单特征时,梅尔频率倒谱系数比滑动差分倒谱特征和韵律特征的检测性能好,对于融合特征,检测性能均比单特征好,将三个特征融合后,检测正确率可达91%.