当前,AI大模型逐渐被应用于蛋白质科学和生物信息学中,但其复杂性常常使人们无法解释神经网络如何从复杂的生物数据中提取和理解关键特征.为了理解这类计算模型如何拥有推断生物大分子的结构、功能和相互作用的能力,在前人关于预测治疗性抗体结合特异性的研究基础上进一步拓展,提出了基于通道注意力机制可解释的残差卷积神经网络.该网络能够有效预测具有不同氨基酸序列的抗体特异性结合概率,网络交叉验证的AUC (Area under Curve)达到0.943,与传统方法相比有显著提高.其次,通过非线性变换和积分梯度的方法获得各位点对于结合能力的贡献,从而推断出抗体序列的残基分布模式.提出的方法可以获得氨基酸序列背后潜在的信息,也能显著减小特异性抗体预测未知的突变空间,证明该网络不仅性能更优,对于理解复杂的神经网络背后的逻辑也有所帮助.
换衣行人重识别(Cloth⁃Changing Person Re⁃Identification,CC Re⁃ID)技术旨在监控视频或图像中针对同一行人在长时间跨度中进行识别,现有方法主要利用多模态信息来建模体型以减轻服装的影响,但其泛化能力差且需大量额外工作,而且,仅利用RGB图像的方法无法充分提取与服装无关的信息.针对以上问题,提出一种基于多重注意力机制和空间变换网络的换衣行人重识别方法,通过在主干网络中融入CBAM(Convolutional Block Attention Module)和STN(Spatial Transformer Network,STN)模块,分别提升网络对于不同通道和空间位置重要性的感知能力以及对于不同角度图像的适应能力.为了进一步提高网络对行人细粒度特征的提取能力,融入三重注意力机制来关注不同维度上的信息,引入一个自适应特征提取模块来学习特征中不同区域的重要性.此外,还采用服装分类损失和服装对抗损失等多种损失函数来引导模型学习与服装无关的信息.在四个换衣行人重识别数据集(LTCC,PRCC,VC⁃Clothes和DeepChange)上进行了大量实验,实验结果表明,提出的方法的Rank⁃1和mAP指标优于一些先进的换衣行人重识别方法.
目前无人机(Unmanned Aerial Vehicle,UAV)航拍图像中存在较多密集和尺寸较小的实例,识别效果往往较差.针对此问题,在YOLOv5的骨干网络中使用带有Transformer结构的C3TR模块替换原有的C3 (CSP Bottleneck with 3 Convolutions)模块来增强骨干网络的特征提取能力,之后,在SPPF层后加入CA (Coordinate Attention)模块来增强模型对小目标区域的关注度.其次,在颈部网络中使用ConvNeXtBlock模块替换C3模块,ConvNeXtBlock的深层卷积能够进一步增强对小目标细节的识别,提高目标检测的准确性.最后,使用ECIoU损失函数替换CIoU损失函数来进一步提升模型的收敛速度和精度.实验结果表明,在VisDrone2019公开数据集上,与基线模型YOLOv5l相比,改进模型的
多模态方面级情感分析模型在特征提取过程中可能过度依赖文本模态,而忽视文本与图像内容潜在的语义关联.由于模态之间的异质编码属性和信息质量差异,无法执行有效的跨模态交互.为了解决这一问题,提出一种多尺度语义感知和注意力融合模型(Multiscale Semantic Perception and Attention Fusion Model,MSPAF).首先,充分挖掘多尺度的图像语义信息,进行跨模态语义关联建模,以促进文本图像在统一特征空间内的有效交互.提出一种动态门控交叉注意力机制,在方面引导下进行视觉特征提取.其次,结合图卷积神经网络深度共现词间的语义依赖关系,获取句法和语义增强的上下文表征.最后,在多模态特征融合阶段,通过多层注意力池化学习不同模态特征的相关性,并降低融合特征维度.在公开的情感分析数据集上,对提出的模型进行评估,实验结果表明,与一系列基线模型相比,本模型具有更佳的情感分类效果.
人脑本质上是一个极其复杂的网络,研究脑网络可以为理解大脑机理及脑疾病的病理机制提供新的视角.目前,基于图卷积网络(Graph Convolution Network,GCN)的深度学习方法因其在图结构数据学习方面的强大能力,被广泛应用于脑网络分析,并在脑疾病诊断中取得了显著进展.然而,现有的GCN方法存在两个问题:(1)仅关注节点在欧式空间的局部特征,难以有效刻画脑网络中无标度、小世界等全局特征;(2)使用手工构建的邻接矩阵,无法捕捉大脑中的自发波动,忽视了潜在的拓扑结构信息.为了解决上述问题,提出一种基于自适应双曲图卷积网络(Adaptive Hyperbolic Graph Convolution Network,AH⁃GCN)的脑网络分类模型.具体地,AH⁃GCN首先使用双向门控循环单元自适应生成邻接矩阵,然后将节点特征嵌入双曲空间,并在双曲空间中进行图表示学习,最后将整图表示送入分类器,实现疾病的诊断预测.在Autism Brain Imaging Data Exchange (ABIDE)与Alzheimer's Disease Neuroimaging Initiative (ADNI)数据集上的实验结果表明,AH⁃GCN在脑网络任务上的性能优于现有的主流方法.
频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据分析、挖掘领域的核心问题之一,其目的是从大规模图数据中发现支持度不低于指定阈值的模式.传统的频繁模式挖掘算法依赖支持度进行剪枝,返回结果往往包含大量“冗余”模式;top⁃k模式挖掘算法虽然仅返回k个频繁模式,但该类算法主要依据“客观”指标,如支持度等,对模式进行评估,难以充分反映用户的主观兴趣偏好.针对上述问题,提出一种基于主动学习的模式兴趣评估方法(Pattern Interestingness Evaluation with Active Learning,PIEAL),通过主动学习策略,从采样图上挖掘的频繁模式中选择代表性模式,并利用有限次人机交互收集用户对这些模式的偏好,进而预测模式的兴趣分数,指导算法发现用户感兴趣的模式.在人机交互环节,PIEAL采用基于成对比较的策略来收集用户对模式的偏好反馈,有效降低了用户的主观评价难度.在真实数据集上的实验结果表明,PIEAL仅需要少量的人机交互便可发现用户感兴趣的模式,其测试集准确率最高可达95%.
数据稀疏性和用户的选择偏差对协同过滤算法的推荐性能产生了负面影响,然而,现有的方法仅根据用户的评分信息进行加权矩阵分解,通过识别无趣项和使用统一的低值填充无趣项来缓解这些问题,而忽略了用户的评分习惯和项目质量差异.为了解决这一问题,提出一种基于用户评分习惯的方法,结合显式反馈和隐式反馈的优点,并采用多种低值填充的填充策略.该方法分为识别无趣项和填充无趣项两个阶段.首先,在识别无趣项阶段,利用显式反馈数据挖掘用户的评分习惯并结合隐式反馈数据来推测使用前偏好;其次,在无趣项填充阶段,引入项目质量的概念,并根据显式反馈数据将无趣项划分为低质量和高质量两部分,分别以不同的低值填充.在两个公开数据集上进行实验,结果表明,提出的方法在无趣项的识别和填充阶段都优于已有方法,显著改善了协同过滤算法在top⁃N推荐中的性能.
入侵检测技术作为一种可靠的网络安全防御手段,在保障网络安全方面具有重要意义.深度信念网络(Deep Belief Network,DBN)结合支持向量机(Support Vector Machine,SVM)是一种具有良好泛化能力和分类性能的机器学习方法,在入侵检测领域有着广泛的应用.然而,该方法在处理高维数据时容易出现“维数灾难”问题,并且参数选择对分类性能有很大影响,针对以上不足,提出了一种基于灰狼算法(Grey Wolf Optimization,GWO)优化DBN⁃SVM的入侵检测方法.在GWO算法中,通过引入自适应狩猎权重系数和改进头狼位置更新公式来加快收敛速度和扩展狼群搜索范围,通过加入最优灰狼个体自适应扰动策略来避免陷入局部最优.进一步利用改进后的GWO算法优化DBN⁃SVM,并应用于入侵检测.实验结果表明,提出的方法在NSL⁃KDD和UNSW⁃NB15数据集上的准确率比未改进的DBN⁃SVM分别提高6.5%和5.7%,满足入侵检测的应用需求.
社交网络中位置服务存在的隐私泄露问题受到越来越多的关注,因此,提出一种位置k⁃匿名下的隐私泄露度量方法.首先,对用户隐私在位置服务中的流转过程进行分析.其次,根据攻击者攻击流程提出一种基于层次分析的关联规则算法,将用户背景知识表示成用户属性二维表,利用层次分析法来确定属性的相对重要程度,根据用户个人敏感程度筛选出关键背景知识,并对攻击者背景知识进行量化,在此基础上,提出一种基于互信息的隐私泄露度量方法.提出的模型和背景知识量化方法可以为攻击背景下知识量化和隐私泄露风险分析与评估提供可行的度量基础.最后,实验验证和分析结果表明度量模型是可行的、有效的.
分词是自然语言处理中的一项基础研究.针对词典规模影响分词效果这个科学问题,提出了平方交叠率(SOR)和松弛平方交叠率(RSOR)两种新量度,并验证了其有效性.平方交叠率的数值是词典交叠率和语料交叠率的乘积,而松弛平方交叠率是无监督学习下平方交叠率的松弛版本.这两种量度都反映了分词词典和待分词语料之间的适合程度.在越南语分词实验中的结果表明,基于松弛平方交叠率的无监督优选方法能在无需人工标注的前提下,选出最适合的越南语分词词典来达到最优的分词效果.
随着量子计算已步入中等噪声规模阶段,量子比特(Quantum Bits,qubits)的有效控制和量子操作的实现已成为重要的研究方向.目前,机器学习在许多领域都发挥着重要作用,因此,将机器学习与量子计算相结合,利用机器学习的方法解决量子计算的问题,寻找可行的量子操控方案.基于超导量子电路,利用连续参数的变分量子算法(Continuous⁃Time Variational Quantum Algorithm,CTVQA)对两个二能级超导量子比特系统的参数进行变分优化,得到控制非(Controlled⁃NOT,CNOT)门、控制相位(Controlled⁃Phase,CZ)门和量子傅立叶变换(Quantum Fourier Transform,QFT)三种量子操作的参数调控方案.然后,通过引入噪声的方式对三个参数调控方案进行鲁棒性分析.结果表明,CTVQA在实现量子操控方面具有较好的通用性,能够为实验提供参数方案.同时,CTVQA得到的参数方案在保真度和鲁棒性方面表现较好.
声子激光器因其在精密测量上的巨大潜力成为研究的热点,实现一个低阈值、高转换效率的声子激光器一直是研究的重点课题之一.因此,提出了一种在基于磁子的腔⁃磁子系统中实现超低阈值声子激光的方案.通过改变腔⁃磁子系统中腔的耗散来调控系统的宇称⁃时间对称性,研究了系统在宇称⁃时间对称以及宇称⁃时间对称性破缺时的动力学过程,进一步探究了稳态下腔⁃磁子系统中机械模式的动力学行为以及在微波驱动下声子激光的产生过程.结果发现,系统中机械模式的增益与系统的宇称⁃时间对称性高度相关,并且在系统奇异点附近能够实现驱动阈值功率接近零的声子激光.此外,展示了磁子⁃声子相互作用与声子激光器阈值功率的关系,说明在系统的奇异点附近,声子激光的阈值功率急剧减小是由于有效磁子⁃声子耦合的急剧增强.
利用钢渣中的活性钙封存二氧化碳并产出高纯碳酸钙是CCUS (Carbon Capture,Utilization,and Storage)领域的研究热点.氯化铵是钢渣固碳技术中常用的工作介质,通过它能实现活性钙的循环浸取和矿化,但会导致Cl-残留.为了高效洗脱矿化后钢渣中的残留Cl-,开展了不同初始Cl-含量、吸附时间、反应温度下钢渣对Cl-的吸附实验和不同液固比与洗涤工艺下的矿化后钢渣的洗涤实验.实验结果表明,钢渣对Cl-的吸附动力学符合拟二级动力学模型,热力学吸附更符合Langmuir模型.钢渣对
随着科学技术的发展,高分子复合材料被广泛使用.然而,在制备高分子复合材料时,由于材料的表面润湿程度、粗糙程度以及表面能都会影响材料的使用寿命,为了获得更好的界面粘接性能,往往需要先改性处理高分子材料的表面.介绍了两类常用的处理方法,其中,高能表面处理高分子改性主要包括等离子体处理法、火焰处理法、紫外光处理法和原子层沉积法,化学处理高分子表面改性主要包括表面接枝改性法和表面化学涂层处理法.简要概述了这些方法的基本原理和研究现状,展望了用高分子表面改性来增强界面粘接的发展方向.