攻击者将设计好的对抗样本(即虚假用户)注入目标推荐系统以达到非法目的,严重影响推荐系统的安全性和可靠性.实际场景中攻击者难以获取目标模型的详细知识,利用梯度优化在局部代理模型中生成对抗样本成为一种有效的黑盒攻击策略,然而,这些方法存在梯度陷入局部极小值的问题,限制了对抗样本的迁移能力,降低了攻击的有效性,并且往往没有充分考虑生成的对抗样本的不可察觉性.针对这些挑战,提出一种新的攻击算法PGMRS⁃KL,结合预梯度引导的动量梯度优化策略和Kullback⁃Leibler (KL)散度约束的假用户生成.具体地,将累积的梯度方向与上一步的梯度方向相结合以迭代更新对抗样本,并利用KL损失最小化假用户数据与真实用户数据之间的分布距离,实现对抗样本的高可迁移性和不可感知性.实验结果证明,提出的方法在攻击可转移性和不可察觉的虚假用户数据生成方面优于最先进的基于梯度的攻击算法.
使用对抗样本进行训练可以提升深度神经网络的鲁棒性,因此提升对抗攻击成功率是对抗样本研究领域的一个重要内容.对原始样本进行稀释操作可以使其更靠近模型的决策边界,进而提高对抗攻击的成功率.然而,现有稀释算法存在基于人工生成的稀释池和稀释目标词性单一等问题,因此,提出了一种基于自动稀释的文本对抗攻击强化方法,称为自动多词性稀释预处理(Automatic Multi⁃positional Dilution Preprocessing,AMDP)算法.AMDP算法使稀释过程摆脱了对人工辅助的依赖,针对不同数据集和目标模型生成不同的稀释池.同时,AMDP算法扩展了稀释目标的词性,扩大了稀释操作的搜索空间.作为一种输入转换方法,AMDP可以与其他对抗攻击算法相结合,进一步提高对抗攻击的性能.实验结果表明,AMDP在BERT,WordCNN和WordLSTM分类模型上的攻击成功率平均提升约10%,同时减少了对原始样本的平均修改率和对目标模型的平均访问次数.
针对目前胶质瘤影像数据利用率不高、特征提取不全面等问题,提出一种基于深度学习的半监督胶质瘤肿瘤蛋白53(Tumor Protein 53,P53)突变状态预测方法.首先,使用非均匀粒度多批次(Non⁃Uniform Granularity Multi⁃Batch,NUGMB)灰度等级划分算法,优化胶质瘤MR影像的预处理;其次,提出多中心协作(Multi Center Collaboration,MCC)的K均值聚类算法,进行胶质瘤影像数据的伪标签标注;最后,提出一种全新的注意力机制LWAM(Local Longer and Wider Attention Modules),构建基于LWAM的改进MaxViT模型,用于胶质瘤P53突变状态术前无创预测.基于NUGMB,MCC和LWAM算法的NML⁃MaxViT模型预测胶质瘤P53突变状态的准确率为96.23%,可实现术前无创预测,辅助医生的临床诊疗.
单细胞RNA测序(Single⁃cell RNA sequencing,scRNA⁃seq)技术使研究人员可以在单细胞分辨率下测量转录组范围内的基因表达,并逐渐改变了人们对细胞生物学和人类疾病的认识.单细胞测序数据的高变异性、高稀疏性和高维度性严重阻碍了其下游分析,降维对于高维scRNA⁃seq数据的可视化和下游分析至关重要.然而,现有的单细胞降维算法没有充分考虑细胞之间的关系,也没有联合优化降维和聚类任务.为了克服这些局限性,面向单细胞RNA测序数据,以机器学习技术为手段,进行了基于自动编码器的降维算法研究.现有的降维算法大多没有使用伪标签来监督编码器的训练过程,导致降维数据的同时丢失了细胞间信号,提出了基于分类自动编码器的细胞降维算法.该算法结合了分类自动编码器和深度嵌入聚类来生成基因表达矩阵的低维表示.实验结果表明,与其他六种基准测试算法相比,该算法在一系列下游scRNA⁃seq分析任务中显示了具有竞争力的性能.
最近,多元时间序列(Multivariate Time Series,MTS)预测逐渐走入人们的视野,特别是许多基于Transformer的模型已经显示出巨大的潜力,然而,现有的基于Transformer的模型主要关注跨时间依赖性的建模,往往忽略了不同变量之间的依赖性,但这对MTS预测至关重要.基于此,提出一种新型的多元时间序列预测模型APDFinformer,旨在应对金融市场复杂多变的特性.该模型结合了自适应多尺度标识器(Adaptive Multi⁃Scale Identifier,AMSI),能够提取时间序列在不同尺度上的信息,帮助模型降低噪声对时间序列的影响,并捕获不同尺度之间的交互作用.其次,对处理完成的多元时序数据,利用Decomposition方法分解为趋势项和季节项,其中,对趋势项信息进行简单的线性处理,对季节项数据则根据PatchTST思想进行切块来缩短序列长度以表征局部特征,使其保留局部语义信息,有利于模型分析时间步之间的关联.实验结果显示,和传统方法以及类Transformer的各种模型相比,APDFinformer能够更准确地捕捉金融市场的复杂动态,预测精度更高.具体地,在三个加密货币数据集上,和Transformer模型相比,APDFinformer模型的MSE(Mean Square Error)降低了54%,24%和60%,MAE(Mean Absolute Error)降低了39%,22%和44%,证明APDFinformer在金融领域多元时序预测方面是更可靠的预测工具,也为基于Transformer模型的其他应用领域提供了有益的启示,以满足不断变化的金融市场需求.
随着人工智能应用的发展,在动荡多变的金融市场中帮助投资者获得可观收益的最优自动股票交易策略成为目前的研究热点.因此,提出了一种股票交易决策算法LSTM⁃DDPG (Long Short⁃Term Memory Network⁃Deep Deterministic Policy Gradient),将擅于捕捉时间序列特征的LSTM网络融入擅于处理高维空间数据的DDPG算法,并加入 Dropout 操作来减少过拟合.为了更好地把握市场的动态变化,引入了股票市场中六种经典技术指标来拓展LSTM⁃DDPG的状态空间维度.同时,在LSTM⁃DDPG上使用累计收益和夏普比率两种奖励函数,为投资者提供多种投资方案.为了验证提出的算法的有效性,将该算法应用在单只股票和股票投资组合两种交易任务中,两种投资任务的数据集均包含了美国市场和中国市场的数据.实验结果表明,在两种投资任务的国内外市场中,所提出的算法在累计回报、夏普比率、卡玛比率等多个评价指标上均有良好表现.
多层网络社区发现算法旨在揭示复杂网络中蕴含的社区结构,近年来得到了广泛关注,然而现有算法在度量节点相似度的过程中往往只关注网络中的低阶结构信息,忽略了高阶结构信息,而且,在对不同层网络进行融合的过程中也没有考虑不同层之间的差异性.针对以上问题,提出一种融入模体信息的多层网络社区发现算法.首先,各层分别计算融入模体的高阶邻接矩阵,通过与低阶邻接矩阵融合得到重构矩阵,进而基于邻居重要性对重构矩阵进行提升,得到节点相似度矩阵;其次,基于重构矩阵计算各层网络的重要性,再加权融合得到统一的相似度矩阵;最后,基于统一的相似度矩阵得到节点的影响力,通过节点嵌入表示方法,对节点的向量表示进行迭代更新,得到节点的最终嵌入表示.与已有的传统多层网络社区发现算法进行了对比实验,结果表明,提出的算法的多层模块度和标准化互信息等评价指标均优于已有算法.
当前社交媒体用户数量大,社交谣言内容涉及的领域变化快,因此自动谣言检测器须快速适应变化的领域,特别是新兴领域且保持检测能力仍然面临着巨大挑战.针对该挑战,提出了一种基于大语言模型和权威新闻的迭代式谣言检测框架LaReF,融合了大语言模型在自然语言理解方面的优势和权威新闻的可信度,通过主动学习的方法持续优化谣言检测模型.具体地,LaReF包括权威新闻检索模块,利用权威新闻数据集来增强模型的检测能力;大语言模型特征提取模块与思维模式学习模块,通过提示模板和注意力机制来提取特征并学习大语言模型的思维模式;特征有效性预测模块自动评估每个特征的重要性并调整权重,以及多特征融合预测模块将大语言模型特征、样本语义信息和权威新闻信息融合用于谣言检测.实验结果表明,LaReF在谣言检测任务中表现出良好的性能,能有效地识别社交媒体上新兴领域的谣言传播,为构建网络空间信息安全生态提供了一种可行的解决方案.
针对月面人机联合探测网络中因节点故障而出现的网络断连通问题,提出了一种分布式节点备份策略.结合月面任务的特殊性及其组网方式,对月面人机联合探测网络建模,将网络中的行为体分类,并对节点行为做出约束.为了减少每个节点维护的信息开销,节点通过两跳邻居信息来判定临界点,临界点使用一条邻居信息和Hello报文信息依据节点类型、恢复开销和对网络影响的程度等原则来选择备份节点.在故障恢复时考虑节点任务的独立性,使用故障传递策略抵消宇航员节点的移动责任.实验表明该节点备份机制可以在网络中有冗余节点的情况下为每个关键节点生成一个备份恢复路径,并且能够在不移动宇航员节点的前提下使网络恢复连通.
当利用高轨卫星(Geostationary Orbit,GEO)为低轨遥感卫星(Low Earth Orbit,LEO)提供实时中继服务时,GEO中继资源的分配会直接影响数据的传输效率,传输大小相同但级别不同的任务时所得的回报是不同的,这会影响整体的网络收益.为了解决上述问题,利用Stackelberg博弈模型,提出一种基于任务感知的遥感数据实时中继传输方案.首先,为了描述层间的拓扑变化,减少每个时隙中链路中断的次数,利用非均匀时隙划分方法来确定每个时隙下参与中继的LEO的身份和数量;其次,根据遥感数据的时空属性及用户需要,利用命名数据网络(Named Data Networking,NDN)中的命名机制对任务进行命名,可实现网络对内容类别和大小的感知;当多颗LEO向GEO卸载数据时,利用Stackelberg博弈模型,构建基于任务感知的GEO资源分配模型,并提出一种基于优先级的GEO资源分配算法,在每个时隙下都可以根据任务优先级实现GEO速率的最优分配,以实现GEO收益的最大化,并证明了纳什均衡的存在.实验结果证明了提出的方案在定价、GEO资源分配、传输效率及网络收益方面的有效性.
针对目前无人机航拍图像去雾方法存在难以兼顾不同景深区域去雾、边缘细节丢失过多、效果不明显等问题,提出一种基于Pyramid⁃Kuwahara滤波器的去雾方法.首先,根据改进的暗通道先验方法求解大气光估计和透射率;其次,设计了一种Pyramid⁃Kuwahara滤波器,利用多尺度的滤波器对大气光进行优化和细节提取;然后,结合设计的滤波器,提出一种多层滤波相对总变分模型MFRTV,以增强透射率中的细节信息;最后,通过优化大气散射模型来计算透射率和大气光图,并获得去雾后的复原图像.实验结果证明,提出的去雾算法在不同的景深区域内均能有效地恢复图像的细节,使实验图像中的雾气明显得到消除.同时,该算法还能在更远景深的范围内去除雾气,以提供更好的主观视觉效果,并提高图像的信息丰富度.和同类算法相比,提出的算法的复原图像的信息熵、FADE、结构相似度和平均梯度等参数指标均有显著提升.
基于能力的知识空间理论为教育评估及学习指导提供了科学且有效的理论框架.在该理论中,教育评估的目的在于通过学生的答卷情况(知识状态),了解他们在特定领域的能力水平(能力状态),并根据评估结果为学生提供个性化的学习指导.然而,能力状态与知识状态之间缺乏一一对应关系,仅依据知识状态只能确定一类能力状态,而无法精准判断学生的能力状态.因此,提出了一种基于同一类能力的顶或底直接计算知识状态掌握边缘,再进行个性化学习指导的一般方法,即第一步获取学生当前知识状态的掌握边缘;第二步根据掌握边缘选择目标知识状态;第三步获取当前和目标知识状态对应的能力状态的顶或底;第四步根据顶或底推送即将要学习的技能集,使其达到目标知识状态.此外,给出两种刻画定理,一是用技能函数刻画能力状态的顶或底;二是用问题函数刻画知识状态的掌握边缘.在不建立知识结构的前提下,获取能力状态的顶或底和知识状态的掌握边缘,可以提高获取效率.最后,分别给出了根据定义和刻画定理获取掌握边缘的算法,并通过对比实验证明后者耗时更短、占用内存更小.
二氧化锡(SnO2)是一种直接带隙的本征半导体材料,常温下的体带隙约为3.6 eV,具有化学和热稳定性好、电子迁移率高、透光性好、成本低和无毒且环境友好等优点,被广泛应用于气敏传感器、催化材料、电极材料、光电材料及太阳能电池中.针对兼容水和油分散性的SnO2的应用需求与现有SnO2商品只能分散于水的矛盾,开发了一种溶剂热结晶的方法,成功制备了兼容水和油分散性的SnO2量子点(SnO2 quantum dots,SnO2 QDs),通过调控溶剂热结晶时间(0~24 h),获得晶粒尺寸、能隙、(110)晶面占比分别在2.12~4.16 nm,3.72~4.15 eV和12.6%~43.3%可调的不同结晶质量的SnO2 QDs.所得量子点可应需要来稳定分散于水、乙醇、乙酸乙酯等多种水或油性溶剂中,形成可长期在室温下储存的黄色澄清的SnO2 QDs分散溶液.
激子绝缘体作为电子⁃空穴束缚对——激子凝聚形成的宏观相干态,自开展其理论研究以来,一直未能在实际材料中找到明确证据证明激子绝缘体在实验中的实现.理论探究更多新奇体系、寻找更多可实现激子绝缘体的候选材料,仍是当前热门的研究课题.以杂质为探针,利用平均场理论以及 T 矩阵近似的方法,系统地探究了以半导体、普通半金属和狄拉克半金属为母体材料形成的激子绝缘体体系,发现非磁性杂质在激子绝缘体中具有拆对效应,诱导产生束缚态.对于以普通半金属和半导体为母体材料的激子绝缘体,带内及带间杂质散射对束缚态能级位置及数目具有显著调制效应.相较之下,以狄拉克半金属为母体材料的激子绝缘体中的束缚态能级几乎不受杂质散射的影响.此外,杂质束缚态在三种不同母体激子绝缘体中表现出截然不同的能量特征,在普通半金属和半导体的激子绝缘体中可以产生能量较低的能隙间束缚态,且前者能量更低,而以狄拉克半金属为母态的激子绝缘体中的束缚态能级紧靠能隙边缘.
人体舒适度是评估城市宜居性的重要指标,它是人体器官和皮肤等感受器对环境感知后,通过神经系统作出的反应.人体舒适度受气温、湿度和风速等气象要素的直接影响.利用位于南京大学仙林校区的南京长三角大气过程与环境变化国家野外科学观测研究站(SORPES) 2015-2021年的气象观测资料对该地区的人体舒适度指数特征进行了分析,所选指数包括了热应力(Heat Index,HI)、湿热指数(Humidex)、湿球黑球温度(WBGT)和风冷指数(WCI).从年际变化看,各指数的量值基本相当,均在15~20.各指数的年变化趋势和月变化趋势与温度变化趋势有很高的一致性,这是因为在各个指数的定义和计算中,气温都是权重最大的气象因素,在此基础上再通过湿度、风速等要素进行修订.各个指数的概率密度分布均出现了弱的“三峰型”,这是秋季的“双峰型”和其他季节的“单峰型”叠加导致的.秋季各指数“双峰型”分布特征主要是由较大的昼夜温差导致的.总体来看,南京地区人体感觉以舒适为主,热环境风险远大于冷环境风险,以Humidex为指标统计的风险概率比以HI为指标的略高.利用南京大学高水平运动员200 m短跑的训练记录分析了人体舒适度对户外运动的影响,统计结果表明不同的运动员对热环境的敏感性反应存在极大的个体差异,30%的研究对象受热环境舒适度影响,其中10%的研究对象受热环境舒适度影响明显,女运动员的敏感度高于男运动员.研究结果表明在未来的体育训练中,环境人体舒适度对运动员的影响是不可忽视的,需要加强关注和研究.