多示例学习(Multi⁃Instance Learning,MIL)的训练数据是由若干个未带标记的示例组成的带标记的包,基于嵌入的方法,通过将包嵌入成单向量来解决包表示问题,然而大部分现有方法忽略了示例与包的联系,难以保证所选示例的代表性.同时,单角度的嵌入方法无法有效地提取正、负包的差异信息,使嵌入向量的质量较差.提出一种多示例学习的簇频繁性分析及双角度融合嵌入(FADE).簇频繁性分析技术从正、负子空间中分别筛选部分示例作为子空间的簇心,依据簇心将子空间聚类成簇,再计算簇频繁性指标,选择频繁性较高的簇的簇心组成子空间代表示例集.双角度融合嵌入技术基于正、负子空间代表示例集和差值嵌入函数,分别从正、负角度挖掘信息,融合两个角度信息获得最终的嵌入向量.在29个数据集上与七个MIL算法进行了对比实验,结果表明,FADE的分类准确率总体上优于七个对比算法,在图像数据集上有显著优势,在文本和网页数据集上也表现良好.
P53基因状态是胶质瘤精准诊疗的重要依据.针对目前基于MRI (Magnetic Resonance Imaging)的P53基因状态预测的深度学习模型中存在的异质性特征提取不全面、模型存在固有的多种不确定性等问题,提出脑胶质瘤P53基因状态精准预测模型CVT⁃RegNet (Improved RegNet Integrating CNN,Vision Transfomer and Truth Discovery).首先,采用RegNet网络作为P53基因突变状态预测模型的基础架构,自适应设计搜索P53基因的异质性特征;其次,在模型中将ViT (Vision Transfomer)模块与卷积神经网络(Convolutional Neural Networks,CNN)模块进行融合以改进RegNet网络,进一步优化模型的特征提取性能与计算效率;最后,融入真值发现算法进行迭代寻优以改善模型输出的不确定性,提高预测结果的准确度.实验结果表明,CVT⁃RegNet模型对P53突变状态的预测准确率达到95.06%,AUC (Area under Curve)得分为0.9492,优于现有的P53基因状态预测模型.CVT⁃RegNet实现了胶质瘤P53基因状态的无创预测,减轻了患者的经济负担及身心伤害,为胶质瘤的临床精准诊断治疗提供了重要价值.
图采样通过对图数据进行约简操作,获得比原图的规模更小的图结构,进而服务于图谱分析、图可视化等下游任务.现有的图采样算法侧重于保留图中显著的结构特征而忽略了节点属性,导致采样图在许多下游任务如频繁模式挖掘等,难以取得预期效果.为此,提出基于Motif的节点有偏采样算法(Motif⁃Based Node Biased Sampling,MNBS),利用频繁Motif结构重新定义图中节点的重要性,随后进行有偏节点采样,实现融合节点属性与结构特征的采样.为了快速识别频繁Motif模式,设计了具有“提前终止”特性的Motif模式快速发现算法(Fast Motif⁃Pattern Discovery,FMPD),能高效且准确地发现Motif模式以支持图采样.实验表明,MNBS采样算法在多项指标上优于其他基线算法,其对数归一化累积组相关性指标平均降低0.54,使用包含“提前终止”特性策略的FMPD算法的时间消耗和内存消耗比基线算法分别降低56.1%和29.8%.
针对全聚焦(Total Focusing Method,TFM)成像技术因其耗时长,在工业应用中受限的问题,提出一种基于CNN⁃BiLSTM(Convolutional Neural Network⁃Bi⁃directional Long Short⁃Term Memory)网络的快速TFM成像方法,首先利用卷积神经网络从全矩阵数据中提取关键特征,接着结合双向长短期记忆网络来预测金属板上损伤的区域位置,再使用TFM技术在损伤区域进行精确成像.为了进一步提升损伤检测的准确性,引入基于ResNet网络的损伤尺寸检测方法以实现对损伤大小的精确检测.为了验证方法的有效性,利用有限元分析软件ABAQUS建立三维铝板仿真模型,并通过模型变换构建神经网络数据集.实验结果表明,与传统全聚焦成像方法相比,CNN⁃BiLSTM网络展现出较高的区域定位精度,定位准确率达到95.26%,并具有显著的效率优势,平均定位速度提升了46.4%;同时,损伤尺寸大小的检测结果验证了基于ResNet网络的方法在损伤尺寸评估方面的有效性和准确性,在测试集上达到了99.26%的准确率.
P300拼写器是允许用户使用脑电图(Electroencephalogram,EEG)输入的脑机接口(Brain⁃Computer Interface,BCI)系统,高传输、高准确率地检测P300信号对于提高P300拼写系统的性能非常重要.针对P300脑电信号特征提取方式信噪比低、识别困难等特点,提出一种基于批量归一化和残差块的卷积神经网络(Convolutional Neural Network,CNN)模型,可以在模型训练中保留重要特征的同时加快模型损失的收敛速度.采用分类精度、AUC(Area under Curve)、准确率、召回率、F1⁃score等指标来验证所提模型的有效性,并与其他方法进行了对比实验.实验结果显示,与传统的CNN算法相比,所提模型的分类精度提升6%,损失函数的收敛速度也有提升;与传统机器学习方法相比,所提模型的各项评价指标都优于传统算法.证明该算法是提高P300拼写器性能的有效方法.
近年来,多视图聚类问题受到国内外的广泛关注.联合平滑多视图子空间聚类算法通过视图共识分组效应,利用多个视图的局部结构来规范视图共性表示,取得了不错的聚类效果,但是该算法对于不一致性的探索仍然存在一定的局限性,限制了聚类性能的进一步提升.为了进一步挖掘多视图的不一致性,提出一种基于特征级联的联合平滑多视图子空间聚类算法,它不仅同时学习视图间的一致性与不一致性,增强视图的多样性,还将不一致性划分为特定于集群的不一致性与特定于样本的不一致性,通过核范数进一步与低秩表示相关联,并在此基础上使用交替方向最小化进行迭代.在四个公共数据集上与其他优秀算法进行了对比实验,证明了所提算法的优越性.
基于度量学习的小样本学习方法中模型没有充分挖掘类内样本与类间样本的联系,将单个样本特征视作独立特征用作训练,导致模型生成的原型不准确且特征表示能力差.提出利用类内类间信息的原型补足小样本图像分类模型.首先,将支持集样本的特征送入类内信息提取分支,构造类内信息特征图,并提取特征获取类别描述信息为原型进行补足;然后,利用类间信息提取分支将不同类的查询样本融合生成新样本,并将该组查询样本的标签作为软标签;最后,使用补足后的原型对查询样本与新样本进行分类,并通过分类损失优化模型.在四个公开数据集上的实验结果表明,在MiniImageNet数据集上,准确率提升2.03%~5.48%;在TieredImageNet数据集上,准确率提升2.25%~8.55%;在CUB数据集上,准确率提升5.10%~8.82%;在CIFAR⁃FS数据集上,准确率提升2.61%~10.03%.证明与同类小样本图像分类方法相比,提出的模型获得了更优的分类性能与泛化性.
随着大数据、人工智能、物联网、云计算等现代信息技术与农业领域的深度融合,现代农业正朝着智能化方向迈进.知识工程在整合、管理、挖掘和利用农业知识方面发挥了至关重要的作用,为实现个性化、精准化的农业认知智能服务提供了强有力的技术支持.探讨了当前农业知识工程及认知智能服务面临的主要挑战,综述了国内外农业认知智能服务领域的研究现状,提出了集成数据层、算法层和认知服务层的基础研究框架.在此基础上,创新性地设计了基于主动元学习思想,通过软件智能体与科学大数据双向偶联自指循环方式完成农业大数据整合和知识建模、知识抽取、知识融合以及知识推理的农业认知智能服务构建框架,梳理了各环节涉及的关键技术和服务应用.最后,对农业认知智能服务领域的未来发展趋势和对策建议进行总结与展望.
随着5G移动视频应用加速落地以及国内视频流需求的迅速激增,迫切需要一种新的数据传输协议来提供可靠的安全性,以保障上层应用处理更多的接入连接以及满足更低的延时需求.多路径QUIC协议(Multipath Quick UDP Internet Connection,MPQUIC)具有拟合多条链路带宽资源、强大连接的容错能力和高可靠性等优点,被认为将在未来移动互联网数据传输中发挥重要的作用.然而,目前国内外研究人员对于MPQUIC协议的相关研究正处于初步阶段,该协议还没有一个普适性的、开源的仿真平台.因此,借助全球网络仿真领域应用最广的NS⁃3网络模拟器搭建了MPQUIC仿真平台(ns3⁃mpquic),为相关学者提供研究MPQUIC协议的开源、免费、普适的基础平台,为全球专家学者对MPQUIC协议的模拟部署和优化提供助力.
基于28 nm互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)工艺实现了一种应用于毫米波雷达接收机的小型化模拟基带电路,该电路包括三级内嵌有直流失调消除(DC Offset Cancellation,DCOC)电路的可编程增益放大器和六阶巴特沃斯型低通滤波器,实现可重构的增益和带宽.在模拟基带中采用可复用的电阻和电容阵列,并在直流失调消除环路中引入工作在亚阈值区的晶体管作为有源电阻,大幅减小了芯片的面积.测试结果表明,该模拟基带在0.1 mm2的面积下实现了-0.6~68.4 dB的增益范围、5.8 dB的增益步进、500 kHz~17 MHz的带宽调节范围和22.4 dBm的输出三阶交调点,在1.8 V电源电压下消耗的功耗为12 mW.
关于我们所处的宇宙,尚有许多深刻且未知的问题,在这些问题中,可见物质质量起源的研究尤为基本且意义深远.这些可见物质质量绝大部分都由一个单一的质量量级描述,也就是质子的质量
二氯甲烷(DCM)脱卤酶是在多种环境和生物背景下参与二氯甲烷降解的关键酶.然而,对DCM脱卤酶的配体解结合途径的研究尚不清楚.为了深入地了解DCM和谷胱甘肽(GSH)在DCM脱卤酶中的结合位点和解离途径,采用随机加速分子动力学(RAMD)模拟,驱动DCM和GSH离开活性部位.利用Alphafold2预测蛋白结构,通过对接预测GSH和DCM在结合口袋中的构象.通过长时间的平衡模拟验证该蛋白配体复合物的结构.结果表明,GSH在三种主要途径中最常见,其中一种比另外两种更重要.此外,模拟观察到DCM有一条独特的逃逸途径,鉴定了每个通路的关键残基和蛋白螺旋.该结果可为后续研究DCM脱卤酶解离机理提供理论基础.
锂离子电池(LIBs)因其能量密度和输出功率高以及使用寿命长等优势,被广泛应用于新能源领域.正极用聚合物黏结剂作为LIBs的重要组成部分,在活性材料颗粒与电极集流体之间提供结合力,进而促进Li+的扩散,对提高电池循环性能起着重要的作用.商用聚偏氟乙烯(PVDF)是目前正极材料中用到的主要黏结剂,但仍旧存在黏结性能低和导离子性较差的问题.聚酰亚胺(PI)具有优异的力学性能、黏附强度和良好的结构可设计性等优势.因此,设计并制备了一种具有磺酰亚胺锂结构的二胺单体(BAPSI⁃Li),将其与联苯四甲酸二酐(s⁃BPDA)和4,4'⁃二氨基二苯醚(ODA)共聚合成了一种导离子型PI黏结剂.研究表明,PI黏结剂黏结性能相比于PVDF有所提升.由导离子型PI黏结剂制备的LiFePO4 (LFP)电极具有优异的电化学性能,在0.2 C的电流密度下经250次循环后,放电比容量高达158.19 mA·h·g-1.导离子型PI黏结剂与商用PVDF黏结剂相比展现了更优异的循环稳定性.这得益于PI具有良好的黏结性能,电极能够在长循环过程中保持结构完整.同时,导离子二胺单体的引入有利于促进电极内部锂离子的传输.
三氯蔗糖是典型的难生物利用有机物,其在化学还原水处理过程中的可还原性、还原产物种类及其可生化性均不明确.为阐明上述问题,探究了三氯蔗糖经过典型高级还原过程——紫外/亚硫酸盐(UV/
针对我国地下水氯代烃污染问题,以椰壳生物炭和零价铁为主要原材料,研制了一种具有生物活性的复合功能材料,并在江苏某氯代烃污染地下水场地开展了中试研究.现场监测数据显示,复合功能材料可持续缓释碳源和铁源,能够实现脱氯降解菌驯化生长.通过16S rRNA基因测序发现,可渗透反应墙(Permeable Reactive Barrier,PRB)运行1140天时,复合功能材料中脱氯降解菌的相对丰度(1.9%~8.3%)高于初始PRB材料(0.5%).PRB运行1140天后,复合功能材料的表面形态仍保持稳定.在2000天的运行周期内,PRB对不同氯代烃污染物的去除率为13.7%~100%.复合功能材料可通过吸附、铁还原和微生物降解复合机制高效去除地下水中的氯代烃.研究可为氯代烃污染地下水原位修复提供重要技术支撑.
硫代砷是土壤⁃水稻系统中砷的重要形态之一,其形态转化对砷的生物地球化学循环具有重要意义,同时也对环境和人类健康构成潜在威胁.总结了近年来国内外有关水稻土中硫代砷的定量检测方法、存在形态、影响因素、生物地球化学过程与水稻吸收机制方面的研究进展,旨在为后续研究提供方法参考与理论依据.为减少在环境样品分析之前硫代砷的形态转化,可向样品中加入二乙基三胺五乙酸(DTPA),将样品快速冷冻后低温避光保存.离子色谱串联电感耦合等离子体质谱法(IC⁃ICP⁃MS)适用于环境样品中硫代砷的分离与定量检测.无机硫代砷与甲基硫代砷在形成条件、环境行为以及水稻吸收方面存在显著差异.水稻土中硫代砷的含量受pH、氧化还原环境以及还原态硫等因素的影响,环境条件的变化会驱使不同形态硫代砷之间以及硫代砷与非硫代砷之间的相互转化.相较于(亚)砷酸盐,硫代砷在铁矿物表面的吸附能力通常较弱,且在土壤氧化还原条件变化时表现出更高的不稳定性.硫代砷可被水稻吸收并在籽粒中积累,其中二甲基一硫代砷酸盐(DMMTA)具有高吸收、高转运和高毒性,广泛存在于全球水稻籽粒与商品大米中.目前尚未明确水稻对硫代砷的吸收、转运与解毒机制,值得进一步深入探索以准确评估硫代砷对水稻生长、食品安全与人类健康所带来的潜在风险.