推荐文章

Please wait a minute...
  • 全选
    |
  • 梁峰宁, 赵钰琳, 赵藤, 曹亚茹, 丁世飞, 朱红
    南京大学学报(自然科学版). 2024, 60(6): 908-919. https://doi.org/10.13232/j.cnki.jnju.2024.06.003
    摘要 (881) PDF全文 (38) HTML (1)   可视化   收藏

    针对目前胶质瘤影像数据利用率不高、特征提取不全面等问题,提出一种基于深度学习的半监督胶质瘤肿瘤蛋白53(Tumor Protein 53,P53)突变状态预测方法.首先,使用非均匀粒度多批次(Non⁃Uniform Granularity Multi⁃Batch,NUGMB)灰度等级划分算法,优化胶质瘤MR影像的预处理;其次,提出多中心协作(Multi Center Collaboration,MCC)的K均值聚类算法,进行胶质瘤影像数据的伪标签标注;最后,提出一种全新的注意力机制LWAM(Local Longer and Wider Attention Modules),构建基于LWAM的改进MaxViT模型,用于胶质瘤P53突变状态术前无创预测.基于NUGMB,MCC和LWAM算法的NML⁃MaxViT模型预测胶质瘤P53突变状态的准确率为96.23%,可实现术前无创预测,辅助医生的临床诊疗.

  • 唐勇轩, 梁潇, 骆嘉伟
    南京大学学报(自然科学版). 2024, 60(6): 920-929. https://doi.org/10.13232/j.cnki.jnju.2024.06.004
    摘要 (550) PDF全文 (40) HTML (1)   可视化   收藏

    单细胞RNA测序(Single⁃cell RNA sequencing,scRNA⁃seq)技术使研究人员可以在单细胞分辨率下测量转录组范围内的基因表达,并逐渐改变了人们对细胞生物学和人类疾病的认识.单细胞测序数据的高变异性、高稀疏性和高维度性严重阻碍了其下游分析,降维对于高维scRNA⁃seq数据的可视化和下游分析至关重要.然而,现有的单细胞降维算法没有充分考虑细胞之间的关系,也没有联合优化降维和聚类任务.为了克服这些局限性,面向单细胞RNA测序数据,以机器学习技术为手段,进行了基于自动编码器的降维算法研究.现有的降维算法大多没有使用伪标签来监督编码器的训练过程,导致降维数据的同时丢失了细胞间信号,提出了基于分类自动编码器的细胞降维算法.该算法结合了分类自动编码器和深度嵌入聚类来生成基因表达矩阵的低维表示.实验结果表明,与其他六种基准测试算法相比,该算法在一系列下游scRNA⁃seq分析任务中显示了具有竞争力的性能.

  • 唐子崴, 兰栋, 于扬
    南京大学学报(自然科学版). 2024, 60(5): 707-714. https://doi.org/10.13232/j.cnki.jnju.2024.05.001
    摘要 (168) PDF全文 (718) HTML (25)   可视化   收藏

    超导量子电路是实现通用量子计算的主流方案之一,随着芯片集成度的不断提高,电路设计面临复杂布线和串扰的难题.为了对芯片上的串扰信号进行抑制,参考同轴线的电磁屏蔽原理,人们提出一种覆盖于共面波导的片上结构,称为隧道桥.利用有限元法对加入隧道桥的芯片电路进行仿真,得到最佳阻抗匹配的设计参数.对芯片串扰的仿真结果显示,和普通的共面波导相比,隧道桥的加入对于倒装焊形式芯片间的垂直方向电场有三个数量级的屏蔽效果,而对于平面形式单芯片,能减小微波驱动线之间的串扰约16 dB,对直流偏置线引起的串扰电流能减小约70%,比传统空气桥方案改进了40%.此外,还研究了隧道桥微制造工艺流程,实现了稳定的样品制备工艺.隧道桥结构具有显著的串扰抑制效果,在规模化超导量子比特芯片中具有广泛的应用前景.

  • 杨振发, 王奕阳, 李文峰, 刘珺, 叶言飞, 赵康僆
    南京大学学报(自然科学版). 2024, 60(5): 715-722. https://doi.org/10.13232/j.cnki.jnju.2024.05.002
    摘要 (486) PDF全文 (653) HTML (30)   可视化   收藏

    提出一种基于CFDP协议(CCSDS File Delivery Protocol)的并行多路径传输设计,在空间网络文件传输中拓展多条路径并行传输文件,进一步提高了文件传输效率,并保持与原始文件传输协议功能的兼容性.该设计充分利用了空间网络链路特性,通过数据调度负载均衡算法,合理地向传输路径分配文件数据,实现了并行多路径传输的目标.仿真实验结果表明,与传统CFDP传输相比,该并行多路径传输设计能够充分利用多条传输路径,显著缩短了文件的传输交付时间.

  • 杨梅, 张靖宇, 闵帆, 方宇
    南京大学学报(自然科学版). 2024, 60(4): 531-541. https://doi.org/10.13232/j.cnki.jnju.2024.04.001
    摘要 (127) PDF全文 (541) HTML (14)   可视化   收藏

    多示例学习(Multi⁃Instance Learning,MIL)的训练数据是由若干个未带标记的示例组成的带标记的包,基于嵌入的方法,通过将包嵌入成单向量来解决包表示问题,然而大部分现有方法忽略了示例与包的联系,难以保证所选示例的代表性.同时,单角度的嵌入方法无法有效地提取正、负包的差异信息,使嵌入向量的质量较差.提出一种多示例学习的簇频繁性分析及双角度融合嵌入(FADE).簇频繁性分析技术从正、负子空间中分别筛选部分示例作为子空间的簇心,依据簇心将子空间聚类成簇,再计算簇频繁性指标,选择频繁性较高的簇的簇心组成子空间代表示例集.双角度融合嵌入技术基于正、负子空间代表示例集和差值嵌入函数,分别从正、负角度挖掘信息,融合两个角度信息获得最终的嵌入向量.在29个数据集上与七个MIL算法进行了对比实验,结果表明,FADE的分类准确率总体上优于七个对比算法,在图像数据集上有显著优势,在文本和网页数据集上也表现良好.

  • 赵钰琳, 梁峰宁, 曹亚茹, 赵藤, 王淋, 丁世飞, 朱红
    南京大学学报(自然科学版). 2024, 60(4): 542-551. https://doi.org/10.13232/j.cnki.jnju.2024.04.002
    摘要 (74) PDF全文 (399) HTML (11)   可视化   收藏

    P53基因状态是胶质瘤精准诊疗的重要依据.针对目前基于MRI (Magnetic Resonance Imaging)的P53基因状态预测的深度学习模型中存在的异质性特征提取不全面、模型存在固有的多种不确定性等问题,提出脑胶质瘤P53基因状态精准预测模型CVT⁃RegNet (Improved RegNet Integrating CNN,Vision Transfomer and Truth Discovery).首先,采用RegNet网络作为P53基因突变状态预测模型的基础架构,自适应设计搜索P53基因的异质性特征;其次,在模型中将ViT (Vision Transfomer)模块与卷积神经网络(Convolutional Neural Networks,CNN)模块进行融合以改进RegNet网络,进一步优化模型的特征提取性能与计算效率;最后,融入真值发现算法进行迭代寻优以改善模型输出的不确定性,提高预测结果的准确度.实验结果表明,CVT⁃RegNet模型对P53突变状态的预测准确率达到95.06%,AUC (Area under Curve)得分为0.9492,优于现有的P53基因状态预测模型.CVT⁃RegNet实现了胶质瘤P53基因状态的无创预测,减轻了患者的经济负担及身心伤害,为胶质瘤的临床精准诊断治疗提供了重要价值.

  • 赵志宇, 张进, 雷荔傈, 张熠
    南京大学学报(自然科学版). 2024, 60(2): 181-193. https://doi.org/10.13232/j.cnki.jnju.2024.02.001
    摘要 (1117) PDF全文 (1414) HTML (404)   可视化   收藏

    河南郑州“21.7”特大暴雨是中国近年来发生的一场严重气象灾害,对此暴雨事件的数值预报模式表现出较大的不确定性,对暴雨落区和降水强度的预测均存在偏差.目前,“21.7”河南暴雨的形成机理已经得到广泛研究,但针对其集合敏感性分析的研究却十分有限.集合敏感性分析是一种利用集合预报来估计模式预报对初始场敏感性的方法,可诊断极端天气过程的影响因子、对数值模式集合预报不确定性进行分析等.因此,针对“21.7”河南暴雨个例,利用WRF?ARW模式,结合集合初始条件与多物理过程以及物理过程扰动等方法,构建不同的区域模式集合预报.利用集合敏感性分析方法开展“21.7”河南暴雨的可预报性和影响该暴雨的因子分析.结果表明,“21.7”河南暴雨对初始条件的温度场、湿度场、风场和位势高度场扰动具有敏感性,增强郑州地区的气旋性环流、改变郑州上空的气温、降低郑州地区的气压、增强台风“烟花”的强度可以使此次暴雨的降水强度增强.本研究能够增进对“21.7”河南暴雨成因的理解,并改进集合预报.

  • 周玥滢, 方娟
    南京大学学报(自然科学版). 2024, 60(2): 230-243. https://doi.org/10.13232/j.cnki.jnju.2024.02.005
    摘要 (917) PDF全文 (1228) HTML (373)   可视化   收藏

    观测发现热带气旋(TC)边界层中存在龙卷尺度涡旋(TSV),其引起的相关阵风对近地面具有强烈影响.利用WRF?ARW模型,通过对飓风Earl (2010)进行高分辨率的数值试验模拟,分析了TC边界层龙卷尺度涡旋的时空分布特征以及发生发展的可能原因.Earl发展增强过程中,TSV数量随着Earl强度的增强而增加,尤其在最强期间表现最为活跃,一方面TC的增强提供了更强的背景场使得TSV更易生成,另一方面更强的背景场使得长生命期的TSV增加,每一时刻同时存在的TSV也就更多.TSV生成区域随Earl的发展从垂直风切左侧逐渐集中至逆风切左侧,且始终位于RMW内侧近地层次级环流上升支和最大垂直涡度位置附近,这里通常满足垂直切变和水平切变不稳定的必要条件,TSV涡度收支分析的结果表明,对TSV生成发展起主要贡献的是与水平风水平切变相关的拉伸项以及与垂直切变相关的扭转项,这意味着TSV的生成与发展可能与垂直切变不稳定和水平切变不稳定有关.

  • 顾宁
    南京大学学报(自然科学版). 2023, 59(6): 915-918. https://doi.org/10.13232/j.cnki.jnju.2023.06.001
    摘要 (740) PDF全文 (1319) HTML (301)   可视化   收藏

    人类历史亦是和疾病的斗争史,在这一过程中医学的发展取得了长足进步,从神秘的巫医和草药医学发展成为包括基础医学、临床医学和公共卫生的现代医学.而医学发展到目前阶段,虽然有了比较精细的分科,但也面临新的挑战,其中包括如何将大量基础医学成果转化到临床医学和公共卫生的具体实践之中.为了解决这一问题,越来越多的科学家开始探索与临床医学专家进行更加紧密的合作,围绕具体临床问题,在深化有关机制研究的过程中帮助研发新仪器、新材料等新技术,在临床医学问题的解决过程中发挥重要作用,逐渐形成了医学领域中一个崭新的交叉学科方向——工程医学.本文简述了工程医学定义、目前发展基础及主要任务,并对未来的发展趋势与挑战进行讨论.

  • 徐陈淳, 王有藩, 陶建成
    南京大学学报(自然科学版). 2023, 59(5): 731-741. https://doi.org/10.13232/j.cnki.jnju.2023.05.001
    摘要 (1559) PDF全文 (1232) HTML (1277)   可视化   收藏

    分流扬声器将入射声能转化成电能进行储存和耗散,可作为一种共振吸声体.对界面刚性的长方体封闭空间建立解析模型,分析在顶面布放分流扬声器时布放方式对空间内低频噪声的控制效果.数值仿真表明:在封闭空间本征频率附近,布放分流扬声器可有效降低空间内的平均声压级;当分流扬声器数目有限时,布放在初始声压级大的区域能产生更好的降噪效果;长方体顶角是所有模态响应较大的位置,因此是宽带降噪时布放分流扬声器的较优选择.地面铺设吸声材料后,封闭空间内平均声压级整体降低,但上述分流扬声器布放方式的影响规律依然存在.最后,实验验证了数值仿真结果.

  • 姚启皓, 王伟昊, 尤鸣宇
    南京大学学报(自然科学版). 2023, 59(5): 742-751. https://doi.org/10.13232/j.cnki.jnju.2023.05.002
    摘要 (1688) PDF全文 (1180) HTML (1488)   可视化   收藏

    三维装配补全是一项重要的交互式装配任务,对于一个半成品装配体,机器人需要明确其缺失部件,从候选部件中挑选正确部件,计算准确的拼装位姿,最后将半成品补全.稳定性是椅子、桌子等实际装配体设计的首要原则,也是三维装配补全的重要目标,现有的装配补全工作多根据部件的几何关系来优化装配补全过程,没有考虑补全后装配体的稳定性,导致补全结果的正确率不高,难以满足机器人实际装配的需求.针对上述问题,提出一种基于稳定性优化的三维装配补全方法(Finishing the Incomplete 3D Assembly with Transformer,StableFiT),定义了一种装配体稳定性验证方法.基于NVIDIA Isaac Sim仿真平台训练了一个装配体稳定性判别器,并基于稳定性判别器提供的稳定性反馈,优化了三维装配体的补全.在PartNet数据集上开展实验验证,结果表明StableFiT能够有效提升补全的装配体的正确性和稳定性.

  • 陈怡, 唱睿喆, 曹雨冬, 张世武, 孙帅帅, 贠国霖
    南京大学学报(自然科学版). 2023, 59(4): 590-599. https://doi.org/10.13232/j.cnki.jnju.2023.04.006
    摘要 (909) PDF全文 (1569) HTML (2923)   可视化   收藏

    手势意图识别是人机交互领域的热门研究方向,然而现有手势的识别系统大多基于肌电信号,肌电信号不可避免的信号串扰、衰减、信噪比低等问题严重影响了手势识别的准确率.为了解决这一问题,研发了基于液态金属复合材料传感手环的可穿戴手势识别系统,液态金属复合材料灵敏的压阻效应使设计的传感手环获取的传感信号表现出稳定、灵敏度高、噪声低等优异特性.基于此传感信号的手势识别系统由数据采集和模式识别两个部分组成,其平均离线识别准确率高达97.19%.更重要的是,该系统无须在手部加装设备,通过前臂肌肉即可获取信号,因此可用于手部功能缺失的残疾群体,用户范围广泛,具有重要的社会和经济效益.

  • 王冰洁, 张超, 李德玉, 马瑾男, 王渊
    南京大学学报(自然科学版). 2023, 59(4): 600-609. https://doi.org/10.13232/j.cnki.jnju.2023.04.007
    摘要 (360) PDF全文 (1095) HTML (1743)   可视化   收藏

    为了探索区间二型模糊背景下的多属性群决策方法,以多粒度概率粗糙集为基础,结合MULTIMOORA(Multi?Objective Optimization by Ratio Analysis Plus the Full Multi?Plicative Form)与证据融合理论,发展了一种基于区间二型模糊信息的多粒度证据融合决策模型.首先,提出多粒度区间二型模糊概率粗糙集模型;然后,通过离差最大化法和熵权法计算决策者权重和属性权重,依据多粒度概率粗糙集和MULTIMOORA法建立区间二型模糊多属性群决策模型,通过源自D?S证据理论的证据融合方法融合得出决策结果.通过钢铁行业耗能的实例,证明提出方法的可行性与有效性,总体上,提出的决策模型具备一定的容错力,有助于获得强解释力的稳健型决策结果.

  • 刘志中, 李林霞, 孟令强
    南京大学学报(自然科学版). 2023, 59(3): 373-387. https://doi.org/10.13232/j.cnki.jnju.2023.03.002
    摘要 (874) PDF全文 (1445) HTML (5225)   可视化   收藏

    随着基于位置的社交网络的快速发展,POI (Point of Interest)推荐已成为推荐领域的研究热点,然而已有的工作未能充分挖掘用户的POI交互偏好以及POI转移偏好,影响了POI推荐效果.提出一种基于混合图神经网络的个性化POI推荐方法.首先构建用户社交网络图,利用图注意力网络(Graph Attention Networks,GAT)学习含有社交关系的用户特征;其次,构建用户与POI的标号交互二部图,基于标号二部图神经网络(Signed Bipartite Graph Neural Networks,SBGNN)学习含有用户POI交互偏好的用户特征与POI特征;构建POI有向转移图,基于会话图神经网络(Session?Based Recommendation with Graph Neural Networks,SRGNN)学习含有用户POI转移偏好的POI特征;之后,融合含有社交关系的用户特征与含有POI交互偏好信息的用户特征得到最终的用户特征表示,融合含有用户POI交互偏好的POI特征与含有用户POI转移偏好的POI特征,得到最终的POI特征表示;最后,将用户特征表示与POI特征表示做乘积操作,通过Sigmoid函数得到用户对每个POI的预测评分,并以此向用户推荐Top?K POI序列.基于三个公共数据集(Gowalla,Foursquare和Yelp)开展了大量的实验,结果表明,与七种基线模型的推荐效果相比,提出的方法的准确率和召回率分别平均提升19.95%和1.35%.

  • 张绎凡, 李婷, 葛洪伟
    南京大学学报(自然科学版). 2023, 59(3): 388-397. https://doi.org/10.13232/j.cnki.jnju.2023.03.003
    摘要 (635) PDF全文 (1671) HTML (8271)   可视化   收藏

    目前,多视图子空间聚类在模式识别和机器学习领域得到了广泛的研究.以前的多视图聚类算法大多将多视图数据划分在其原始特征空间中,其功效在很大程度上隐式地依赖于原始特征呈现的质量.此外,不同视图包含同一对象的特定信息,如何利用这些视图恢复潜在的多样性信息对后续聚类尤其重要.为了解决上述问题,提出一种多样性诱导的潜在嵌入多视图聚类方法,使用特定于视图的投影矩阵从多视图数据中恢复潜在嵌入空间.考虑到多视图数据不同视图之间的多样性信息,采用经验的希尔伯特施密特独立准则约束特定于视图的投影矩阵,将潜在嵌入学习、多样性学习、全局相似性学习和聚类指标学习整合在同一框架中,还设计了一种交替优化方案来有效处理优化问题.在几个真实的多视图数据集上的实验表明,提出的算法具有一定的优势.

  • 徐伟华, 潘彦舟
    南京大学学报(自然科学版). 2023, 59(1): 1-11. https://doi.org/10.13232/j.cnki.jnju.2023.01.001
    摘要 (591) PDF全文 (3338) HTML (13901)   可视化   收藏

    以直觉模糊信息表为背景,利用粗糙集和模糊集,旨在筛除信息表中冗余的属性,提出获取决策规则的近似约简方法.首先,通过在直觉模糊集中引入带权重评分函数来定义加权直觉模糊序关系;进一步,为了提高模型分类的容错率,结合变精度粗糙集模型构建加权变精度直觉模糊序决策信息表;接着,在该决策表中提出上、下近似约简的判定定理和可辨识矩阵,进而生成两种求解上、下近似约简的方法;最后,通过具体案例和数值实验分析验证了该方法的有效性.

  • 于子淳, 吴伟志
    南京大学学报(自然科学版). 2023, 59(1): 12-21. https://doi.org/10.13232/j.cnki.jnju.2023.01.002
    摘要 (597) PDF全文 (1475) HTML (21183)   可视化   收藏

    作为人工智能领域的一个重要方向,粒计算在数据挖掘和知识发现方面的研究呈现较大的优势.针对具有多尺度决策的信息系统的知识获取问题,利用粒度树与剪枝来研究具有多尺度决策的信息系统的最优尺度选择问题.首先介绍了粒度树与剪枝的概念,每个属性和决策都有一个粒度树,每个粒度树都有许多不同的局部剪枝,代表特定属性下的尺度选择.不同属性和决策的一个局部剪枝组合形成全局剪枝,从而产生一个混合尺度决策表.其次,给出具有多尺度决策的信息系统基于粒度树与剪枝的最优全局剪枝选择的概念.最后将全局剪枝选择与最优尺度选择进行比较研究,还设计了一个算法来验证该方法的有效性.

  • 李明珊, 王元兵, 王元
    南京大学学报(自然科学版). 2022, 58(5): 741-749. https://doi.org/10.13232/j.cnki.jnju.2022.05.001
    摘要 (932) PDF全文 (1967) HTML (3744)   可视化   收藏

    利用中尺度数值预报模式对2019年8月15日至17日东北地区一次强降水过程进行数值模拟,通过分析强降水系统的水汽、热力和动力特征,研究台风“罗莎”增强东北冷涡强降水的物理机制.结果表明,冷涡南侧西南气流对渤海、黄海水汽的输送作用,以及冷涡东南侧台风“罗莎”对西太平洋、日本海上水汽的携带作用,作为两支主要水汽输送通道向东北地区提供充足的水汽供应,暖湿空气与干冷空气相互作用形成不稳定层结大气,同时台风“罗莎”导致对流层低层风场辐合增强,激发出强的垂直上升运动作为动力触发机制将不稳定能量释放出来.以上分析表明,有利的水汽、热力及动力条件相互配合,造成本次强降水过程.

  • 王敬诗, 蒋熹, 张夕迪
    南京大学学报(自然科学版). 2022, 58(5): 750-765. https://doi.org/10.13232/j.cnki.jnju.2022.05.002
    摘要 (652) PDF全文 (1851) HTML (91734633)   可视化   收藏

    利用1967-2016年中国603个测站降水资料和ERA5的逐小时再分析资料从夜雨量和频次两个角度分析中国夜雨时空变化特征.结果表明:我国存在夜雨现象的站点主要分布在西南部、西北部、黄淮流域、华中地区、京津冀、华南西北部和东北南部,其中,四川、西藏、贵州、新疆和青海夜雨现象最为显著.根据夜雨率的月变化特征,将夜雨现象显著站点分为N型、V型、M型、W型和Λ型,N型主要分布在云贵高原,V型主要分布在青藏高原东麓,M型主要分布在四川盆地.影响N型、V型、M型站点所在区域降水的动力和水汽条件的夜昼差异月变化与对应站点的夜雨率月变化基本一致,N型区域的夜昼差异于春季达到最大,夏季最小,V型区域在夏季最小,冬季最大,M型区域在春季最大.在1967-2016年,夜雨现象显著的地区中,青海诺木洪夜雨现象愈加明显,西藏林芝等地夜雨现象逐渐减弱,这些地区夜雨量比率每十年约变化1%~3%,夜雨频次比率约变化0.4%~1.5%.

  • 罗思涵, 杨燕
    南京大学学报(自然科学版). 2022, 58(4): 561-569. https://doi.org/10.13232/j.cnki.jnju.2022.04.001
    摘要 (832) PDF全文 (2280) HTML (1964)   可视化   收藏

    出行时间预测是智慧交通系统中的一项基本任务,因其时空关系复杂且易受到外部因素影响而充满了挑战性.为了获得准确的预测结果,提出一种将深度学习与元学习结合进行出行时间预测的方法.该方法由时空网络模型和元学习框架组成,时空网络模型利用卷积神经网络和门控循环单元同时对轨迹及周边区域的交通状况进行时空信息的提取,元学习框架则用于从其他城市学习时空网络模型的通用初始化参数,并将其应用在目标城市中.在两个真实数据集上进行了实验,实验结果证明提出的方法优于现有方法.

  • 张鼎, 杨有龙, 孙丽芹
    南京大学学报(自然科学版). 2022, 58(4): 570-583. https://doi.org/10.13232/j.cnki.jnju.2022.04.002
    摘要 (537) PDF全文 (1532) HTML (1915)   可视化   收藏

    半监督聚类集成旨在利用成对约束提升聚类集成的精度,但在高维空间的聚类效果却显著降低,另外,当只有少量的成对约束可以利用时,聚类性能很难提升.针对这些问题,提出一种新颖的半监督聚类集成算法WSCEC (Weighted Semi?supervised Clustering Ensemble Algorithm Based on Extended Constraint Projection).首先,利用多种聚类算法对数据的特征空间进行聚类,再使用随机子空间进行降维,以减少冗余特征的影响;其次,根据每对约束的k个最近或最远的样本以及约束间的传递关系来扩展原有的约束集,通过约束投影技术将原始数据空间投影到低维空间以满足尽可能多的约束;最后,设计了一个聚类解的加权策略,为每一个聚类解分配一个适当的权重以降低低质量聚类解的影响.在多个数据集上的实验结果证明了提出算法的有效性.

  • 杜渊洋, 邓成伟, 张建
    南京大学学报(自然科学版). 2022, 58(3): 369-376. https://doi.org/10.13232/j.cnki.jnju.2022.03.001
    摘要 (838) PDF全文 (1747) HTML (1214)   可视化   收藏

    非编码RNA的三维结构对于人们理解和干预其生物功能具有重要的意义,从计算的角度发展RNA结构预测方法可以加速结构获取过程,对三维结构进行评分是进行结构预测的关键步骤.近年来,基于机器学习的方法,如AlphaFold2,已在分子结构预测领域取得了革命性的进展.基于深度卷积神经网络,建立了一个对RNA三维结构进行评估的方法.为了训练这一网络,建立了一个非冗余的含有422个RNA以及126600个decoys结构的数据集.训练得到的模型在RNA?Puzzles数据集上进行了测试,结果表明,在28个RNA中,网络从众多decoys中挑选出实验结构的正确率约为71.4%,这一结果比之前有所提高.另外,还对网络的工作机制进行了分析,发现神经网络对结构评分的倾向性和已知的物理化学知识相一致.

  • 孔亚宁, 李春山, 初佃辉
    南京大学学报(自然科学版). 2022, 58(3): 377-385. https://doi.org/10.13232/j.cnki.jnju.2022.03.002
    摘要 (1476) PDF全文 (2338) HTML (1673)   可视化   收藏

    制造业在设计、生产、销售和服务环节中产生了文本、图像、音视频等海量多源异构数据,高效地管理与利用这些数据资源为制造业再生产创造价值是当前制造企业面临的重大难题.传统的数据存储与检索系统将多模态数据按不同形式或模态进行分类并单独处理,导致不同模态的数据之间缺乏语义关联(文本、图像、音视频数据之间无法互检),无法支持制造企业的设计、服务等业务流程的智能化.设计并实现了一种面向文本、图片等多源异构数据的跨模态存储与检索系统,实现智能制造多源异构数据的高效管理与检索.具体地,该系统将制造企业生产运营过程中产生的多源异构数据投影到统一的高维语义空间进行表示产生语义向量,并按不同的查询需求将数据存储到不同的模式中;其次,该系统设计了三级结构+分层联通朴素构图算法的高效检索方法,将多源异构数据按照语义向量进行索引,以满足制造业用户的语义查询需求.在flickr30k数据集上进行了实验,实验结果表明:(1)该系统可支持百万级别的跨模态数据存储与检索;(2)百万级别数据下系统检索速率为毫秒级;(3)检索的正确率比现有的向量检索方法更高.

  • 胡玉文, 徐久成, 张倩倩
    南京大学学报(自然科学版). 2022, 58(1): 1-8. https://doi.org/10.13232/j.cnki.jnju.2022.01.001
    摘要 (559) PDF全文 (1477) HTML (779)   可视化   收藏

    决策演化集是处理决策规则在时间序列上演化问题的理论,它将着眼点从静态的决策信息系统转移到动态的时间序列上,研究决策信息系统随时间变化时的演化规律,是一种新的决策规则研究方法.在决策演化集理论体系下预测规则伴随实际规则产生,因此预测规则必然对实际规则产生影响.为了解释预测规则和实体规则之间的相互关系,引入卷积方法,在时间序列上构建预测规则和实际规则的演化混合矩阵,并利用该矩阵对决策信息系统进行预测分析.

  • 刘鑫, 胡军, 张清华, 于洪
    南京大学学报(自然科学版). 2022, 58(1): 9-18. https://doi.org/10.13232/j.cnki.jnju.2022.01.002
    摘要 (506) PDF全文 (1644) HTML (1036)   可视化   收藏

    属性约简是粗糙集理论的核心研究内容之一.为满足不同用户对约简的不同需求,针对多用户偏好改变的情形,提出一种面向多用户的三支动态属性约简方法.首先,融合多用户偏好,定义用户偏好矩阵描述多用户下各属性偏好度;然后,结合属性偏好度和现实问题的代价,提出用户偏好指标,表示属性在当前用户组下的重要程度,并作为启发信息选择属性;最后,利用三支决策理论对约简集合和非约简集合进行属性的三分而治,达到更新约简的目的.实例分析及实验结果验证了方法的可行性和有效性,并且得到的约简能较好地满足多用户需求.

  • 崔兴立, 丁忞, 王冠
    南京大学学报(自然科学版). 2021, 57(6): 905-915. https://doi.org/10.13232/j.cnki.jnju.2021.06.001
    摘要 (905) PDF全文 (2099) HTML (1243)   可视化   收藏

    月球南极?艾特肯盆地是太阳系最大的撞击盆地之一,也是月球上最大、最古老的撞击盆地.南极?艾特肯盆地是研究早期大型撞击事件的重要窗口,而小型撞击坑的识别与计数定年是研究南极?艾特肯盆地演化史的基础.由于撞击坑直径和数量符合幂次定律,数量众多的小型撞击坑难以单纯依靠人力进行识别.近年来,计算机算力的提升使得训练复杂的卷积神经网络成为可能.采用已有的专家标注训练神经网络,进而实现图像特征的自动提取,能够在保证准确率的同时极大地提高识别效率.采用基于卷积神经网络算法的You Only Look Once Version5 (YOLO V5)目标探测系统来自动识别月球南极?艾特肯盆地直径为2~15 km的小型撞击坑.在训练神经网络时,使用融合了SELENE和LRO数据的数字高程模型SLDEM2015和最新的专家标记撞击坑数据库.训练好的网络在测试集上的结果与专家标记的撞击坑数据库相比,识别结果的准确率(Precision)为0.96,召回率(Recall)为0.95,F1值为0.95.通过对与专家标注不符的识别结果进行可视化,识别出至少十个专家误标记的撞击坑,证明撞击坑自动识别方法可以用于检验专家标注的可靠性.基于南极?艾特肯盆地的撞击坑自动识别结果,确定了南极?艾特肯盆地四个典型中型撞击坑的绝对模式年龄,并与已有的定年结果对比,进一步验证了自动识别结果的可靠性,也显示了提出的方法在利用自动识别的撞击坑进行中型撞击坑定年方面的潜力.提出的撞击坑自动识别方法有望进一步拓展到更小撞击坑的识别,并迁移到月球其他地质单元乃至其他行星的研究中.

  • 王一尘, 肖智勇
    南京大学学报(自然科学版). 2021, 57(6): 981-999. https://doi.org/10.13232/j.cnki.jnju.2021.06.007
    摘要 (731) PDF全文 (1811) HTML (1214)   可视化   收藏

    火山活动是天体内部热活动的表现,火山活动的形式和持续时间是探索行星环境和宜居性演化的重要方面.与内太阳系的其他天体一样,水星表面经历了大规模和长时期的火山活动,但是水星上的火山地貌、喷发机制、持续时间,以及火成岩的物质组成等特点和其他类地天体明显不同.水星上的火山活动主要发生在太阳系形成之初的10亿年内,溢流性火山活动形成的坑间平原和平坦平原在全球分布,是水星表面分布面积最大的火山物质.随着内部逐渐冷却,水星自约38亿年前后进入了全球收缩的热状态,岩石圈内的压应力阻碍岩浆上涌,大规模溢流性火山活动快速停止.距今约35亿年以来,水星表面的火山活动主要是挥发分驱动岩浆沿岩石圈内的薄弱带快速上升引起的爆发性火山活动,在全球形成了百余处火成碎屑沉积物.一些爆发性火山活动持续到水星地质历史的近期.水星火山活动的历史反映了独特的幔部动力过程,揭示了天体撞击作用对内部热扰动的影响,对水星的起源和演化具有重要的指示意义.

  • 许国强, 余长州, 王林, 周春蕾, 高阳
    南京大学学报(自然科学版). 2021, 57(2): 255-261. https://doi.org/10.13232/j.cnki.jnju.2021.02.010
    摘要 (586) PDF全文 (2100) HTML (1466)   可视化   收藏

    现有的混合结构学习算法受制于变量的邻居集,导致混合结构学习算法在约束学习阶段,若变量的邻居集没有包含真实结构的节点,该节点将再也不会被考虑.为改进这一问题,通过探索贝叶斯网络结构与节点影响度间存在的可能性关系,设计基于节点影响度的变量序调整方法并将调整后的变量序应用于网络结构学习.调整后的变量序在减少搜索空间的同时,也改善了传统约束空间过于依赖变量邻居集的问题,进而提升网络结构的学习质量.实验结果表明,该算法能有效地提升现有混合结构学习算法的精度,同时也验证了从节点影响度的角度去探索贝叶斯网络结构图的可行性.

  • 郭怡, 姜成燕, 焦瑞华, 蒋爱芹
    南京大学学报(自然科学版). 2021, 57(2): 334-343. https://doi.org/10.13232/j.cnki.jnju.2021.02.019
    摘要 (469) PDF全文 (2079) HTML (1478)   可视化   收藏

    研究Antimycin类天然产物对三阴性乳腺癌细胞MDA?MB?231特异性生长抑制和杀伤作用.三种结构类似的天然产物Antimycin?1,?2和?3对MDA?MB?231细胞生长都有很强的抑制作用,其IC50分别为1.34±0.07,160±20和180±50 nmol·L-1,Antimycin?1活性是Antimycin?2和Antimycin?3的一百多倍.10 nmol·L-1的Antimycin?1就可有效抑制MDA?MB?231细胞增殖,药物处理细胞24和48 h后的抑制率分别达到约80%和90%.显微镜下可以观察到,10和100 nmol·L?1的Antimycin?1都不同程度地杀伤MDA?MB?231细胞,1000 nmol·L-1的Antimycin?1甚至使细胞几乎消溶,只留下突起的核和胞质残骸.而同样浓度药物造成的乳腺正常细胞MCF?10A和结肠癌细胞HCT116形态的改变不明显.1和5 nmol·L-1的Antimycin?1对细胞集落抑制率分别达到52%和95%.20和50 nmol·L-1的Antimycin?1也明显改变MDA?MB?231细胞核形态,核呈畸形,皱缩严重,核膜破损.5,10和100 nmol·L-1的Antimycin?1处理MDA?MB?231细胞12,24和48 h引发细胞凋亡和坏死数量增加,并呈现时间和剂量依赖性.5,10和20 nmol·L-1的Antimycin?1处理MDA?MB?231细胞6,12和24 h后,没有观察到对细胞周期时相的明显影响.20 nmol·L-1的Antimycin?1处理MDA?MB?231细胞12,16,20和24 h后,引起胞内活性氧(reactive oxygen species,ROS)水平随处理时间延长呈逐渐下降趋势.以上结果证明,纳摩尔级的Antimycin?1能有效抑制和杀伤三阴性乳腺癌MDA?MB?231细胞.

  • 曾宪华, 陆宇喆, 童世玥, 徐黎明
    南京大学学报(自然科学版). 2021, 57(1): 1-9. https://doi.org/10.13232/j.cnki.jnju.2021.01.001
    摘要 (634) PDF全文 (1894) HTML (1263)   可视化   收藏

    风格迁移是一门将参考图像的风格迁移到目标图像上的技术,但将风格迁移算法应用于写实类照片时,生成的图像却会因为纹理扭曲严重而表现得不真实或是生成的图像整体缺少美感,为了解决此类问题,提出一种基于卷积神经网络的风格迁移算法.首先,为了高效融合不同层信息作为特征表达使生成图像饱满丰富,用聚合方法结合了图像较浅层和较深层的特征;然后,使用全局风格损失和局部风格损失来构建总风格损失项,这样能使生成图像保持风格全局一致性,同时也保留了局部细节信息,其中全局风格损失是由格拉姆矩阵表达,而局部风格损失由马尔科夫随机场表达.为了限制图像结构的变化,将图像变化约束在颜色空间的局部仿射中.还提出一种基于神经网络的语义分割模块来约束图像不同语义区域处的纹理溢出,该模块自动生成输入图像的语义分割映射,节约人为手工构造语义区域的时间.实验结果表明,该方法在不同的风格场景下均能产生真实且美观的图像.

  • 余方超, 方贤进, 张又文, 杨高明, 王丽
    南京大学学报(自然科学版). 2021, 57(1): 10-20. https://doi.org/10.13232/j.cnki.jnju.2021.01.002
    摘要 (1234) PDF全文 (2255) HTML (1246)   可视化   收藏

    近年来,深度学习在很多领域都得到了广泛的应用,然而基于深度学习的人工智能应用正面临严重的隐私泄露风险,虽然研究人员提出了很多相应的防御机制,但这些方法大都存在以下问题:对攻击者掌握的背景知识有过多的假设、不具有通用性以及高复杂度和高计算代价.尝试从差分隐私的角度出发构造一个通用隐私保护防御算法.目前在深度学习领域,应用最广泛的差分隐私算法是DPSGD(Stochastic Gradient Descent with Differential Privacy),但在应用DPSGD的过程中难以选择合适的参数以达到良好的拟合效果;此外,其隐私损失的度量机制也较为复杂.为解决这些问题,提出DPADAM(Adaptive Moment Estimation with Differential Privacy)算法,同时引入zCDP(Zero?Concentrated Differential Privacy)作为隐私损失的度量机制,使其在应用过程中更加简单灵活.实验证明,DPADAM算法能够有效解决参数依赖问题,在确保隐私性的同时提高模型的拟合效果.

  • 李俊余, 李星璇, 王霞, 吴伟志
    南京大学学报(自然科学版). 2020, 56(4): 480-493. https://doi.org/10.13232/j.cnki.jnju.2020.04.006
    摘要 (640) PDF全文 (1617) HTML (30999709)   可视化   收藏

    三元概念的约简是三元概念分析的重要问题,因为它既能简化三元图的表示,又有助于更好地理解三元概念的语意并从中提取有价值的信息.基于三元因子分析,研究保持三元背景中所有三元关系不变的三元概念约简.首先,基于三元因子分析提出三元概念约简的定义.该方法是在保持三元背景不变的条件下寻找尽可能少的三元概念,即这些三元概念能够完整地反映原始三元背景所包含的所有三元关系.其次,讨论三元因子分解与三元概念协调集的关系,并给出三元概念协调集和约简的判定方法.最后,利用三元概念约简将三元概念分为三类:核心(绝对必要)概念、相对必要概念和不必要概念,并得到每类三元概念的充要条件.此外,通过实例给出由三元因子分解和概念约简定义两种方法寻找三元概念约简的详细过程.

  • 万青, 魏玲, 任睿思
    南京大学学报(自然科学版). 2020, 56(4): 494-504. https://doi.org/10.13232/j.cnki.jnju.2020.04.007
    摘要 (427) PDF全文 (1560) HTML (1069)   可视化   收藏

    规则提取是知识发现的一个重要研究方向.多源数据是一类重要的数据集,从不同的角度对多源数据进行规则提取可为决策行为提供更加可信的依据.以多源决策表为数据基础,首先以数据源和决策规则的结论为切入点,提出两类多源决策规则的概念及其支持度和覆盖度的刻画方式;其次,分析这两类多源决策规则之间的联系;最后通过引入单源化决策表的定义,研究这两类多源决策规则的获取方法,并基于此讨论了两类多源决策规则的简化方法.

  • 刘显, 陈强路, 王小林, 丘靥, 杨源显
    南京大学学报(自然科学版). 2020, 56(3): 297-307. https://doi.org/10.13232/j.cnki.jnju.2020.03.001
    摘要 (805) PDF全文 (1670) HTML (245367980)   可视化   收藏

    拉曼光谱是一种原位、快速、无损的分析技术,被广泛用于流体包裹体组分的定性描述和半定量?定量分析.盐水溶液的OH伸缩振动谱峰(νs?H2O)随流体盐度升高向高波数偏移,同时其对称性也逐渐增强,是反映流体盐度的良好指标.需要注意的是,具有双折射性的寄主矿物本身的晶体定向性也会影响νs?H2O谱峰的峰形,是限制该方法应用于自然包裹体盐度测定的重要因素.方解石是最常见的包裹体寄主矿物之一,其晶体定向性对νs?H2O谱峰的影响规律缺少系统的实验研究.应用熔融毛细硅管合成包裹体技术制备了一系列含不同浓度NaCl溶液的透明腔体,在室温条件下收集其拉曼光谱,经过拟合处理后,建立了NaCl浓度和拉曼光谱参数之间的定量关系.而后,系统分析了沿101111210001方向制备的方解石薄片的方向性对溶液的νs?H2O谱峰的影响规律.方解石晶体定向性对νs?H2O光谱形态的影响表现为使低波数部分得以增强或者减弱.在系统实验观测的基础上,提出了较为可行的方解石中包裹体盐度的原位拉曼光谱测定流程,即将包裹体片旋转0°~180°获取多条拉曼光谱,经拟合处理后获得其光谱参数的平均值,而后计算流体盐度.最后,将该方法应用于地质实例分析,测定了瑶岗仙钨矿晚期热液方解石脉中的包裹体盐度,并与显微测温法进行了对比,其偏差在±5%以内.

  • 游杰, 胡广, 张玺华, 沈安江, 彭瀚霖, 田兴旺, 赵东方
    南京大学学报(自然科学版). 2020, 56(3): 308-321. https://doi.org/10.13232/j.cnki.jnju.2020.03.002
    摘要 (937) PDF全文 (1716) HTML (1078)   可视化   收藏

    微生物碳酸盐岩中有机质在同生?早成岩阶段的降解既可以产生酸性流体对碳酸盐颗粒进行溶解,扩大后期成储流体通道,有利于储层发育;但也可能导致孔隙水处在碱性环境下,形成碳酸盐矿物胶结,阻碍溶蚀流体对储层的改造.因此,同生?早成岩期有机质降解对微生物岩储层储集空间的形成有重要影响,但研究薄弱.以四川盆地北部地区上震旦统灯影组四段(灯四段)微生物碳酸盐岩为例,综合岩石学和原位微区地球化学分析(LA?ICP?MS),开展了这一降解过程的地球化学示踪研究.结果显示,当微生物碳酸盐岩中的有机质处于有氧降解时,微亮晶和亮晶组构均具有Ce负异常;当亮晶组构Ce元素转变为正异常时,表明有机质进入厌氧降解阶段.此外,微生物岩亮晶组构中Cr含量高于微亮晶组构,可以作为有机质降解经过了硝酸盐还原过程的识别标志.如果有机质被Fe?Mn氧化物氧化降解,则会造成微生物岩微亮晶组构中Fe含量高于亮晶组构.随着成岩环境的还原状态进一步加强,有机质降解进入硫酸盐还原阶段,将导致微生物岩中亮晶组构相对于微亮晶组构富集Cu,Mo元素.因此,Ce,Cr,Fe,Mo,Cu等元素在微生物岩不同岩石组构中的变化可以有效识别微生物岩同生?早成岩阶段有机质降解的成岩环境并示踪有机质降解过程.

  • 陈睿, 伏云发
    南京大学学报(自然科学版). 2020, 56(2): 159-166. https://doi.org/10.13232/j.cnki.jnju.2020.02.001
    摘要 (555) PDF全文 (2061) HTML (17826785)   可视化   收藏

    目前基于运动想象(Motor Imagery,MI)的脑?机接口(Brain?Computer Interface,BCI)可提供的指令数相对较少,为增加新的控制参数,基于脑电(Electroencephalogram,EEG)研究握力变化及想象的单次识别.招募20名被试者参与实验,要求被试者用右手执行三种不同握力大小(4 kg,10 kg,16 kg)的实际或想象任务,对任务期间覆盖运动区的九个通道的EEG数据进行分析,采用共同空间模式(Common Spatial Pattern,CSP)提取特征,然后利用极限学习机(Extreme Learning Machine,ELM)和支持向量机(Support Vector Machine,SVM)进行单次识别.ELM对三类握力变化及想象的平均单次识别准确率分别为82.3%±2.1%和80%±1%,SVM对三类握力变化及其想象的平均单次识别准确率分别为86.3%±5.5%和83.7%±3.8%.实验结果表明,ELM和SVM能有效地识别三种不同握力大小的实际或想象任务,而SVM的分类结果更好,可望为MI?BCI增加新的控制参数提供新思路.

  • 俞冬明, 李苑, 李智星, 王国胤
    南京大学学报(自然科学版). 2020, 56(1): 1-8. https://doi.org/10.13232/j.cnki.jnju.2020.01.001
    摘要 (677) PDF全文 (2085) HTML (958)   可视化   收藏

    随着互联网应用的蓬勃发展,一个人在不同的社交网络平台上都拥有账户是很常见的.如何在多个社交网络上找到同一个人的账户,对许多应用是很重要的问题,也被称为用户对齐问题.在用户对齐问题上,目前有两个主要的挑战:首先,收集手工对齐的用户对作为训练数据的代价非常大,但传统的有监督方法往往需要大量的标注数据才能获得较好的效果;其次,不同网络中的用户的结构和属性往往不太相同,进一步增加了用户对齐的难度.提出一种无监督用户对齐方法SPUAL(Soft Principle for User Alignment),设计了一种新颖的基于用户的属性与结构的软对齐一致性原则,通过无监督方法计算用户对是否服从此原则来推断用户对是否对齐.在几个公共数据集上的实验表明,该方法的性能比目前最先进的无监督方法都有明显提高.

  • 应用矿物学
    李勤,陆现彩,张立虎,程永贤,刘鑫
    南京大学学报(自然科学版). 2019, 55(6): 879-887. https://doi.org/10.13232/j.cnki.jnju.2019.06.001
    摘要 (1242) PDF全文 (3978) HTML (8970)   可视化   收藏

    蒙脱石是地表最为常见的一种粘土矿物,层间阳离子交换是蒙脱石矿物的基本属性之一,并因此而成为被广泛应用的矿物材料.通过研究钠基蒙脱石(两层水状态)的阳离子交换特征,在分子层次上探究了K+,Mg2+,Ca2+,Ba2+从环境溶液进入蒙脱石层间并与Na+离子的交换行为.模拟结果显示不同离子交换量顺序为:Ba2+>Ca2+>K+>Mg2+,即水化能力弱的阳离子更容易和层间Na+离子发生交换;离子的水化能力还与其在蒙脱石层间的空间分布密切相关,水化能力最强的Mg2+离子远离蒙脱石表面而倾向于出现在层间区域的中间,Ca2+与Ba2+离子则部分出现在结构层表面四面体取代位置;K+离子的分布具有特殊性,被紧缚在硅氧烷六元环中央空穴处.阳离子进入蒙脱石层间是自由能下降的过程,进入层间的阳离子活动性远低于孔隙流体中的离子,其中Ba2+离子的自扩散系数最低.本文在原子层次上揭示的蒙脱石阳离子交换动力学过程有助于加深对粘土矿物?流体相互作用机制的理解.

  • 韩普,刘亦卓,李晓艳
    南京大学学报(自然科学版). 2019, 55(6): 942-951. https://doi.org/10.13232/j.cnki.jnju.2019.06.007
    摘要 (1059) PDF全文 (2390) HTML (891)   可视化   收藏

    电子病历实体识别是医疗领域人工智能和医疗信息服务中非常关键的基础任务.为了更充分地挖掘电子病历中的实体语义知识以提升中文医疗实体识别效果,提出融入外部语义特征的中文电子病历实体识别模型.该模型首先利用语言模型word2vec将大规模的未标记文本生成具有语义特征的字符级向量,接着通过医疗语义资源的整合以及实体边界特征分析构建了医疗实体及特征库,将其与字符级向量相拼接以更好地挖掘序列信息,最后采用改进的Voting算法将深度学习结果与条件随机场(Conditional Random Fields,CRF)的结果加以整合来纠正标签偏置.实验表明,融入外部语义特征的改进模型的F值达到94.06%,较CRF高出1.55%.此外,还给出了模型最佳效果的各项参数.

  • 汪贵庆, 袁杰, 沈庆宏
    南京大学学报(自然科学版). 2019, 55(5): 709-717. https://doi.org/10.13232/j.cnki.jnju.2019.05.001
    摘要 (836) PDF全文 (2352) HTML (974128054)   可视化   收藏

    随着交通规模的增大,人们对自驾出行的质量需求越来越高,而在当前的交通最优路径选择的研究中,大多只考虑静态的交通路网场景,且忽略了通过交叉口时的代价,造成计算结果和实际行驶的代价之间误差较大.针对这一问题,基于Petri网络,建立了更精确的多因素道路交叉口交通路网模型,提出了基于精英蚁群算法的交通最优路径选择算法,并对经典蚁群算法提出两个方面的改进:第一,在信息素浓度的初始化过程中加入主干道引导和行车方向的引导,以加快蚂蚁群初始的搜索速度;第二,在全局信息素浓度更新时,使用双精英蚂蚁策略,采用相互约束的方式更新两条最优路径上的信息素浓度,解决了算法过早陷入停滞的问题,且计算出多个可供选择的路径.仿真结果表明,该算法在保证收敛性的同时,将搜索到最优路径的概率提升至100%;同时,在得到最优解概率均不低于90%的前提下,该算法的收敛速度是其他算法的数倍.