2024年, 第60卷, 第1期 
刊出日期:2024-01-30
  

  • 全选
    |
  • 黄玮翔, 丁季, 刘夏栩, 殷勤, 兰闯闯, 吴建盛
    南京大学学报(自然科学版). 2024, 60(1): 1-11. https://doi.org/10.13232/j.cnki.jnju.2024.01.001
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    蛋白受体是细胞信号转导的重要组成部分,也是人类最重要的药物靶点,其中G蛋白偶联受体(G Protein Coupled Receptors,GPCRs)占绝大部分,目前市场上大约34%的药物都以GPCRs作为靶点.准确地注释GPCR蛋白的生物学功能对于理解它们涉及的生理过程及靶向药物发现至关重要,其中基因本体学(Gene Ontology,GO)是描述蛋白质功能最常用的方式,GPCR蛋白和GO都包含多个视图信息,有效利用这些信息可有效提升蛋白质功能的预测性能.因此,提出一种基于多视图的归纳矩阵补全方法MVIMC(Multi?View Inductive Matrix Completion)来预测GPCR蛋白的GO生物学功能.MVIMC有效利用了GPCR蛋白和GO标记视图信息,其中GPCR包含文本信息和结构域信息,GO包含文本信息.实验结果表明,MVIMC在分子功能和生物过程两方面的预测概率分别达到68%和69%,优于目前最好的矩阵补全方法以及CAFA蛋白质功能预测比赛中的常用方法.

  • 张旭, 欧中洪, 宋美娜
    南京大学学报(自然科学版). 2024, 60(1): 12-17. https://doi.org/10.13232/j.cnki.jnju.2024.01.002
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着互联网时代的高速发展,用户面临信息过载问题,推荐系统应运而生.推荐系统一般分两个阶段,即推荐召回和推荐排序,推荐召回阶段主要用来筛选出一部分候选集以减小推荐排序阶段的计算压力.多兴趣个性化推荐系统对于每一个用户,算法能学习到用户的多种不同的兴趣偏好,然而目前的多兴趣召回算法只考虑了用户短期历史纪录,忽视了用户长期历史纪录中蕴含的丰富信息.针对这一问题,提出一种基于用户长短期历史的多兴趣召回算法,通过不同的神经网络模型结构分别建模用户长短期兴趣偏好,并通过门控融合网络融合用户长短期兴趣偏好,最终得到用户的多个兴趣偏好,实现了个性化推荐召回.在两个公开数据集上的实验证明了模型的有效性.

  • 资文杰, 贾庆仁, 陈浩, 李军, 景宁
    南京大学学报(自然科学版). 2024, 60(1): 18-25. https://doi.org/10.13232/j.cnki.jnju.2024.01.003
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    对城市三角网格(Urban Triangle Mesh)数据进行语义分割以识别不同类别的物体,是理解和分析三维城市场景的一种非常重要的方法.城市三角网格是一种具有丰富空间拓扑关系的三维空间几何数据,包含大量的几何信息,然而,现有的方法仅仅单独对每种几何信息进行特征提取,然后简单地融合再进行语义分割,难以利用几何信息之间的关联性,对个别物体的分割性能不佳.为了解决上述问题,提出一种基于自注意力机制Transformer的模型UMeT (Urban Mesh Transformer),其由多层感知机和MeshiT (Mesh in Transformer)模块构成,不仅可以利用多层感知机提取高维特征,还可以利用MeshiT模块计算各种几何信息之间的关联性,有效挖掘城市三角网格数据中隐含的关联.实验证明,UMeT能提取高维特征,同时保证城市三角网格数据的空间不变性,从而提升了语义分割的准确性.

  • 唐蕴芯, 廖梅, 张艳玲, 张建, 陈皓, 王炜
    南京大学学报(自然科学版). 2024, 60(1): 26-37. https://doi.org/10.13232/j.cnki.jnju.2024.01.004
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    乳腺超声广泛应用于乳腺肿瘤诊断,基于深度学习的肿瘤良恶性分类模型可以有效地辅助医生诊断,提高效率,降低误诊率,然而,由于标注数据的高成本问题,限制了此类模型的开发和应用.为此,从乳腺超声视频中构建了无标注预训练数据集,包含11805个目标样本数据和动态生成的正、负样本数据集(样本量分别为188880和1310355个).基于该数据集,搭建了三胞胎网络并进行了自监督对比学习.此外,还发展了Hard Negative Mining和Hard Positive Mining方法来选取困难的正负样本构建对比损失函数,加快模型收敛.参数迁移后,将三胞胎网络在SYU数据集上进行微调和测试.实验结果表明,与基于ImageNet预训练的若干SOTA模型以及与前人针对乳腺超声的多视图对比模型相比,提出的三胞胎网络模型具有更强的泛化能力和更好的分类性能.此外,还测试了模型对标注数据量的需求下限,发现仅使用96个标注数据,模型性能即可达到AUC=0.901,敏感度为0.835.

  • 邹杰军, 王欣, 石俊豪, 兰卓, 方宇, 张翀, 谢文波, 沈玲珍
    南京大学学报(自然科学版). 2024, 60(1): 38-52. https://doi.org/10.13232/j.cnki.jnju.2024.01.005
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    频繁模式挖掘(Frequent Pattern Mining,FPM)在社交分析中扮演重要角色,能从海量社交数据中挖掘用户行为的模式和规律,为社交网络的研究提供新的认识和决策支持.然而,对于一个FPM任务,设置一个合适的支持度阈值不容易;此外,FPM作为一个NP?hard问题,不存在多项式时间的算法.针对上述问题,提出一种无须用户设置初始支持度阈值的算法ItrMiner.该算法使用一种新的兴趣度指标对模式进行评估,综合考虑模式的大小和支持度,挖掘Top?Rank?K频繁模式.同时,为了解决去除初始支持度阈值后在算法剪枝阶段遇到的困难,提出基于树模式优先识别的策略和模式扩展约束策略,减少非必要候选模式的生成.在真实图和人工合成图数据集上进行了广泛的实验,证明ItrMiner在执行效率和可扩展性方面表现出色,尤其在稠密的数据集上,其时间开销仅为基线算法Top?K Graph Miner的13.2%.另外,提出的模式扩展约束策略的有效性较高,和无扩展约束优化的ItrMinernopt算法相比,效率提升最高可达9.5倍.

  • 王梅, 王伟东, 刘勇, 于源泽
    南京大学学报(自然科学版). 2024, 60(1): 53-64. https://doi.org/10.13232/j.cnki.jnju.2024.01.006
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多视图聚类是重要的无监督学习方法之一,然而在实际应用中很难获取完整的多视图数据,导致不完整多视图聚类问题.大多数已有的不完整多视图聚类方法只考虑了视图的属性信息,而忽视了数据结构信息对聚类的影响,使提取的特征不能充分表示原始数据的潜在结构.针对以上问题,提出一种基于多阶近邻约束的深度不完整多视图聚类方法.首先,利用具有自注意力机制的深度自编码器获取带有视图间信息交互的深层次隐含特征,并采用加权融合的方式获取视图的公共语义信息;然后,对于不完整多视图中的缺失数据,利用多视图的公共表示进行补全;最后,提出一种多阶近邻约束机制,该机制考虑不完整多视图数据的深层结构信息,利用多视图的互补性构建近似完整的近邻图,引导编码器学习更紧致、更有判别性的高级语义特征.在公共数据集上的实验结果证明了所提方法的有效性.

  • 凌六一, 李卫校, 冯彬
    南京大学学报(自然科学版). 2024, 60(1): 65-75. https://doi.org/10.13232/j.cnki.jnju.2024.01.007
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    运动想象脑电(Motor Imagery Electroencephalogram,MI?EEG)已经应用在脑机接口(Brain Computer Interface,BCI)中,能帮助上下肢功能障碍的患者进行康复训练.然而,现有技术对MI?EEG低效的解码性能和对MI?EEG过度依赖预处理的方式限制了BCI的广泛发展.提出了一种多模型融合的时空特征运动想象脑电解码方法(Multi?model Fusion Temporal?spatial Feature Motor Imagery EEG Decoding Method,MMFTSF).MMFTSF使用时空卷积网络提取MI?EEG中浅层信息特征,使用多头概率稀疏自注意力机制关注MI?EEG中最具有价值的信息特征,使用时间卷积网络提取MI?EEG高维时间特征,使用带有softmax分类器的全连接层对MI?EEG进行分类,并利用基于卷积的滑动窗口和空间信息增强模块进一步提升MI?EEG解码性能.在公开的BCI竞赛数据集IV?2a上进行验证.实验结果表明,MMFTSF在数据集上达到89.03%的解码准确度,在MI?EEG分类任务中具有理想的分类性能.

  • 蒲杰, 张所娟, 陈卫卫
    南京大学学报(自然科学版). 2024, 60(1): 76-86. https://doi.org/10.13232/j.cnki.jnju.2024.01.008
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    知识追踪通过学习者历史作答数据动态追踪学习者的认知状态并预测他们未来的答题表现,然而,现有的知识追踪模型通常只利用试题中考查的知识点来表征,没有考虑试题本身蕴含的重要知识情境特征,这限制了模型的效果.此外,和融合教育先验的认知诊断方法相比,知识追踪模型的可解释性略有不足.为了解决上述问题,提出一种知识情境感知的深度知识追踪模型,通过知识情境表征模块来获取试题深层次的知识权重、试题难度等知识情境特征.在知识聚合模块中,模型将知识权重嵌入学习者面向试题的作答能力的计算,最后,在学习预测模型中引入猜测和失误因素,通过认知诊断模型来优化实际场景中的预测表现,进一步提高模型的预测性能.和现有方法相比,提出的模型在试题层级上取得了更好的预测结果,同时体现了模型可解释性方面的优势.

  • 李林红, 杨杰, 冯志成, 朱浩
    南京大学学报(自然科学版). 2024, 60(1): 87-96. https://doi.org/10.13232/j.cnki.jnju.2024.01.009
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对现有站口行人检测方法难以在实时性与准确性之间均衡的问题,提出一种改进型的Yolov5s模型用于高效地检测站口行人.首先,基于EfficientNetV1改进提出轻量化主干网络EfficientNet_c,优化网络结构和基本单元堆叠次数,提高模型在浅层对小尺寸目标的特征提取能力和提取速度;其次,通过调整宽度因子为基础模型的1/2,改变模型特征层通道数,在较小的精度损失情况下降低模型参数量;再次,增加小目标检测层,优化模型特征提取能力,提高模型对小目标的敏感度和准确性;最后,利用迁移学习的方式优化模型,增强模型泛化能力,降低学习成本,进一步提升模型精度.在课题组收集的数据集上的实验结果表明,所提算法准确率为92.2%,模型参数量仅为1.4 M.在Tesla P100 GPU上的平均推理速度为7.7 ms,实现模型准确率和推理速度的提升.研究结果为地铁和火车站口的行人检测和流量统计提供了一种可行的解决方案.

  • 罗亚波, 李鑫
    南京大学学报(自然科学版). 2024, 60(1): 97-105. https://doi.org/10.13232/j.cnki.jnju.2024.01.010
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    准确的瞳孔定位广泛应用于疲劳监控、注意力分析、凝视跟踪等领域.当前,对于瞳孔定位的研究,还存在两个难点问题:(1)瞳孔检测的精准率受到图像分辨率、照明、头部姿态的影响,因而自然条件下的定位精准度较低;(2)虹膜颜色影响定位精准率,但当前对于不同虹膜颜色的瞳孔定位方法的研究还不完善.针对以上问题,提出一种新的适用于包含全脸图像的瞳孔定位方法.所提方法无需训练,可直接用于瞳孔定位任务.方法核心是将表示局部径向对称性的自相似性分数,与根据瞳孔和周围区域之间的梯度信息计算得到的眼部区域梯度辐射分数相结合,取联合分数峰值坐标为瞳孔中心.在BioID数据集和GI4E数据集上评估本方法.在归一化误差e0.05的情况下,准确率分别为94.67% (BioID),97.09% (GI4E),在e0.10的情况下,准确率分别为99.47% (BioID),99.51% (GI4E).所提方法在由低分辨率深色虹膜的人脸图像组成的自制数据集上准确率为98.66% (e0.05)和100% (e0.10),表明所提方法对于虹膜颜色有较好的鲁棒性.

  • 李丽红, 董红瑶, 刘文杰, 李宝霖, 代琪
    南京大学学报(自然科学版). 2024, 60(1): 106-117. https://doi.org/10.13232/j.cnki.jnju.2024.01.011
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对不完备混合信息系统的分类问题,结合粒计算中的邻域容差关系和互信息理论,定义邻域容差互信息的概念,并利用集成学习的思想,提出不完备数据集的邻域容差互信息选择集成分类算法.该算法首先根据缺失属性得到信息粒,划分粒层构建粒空间,在不同的粒层上使用以BP神经网络作为基分类器的集成算法,构建新的基分类器;然后,根据每个信息粒的缺失属性计算出关于类属性的邻域容差互信息,来衡量各个信息粒的重要度,并根据基分类器预测准确率以及邻域容差互信息重新定义基分类器权重;最后,根据预测样本对基分类器加权集成预测分类结果,并与传统的集成分类算法进行对比分析.对于部分不完备混合型数据集,新提出的集成分类算法能有效提升分类准确率.

  • 侯贤宇, 陈玉明, 吴克寿
    南京大学学报(自然科学版). 2024, 60(1): 118-129. https://doi.org/10.13232/j.cnki.jnju.2024.01.012
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    粒化是一种构建粒数据与粒模型的方法.近些年来,有多种粒化方法被提出,如基于样本相似度尺度的相似度粒化、基于邻域关系的邻域粒化和基于特征尺度变换的旋转粒化等.这些粒化方法都在监督与非监督任务中获得优秀的表现.但是这些粒化方法都是基于样本本身的度量关系构建的,会导致样本在粒化过程中的信息量呈现不同量级的扩展现象.这一特征使粒化后的粒子在一些情况下难以处理.因此,提出一种基于多采样方法构建近似粒子的粒化方式以保证粒化过程被限制在有限量级,并且在粒化过程中抛弃固定的度量关系式,粒化的结果会随着选取的近似集与近似基模型的不同而变化,使得样本在粒化为粒子时有着更高的灵活性.文中对多采样近似粒化和多种粒化方法进行详细比较,结果表明多采样近似粒化有着更高的分类性能,且与多种先进的集成算法做了详细比较,结果表明在分类任务上多采样近似粒集成模型拥有着更好的鲁棒性与泛化性.

  • 刘昆, 南晨曦, 孔令冉, 刘慧婷, 付翯云, 瞿晓磊
    南京大学学报(自然科学版). 2024, 60(1): 130-140. https://doi.org/10.13232/j.cnki.jnju.2024.01.013
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    准确评估污染物在污染场地土壤中的吸附分配过程是污染场地安全管理和再利用开发的重要环节.以我国典型电子垃圾拆解场地为研究对象,解析了场地土壤中有机质的吸附特征,建立了适用于场地有机污染物分配评估的有机碳标化分配系数(KOC)预测模型,揭示了有机污染物在场地土壤中有机质上的吸附机制.该场地土壤有机质对有机污染物具有较强的吸附能力.构建了预测场地土壤中有机质吸附有机污染物的KOC的多参数线性自由能模型(pp?LFER).pp?LFER模型相较于常用的单参数线性自由能模型(sp?LFER)展现出更好的场地吸附数据的预测能力(R2=0.919).同时,采用其他文献报道的pp?LFER模型对该场地污染物KOC进行预测,发现预测偏差较高(RMSE>1.12),这表明pp?LFER模型的预测效果受场地土壤中有机质的性质影响较大,其跨区域应用性仍待提升.进一步结合pp?LFER模型中的分子结构描述符和各项系数解析了土壤中有机质的吸附机制,发现疏水作用和极化作用是吸附过程的重要作用力,氢键作用显著影响极性化合物的吸附过程.本研究基于实际污染场地土壤构建了高精度吸附预测模型,为场地污染风险评估和修复利用提供了更准确的技术手段.

  • 张庆泉, 赵燕鹏, 蔡兴, 张琦, 郭红岩, 孙媛媛
    南京大学学报(自然科学版). 2024, 60(1): 141-150. https://doi.org/10.13232/j.cnki.jnju.2024.01.014
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    碳氟型表面活性剂全氟辛酸(Per?uorooctanoic Acid,PFOA)的大量使用导致其与各类碳氢表面活性剂广泛共存于土壤?地下水环境中,对人体健康和生态安全存在潜在威胁.通过柱实验探究不同离子强度条件下(1.5 mmol·L-1和30 mmol·L-1),非离子型碳氢表面活性剂烷基糖苷(Alkyl Polyglycoside,APG)及两性型碳氢表面活性剂十二烷基二甲基甜菜碱(Dodecyl Dimethyl Betaine,BS?12)对PFOA在两种饱和土壤中迁移行为的影响和作用机制.结果表明,APG能促进PFOA的迁移行为,其主控机制为APG与PFOA在土壤表面的竞争吸附作用;BS?12能通过对土壤表面负电荷的中和作用及疏水作用增强PFOA在土壤中的阻滞,抑制其迁移行为.因此,预测和评估PFOA在土壤中的迁移行为时,需考虑共存碳氢表面活性剂的影响.

  • 胡国胜, 季斌
    南京大学学报(自然科学版). 2024, 60(1): 151-157. https://doi.org/10.13232/j.cnki.jnju.2024.01.015
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    作为一种光驱动的新兴污水处理工艺,藻?菌颗粒污泥(Microalgae?Bacterial Granular Sludge,MBGS)因其高除污效能、低能耗、零温室气体排放等优点而被广泛研究.MBGS粒径可以影响MBGS的藻?菌质量比与生态位,从而影响其传质及光利用效率,进而影响其污染物去除效能.鉴于此,考察了不同粒径MBGS (1.08,2.20,3.17和4.08 mm)的除污效能,发现1.08 mm的MBGS系统对有机物、氨氮及磷酸盐的去除效能最高,同时其出水溶解氧浓度最高.进一步结合文献调研和分析表明:当光强为100~500 μmol·m-2·s-1时,MBGS最优粒径范围为0.80~1.60 mm;MBGS粒径对于有机物及氨氮的去除影响较磷酸盐更大;通过提供剪切力(如水力或机械搅拌)能够维持MBGS的最优粒径.研究结果可为MBGS工艺应用于实际污水处理提供理论基础.

  • 巫燕园, 刘逸凡, 汤蓉, 姜玲玲, 王海鲲
    南京大学学报(自然科学版). 2024, 60(1): 158-167. https://doi.org/10.13232/j.cnki.jnju.2024.01.016
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    我国过去数十年经历了快速的经济发展和城市化过程,也面临着严峻的空气污染问题,探究重点城市群PM2.5污染及其健康影响特征与趋势对于评估和优化污染控制政策具有重要意义.基于大气污染、人口特征等多源高分辨率数据,应用环境健康风险评估方法,分析和比较了2000-2020年京津冀、长三角、珠三角、成渝等四个特大城市群的PM2.5污染及其健康负担.结果表明,过去的二十一年中,京津冀的PM2.5污染最严重,长三角和成渝城市群次之,珠三角污染程度最轻;总体上四个城市群PM2.5年均浓度先增后降,2020年较2000年分别下降35.6%,43.9%,34.6%和49.7%.2020年京津冀、长三角、珠三角和成渝城市群的PM2.5归因死亡人数分别约为12.8万、14.0万、5.2万和9.0万,老龄化和人口增长是城市群大气污染健康负担增加的最主要原因,其中珠三角城市群人口因素贡献最大.PM2.5污染减轻是健康负担下降的主要驱动力,表明城市群大气污染治理取得显著的健康效益.未来需要加强人群健康视角的城市群PM2.5污染防控,特别要关注老年人群大气污染健康风险.

  • 周泽妍, 宗树斌, 谭海霞, 田兴军
    南京大学学报(自然科学版). 2024, 60(1): 168-180. https://doi.org/10.13232/j.cnki.jnju.2024.01.017
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    明日叶(Angelica keiskei)是一种经济价值极高、开发前景广阔的食药两用蔬菜.然而由于土壤及温湿度条件等因素限制,明日叶种子出苗率低,制约明日叶的栽培生产.以山东新产的绿茎明日叶种子为材料,通过不同水温浸种及不同浓度KNO3、植物激素、强氧化剂的外源添加,研究了提高种子的萌发处理方法.结果表明,温水(55 ℃)浸种、KNO3溶液、植物激素、强氧化剂处理均可不同程度地促进种子萌发.与清水浸种相比,在KNO3溶液处理组中,750 mg·L-1处理的发芽率和发芽势分别为83.82%和59.56% (p<0.05),为组内最高;在植物激素处理组中,100 mg·L-1 GA3溶液处理发芽率最高,达到81.19% (p<0.05);在强氧化剂处理组中,500 mg·L-1 KMnO4溶液处理的发芽率和发芽势分别为84.92%和46.03% (p<0.05),为组内最高.在这三种外源添加处理条件下,750 mg·L-1KNO3溶液处理的幼苗下胚轴长1.08 cm,根长2.09 cm;100 mg·L-1 GA3溶液处理的幼苗下胚轴长2.41 cm,根长2.01 cm;500 mg·L-1 KMnO4溶液处理的幼苗下胚轴长度1.21 cm,根长1.63 cm.综合比较发现,100 mg·L-1 GA3溶液处理条件下明日叶种子发芽率高,且植株幼苗的根长及下胚轴长度也最好.本研究结果可为明日叶种植及同类种子繁育提供借鉴.