2023年, 第59卷, 第4期 
刊出日期:2023-07-31
  

  • 全选
    |
  • 武桐舟, 刘强, 王亮
    南京大学学报(自然科学版). 2023, 59(4): 543-549. https://doi.org/10.13232/j.cnki.jnju.2023.04.001
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    推荐系统在互联网应用中扮演重要的角色,它的核心任务是将最相关的物品推荐给用户,然而,由于推荐系统通常在大规模、稀疏和高维的数据集上运行,因此存在严重的偏差问题.近年来,多任务学习成为解决推荐系统偏差的有效方法,它可以同时学习多个相关任务,充分利用数据集的内在结构和相关性,研究人员最近还提出全空间反事实的转化率预测,利用逆倾向得分和双重鲁棒方法对推荐算法的效果进行估计.然而,通过理论分析发现,倾向性分数估计不准确和插值误差往往会导致预估偏差,这在实践中经常发生,影响了推荐的准确性和可靠性.由此,引入不确定性估计,结合多任务学习,通过计算每个用户反馈数据的概率分布来衡量数据的可靠程度,减轻模型在数据稀疏或数据噪声较大时的过拟合问题,有效地提高系统的泛化能力并减少偏差.实验结果表明,加入不确定性估计的多任务学习可以更好地适应不确定性的环境,在推荐系统中有广阔的应用前景.

  • 梁慧玲, 刘慧, 刘力维, 赵佳, 阮怀军
    南京大学学报(自然科学版). 2023, 59(4): 550-560. https://doi.org/10.13232/j.cnki.jnju.2023.04.002
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    从观察数据中发现变量之间的因果关系是许多科学研究领域的关键问题,传统Granger因果模型受到维度灾难的影响,难以准确地在高维时间序列中发现因果关系.提出一种基于分位数因子模型的Granger因果分析新方法QFM?CGC用于高维时间序列因果关系的判定.首先,QFM?CGC采用赤池信息量准则进行模型选择,避免人为干预设置滞后阶数的操作;然后,对向量自回归(Vector Autoregressive,VAR)模型中的条件变量建立分位数因子模型进行降维,减少VAR模型中的待估计系数,对降维后的VAR模型重新进行条件Granger因果分析;最后,使用蒙特卡洛模拟评估不同方法识别底层系统与观测时间序列的连通性结构的能力.在不同维度变量的线性仿真系统和两组现实数据集上与基准方法和经典方法进行了比较,实验结果验证了该方法的有效性.

  • 张寿军, 江海峰, 肖硕, 王树豪, 商景杰
    南京大学学报(自然科学版). 2023, 59(4): 561-569. https://doi.org/10.13232/j.cnki.jnju.2023.04.003
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    任务分配一直是移动群智感知的研究热点,对于任务的完成质量有重要影响,但目前针对多地点、长持续时间的任务分配研究较少.面向长时多任务分配问题,设计多轮次多时间段的任务分解策略,考虑任务权重、时间覆盖率、时间冗余度和冗余均衡度等因素,构建长时多任务质量评价模型.以预算为约束,以最大化任务覆盖质量为优化目标,提出基于改进文化基因算法的任务分配方法.该算法使用自适应遗传算法进行全局搜索,结合模拟退火算法进行局部搜索,并设计贪心修复算法对不合适的个体进行修复.仿真实验的结果表明,提出的算法同各基准算法相比,具有良好的性能.

  • 田金灿, 孙雪姣
    南京大学学报(自然科学版). 2023, 59(4): 570-579. https://doi.org/10.13232/j.cnki.jnju.2023.04.004
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    传统的偏好推理使用权衡增强的条件偏好网络(Tradeoff?Enhanced Conditional Preference Networks,TCP?nets)进行用户的偏好推理,不仅能高效地表示对元组的定性偏好关系并优化用户偏好结果,还能描述每个属性之间的偏好关系,其主要聚焦于关系元组中的单个属性的偏好.但把对条件偏好查询的技术推广到数据流的条件提取却是一个挑战,面临的技术困难主要是对数据流中序列的提取,对提取的序列进行占优查找等.首先,针对偏好数据流,提出一种时间条件查询语言Stream Pref来处理数据流;其次,在Stream Pref中加入时间索引来推理和规范数据流提取序列的时间条件偏好,提出提取对象序列算法、占优对象及占优序列查找算法和数据流序列间占优对比的算法;最后,在数据集上分析验证提出的算法的有效性.实验结果证明,提出的算法与min Top?k,Partition和Incpartition算法相比,得到的结果更准确.

  • 孟元, 张轶哲, 张功萱, 宋辉
    南京大学学报(自然科学版). 2023, 59(4): 580-589. https://doi.org/10.13232/j.cnki.jnju.2023.04.005
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    近些年,基于深度学习的算法和模型在各种图像分析任务中都取得了显著的成功,与常见的自然图像相比,医学图像数据集依然面临高度不平衡的问题,不平衡数据会导致特征空间里的决策边缘倾向样本多的类别,导致分类效果的下降.为了解决该问题,提出一种基于卷积神经网络考虑特征类内紧凑性的不平衡医学图像分类方法(Z?Score Compactness?based Convolutional Neural Network,ZC3NC).首先,从一个卷积神经网络的最后一层卷积层提取训练集样本与测试集样本的特征图,随后引入一个新的Z分数来度量测试集数据的特征图相对训练集每个类在特征空间上的偏离度,偏离度的度量基于类内的紧凑度,其主要关注样本的分布特性,对各类样本数量的不平衡性不敏感.最终,根据计算的偏离度,对测试集的数据进行分类.在DermaMNIST数据集上的实验表明,在不对数据和神经网络模型做任何额外增强的情况下,该方法的平衡准确率比原卷积神经网络模型平均提高11.15%,最多提高14.08%,证明提出的分类方法能有效地提高多种卷积神经网络对不平衡医学图像数据的分类性能.此外,和最先进的不平衡分类方法Under?Bagging KNN相比,该方法的性能平均提升了2.36%.

  • 陈怡, 唱睿喆, 曹雨冬, 张世武, 孙帅帅, 贠国霖
    南京大学学报(自然科学版). 2023, 59(4): 590-599. https://doi.org/10.13232/j.cnki.jnju.2023.04.006
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    手势意图识别是人机交互领域的热门研究方向,然而现有手势的识别系统大多基于肌电信号,肌电信号不可避免的信号串扰、衰减、信噪比低等问题严重影响了手势识别的准确率.为了解决这一问题,研发了基于液态金属复合材料传感手环的可穿戴手势识别系统,液态金属复合材料灵敏的压阻效应使设计的传感手环获取的传感信号表现出稳定、灵敏度高、噪声低等优异特性.基于此传感信号的手势识别系统由数据采集和模式识别两个部分组成,其平均离线识别准确率高达97.19%.更重要的是,该系统无须在手部加装设备,通过前臂肌肉即可获取信号,因此可用于手部功能缺失的残疾群体,用户范围广泛,具有重要的社会和经济效益.

  • 王冰洁, 张超, 李德玉, 马瑾男, 王渊
    南京大学学报(自然科学版). 2023, 59(4): 600-609. https://doi.org/10.13232/j.cnki.jnju.2023.04.007
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了探索区间二型模糊背景下的多属性群决策方法,以多粒度概率粗糙集为基础,结合MULTIMOORA(Multi?Objective Optimization by Ratio Analysis Plus the Full Multi?Plicative Form)与证据融合理论,发展了一种基于区间二型模糊信息的多粒度证据融合决策模型.首先,提出多粒度区间二型模糊概率粗糙集模型;然后,通过离差最大化法和熵权法计算决策者权重和属性权重,依据多粒度概率粗糙集和MULTIMOORA法建立区间二型模糊多属性群决策模型,通过源自D?S证据理论的证据融合方法融合得出决策结果.通过钢铁行业耗能的实例,证明提出方法的可行性与有效性,总体上,提出的决策模型具备一定的容错力,有助于获得强解释力的稳健型决策结果.

  • 刘思源, 毛存礼, 张勇丙
    南京大学学报(自然科学版). 2023, 59(4): 610-619. https://doi.org/10.13232/j.cnki.jnju.2023.04.008
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    汉越跨境民族文本检索是一类面向领域的跨语言检索任务,旨在以一种语言作为问题查询,检索出另一种语言对应的民族、宗教、文化习俗等跨境民族文档.但在汉越跨境民族文本检索任务中存在大量不常见的领域实体,实体表达形式多样,且中文和越南语两种语言领域实体没有直接对应关系,导致跨语言领域词对齐和语义对齐困难,进而影响汉越跨境民族文本检索模型性能.基于此,提出一种基于领域知识图谱和对比学习的汉越跨境民族文本检索方法.首先,利用多头注意力机制将汉越跨境民族领域知识图谱融入查询和文档,丰富查询和文档中不常见的跨境民族领域实体信息;然后,引入对比学习来解决跨语言查询和文档的语义表征对齐困难问题;最后,将融入知识图谱的查询和文档表征之间的相似度计算作为相关性分数.实验表明,提出的方法和基线模型相比,性能提高了4.1%.

  • 赵冠博, 张勇丙, 毛存礼, 高盛祥, 王奉孝
    南京大学学报(自然科学版). 2023, 59(4): 620-628. https://doi.org/10.13232/j.cnki.jnju.2023.04.009
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    从跨境民族文化文本中生成具有领域知识的摘要对进一步开展跨境民族文化文本检索、问答等任务具有重要的支撑作用,当前基于深度学习的生成式文本摘要取得了较好的效果,但直接用于跨境民族文化文本摘要任务会导致生成的摘要出现领域词汇丢失的问题.为此,提出一种融入领域知识的跨境民族文化生成式摘要方法(Domain Knowledge?Culture?Generative Summary,DKCGS),在编码端将跨境民族文化领域词典编码与原文本编码融合,以此增强模型对领域词汇的表征能力;在解码端,基于指针生成网络将具有同义或跨境关系的领域词汇分布与原文本分布结合,提高模型生成文化领域词汇的准确率.同时,在通用领域文本上进行预训练并进一步初始化参数,以缓解数据稀缺导致模型训练效果不佳的问题.实验结果表明,提出的方法在跨境民族文本摘要数据集上比基线模型的Rouge?1提升了0.95,有效提升了跨境民族文化文本摘要生成的质量.

  • 王大利, 许晴媛, 李进金, 朱泳帆
    南京大学学报(自然科学版). 2023, 59(4): 629-643. https://doi.org/10.13232/j.cnki.jnju.2023.04.010
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    学习者在认知过程中可能掌握了某些知识点,但自身的知识状态并未改变,因此,为了提高学习效率并对学习者进行知识评估,在知识点网络下运用形式概念分析方法讨论如何对学习者进行知识评估和学习路径选择问题.首先,给出了知识点网络的构造方法、有效知识点组合的概念及知识点网络下题库的构造方法;其次,通过知识点网络诱导知识点背景,在已知学习者知识状态的情况下对学习者掌握的知识点进行评估,并给出知识点网络下的学习路径图及其算法;最后,通过实验验证了提出的算法的有效性和可行性.研究发现,由知识点网络诱导的知识点背景确定的知识点结构满足良级性.

  • 范海菊, 秦小娜, 李名
    南京大学学报(自然科学版). 2023, 59(4): 644-659. https://doi.org/10.13232/j.cnki.jnju.2023.04.011
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    为了整合对图像的隐私保护、版权保护、完整性保护,提出一种压缩域基于相似码字替换的对抗嵌入方法.该方法属于对抗攻击和信息隐藏的交叉新领域,将传统对抗攻击方法中人为添加的无意义噪声替换成有意义的秘密信息,使对抗嵌入图像错误分类,防止攻击者在云端海量数据库中通过神经网络分类模型捕获特定类别的图像,实现对图像的隐私保护;而且,可以从对抗嵌入图像中完整提取隐藏的秘密信息,实现对图像的版权保护.该对抗嵌入方法的攻击对象是图像的压缩形式?矢量量化索引,攻击中使用该索引的不同相似码字索引替换嵌入的秘密信息,可以实现在高压缩率情况下对图像的双重保护.使用遗传算法优化相似索引扰动,可以有效地降低真实类别的概率,误导分类模型的输出.实验结果证明,在CIFAR?10测试数据集上,使用三种经典的网络分类模型(Resnet,NIN,VGG16),提出的对抗嵌入方法使90.83%的图像以85.44%的平均置信度被错误分类,且嵌入容量可以达到0.75 bpp.

  • 徐远东, 熊永平, 张铮, 伍贵宾, 张兴, 王伟
    南京大学学报(自然科学版). 2023, 59(4): 660-668. https://doi.org/10.13232/j.cnki.jnju.2023.04.012
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    扭曲的文档图像会干扰文档图像的光学字符识别(Optical Character Recognition,OCR).为了对扭曲形变的文档图像进行矫正,提高扭曲文档识别的正确率,基于目标检测与分割的网络,提出文档图像的边缘检测方法,使用贝塞尔(Bezier)曲线拟合文档图像的边缘曲线,通过目标检测的算法回归Bezier曲线的控制点.将文档图像的边缘检测转化为边缘曲线Bezier控制点的回归,使用文档的边缘点计算扭曲文档矫正后的矩形模板,然后将文档图像通过薄板样条插值(Thin Plate Spline,TPS)算法重映射到矩形模板中,完成文档的矫正.实验结果表明,提出的矫正方法能够对扭曲文档进行精确的边缘提取,和其他算法相比,经该算法矫正后的文档图像,其OCR的正确率有较大的提升.

  • 姚瑶, 杨吉斌, 张雄伟, 陈乐乐, 范君怡
    南京大学学报(自然科学版). 2023, 59(4): 669-679. https://doi.org/10.13232/j.cnki.jnju.2023.04.013
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi?Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM?Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM?Net在VoiceBank?DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型.

  • 徐阳, 王磊, 张义宗, 王诚彪
    南京大学学报(自然科学版). 2023, 59(4): 680-689. https://doi.org/10.13232/j.cnki.jnju.2023.04.014
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    属性约简是数据挖掘、机器学习等研究领域中的一个颇为重要的预处理步骤,其效率的高低会直接影响相关任务的性能.针对已有的非增量式属性约简方法在相容块粗糙集模型中对象集发生变化时无法高效更新属性约简的问题,提出一种以区分度为启发信息的增量式属性约简方法.首先,引入相容块的概念并运用相容块对论域进行划分,在此基础上给出不完备信息系统的区分度定义;然后,详细分析对象集发生变化条件下区分度的更新机理;进一步,以区分度为启发式信息构造增量式属性约简算法;最后,选取六个UCI数据集进行增量式约简的更新实验.实验结果表明,在不影响属性约简精度的前提下,该增量式方法的时间消耗比非增量式更新方法平均缩短50%,更加可行和高效.

  • 王一宾, 葛文信, 程玉胜, 吴海峰
    南京大学学报(自然科学版). 2023, 59(4): 690-704. https://doi.org/10.13232/j.cnki.jnju.2023.04.015
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    传统的多标签学习一般基于完整的标签信息,但随着数据量的增大,很难为每个实例获得完整的标签信息,导致弱标签问题在多标签数据集中广泛存在,严重影响了多标签的分类性能.为了提升相关性能,不少学者在实际分类中考虑特征、标签和实例部分的关联性,却忽略了它们之间的相关性.基于此,提出一种基于多维相关性的弱类属属性学习算法:首先,根据特征和标签之间的相关性,采用余弦相似度计算出标签之间的相关性;其次,根据特征与实例之间的相关性,采用密度峰值聚类获得实例相关性,并从中选择具有监督信息的标签矩阵,与分解希尔伯特矩阵获得的特征相关性结合构建流形正则化;最后,在多个不同缺省率的多标签数据集上进行了大量实验,验证了提出的算法的有效性.

  • 李首翰, 崔驰, 李威, 杨燚, 黄润生
    南京大学学报(自然科学版). 2023, 59(4): 705-712. https://doi.org/10.13232/j.cnki.jnju.2023.04.016
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    外尔半金属Co3Sn2S2是一种新型的拓扑量子材料,具有独特的拓扑能带结构,被认为是一种非常有潜力的自旋电子材料,而制备电子器件的重要一步是该材料的薄膜化.采用磁控溅射方法分别在SiO2(300 nm)/Si(100)和Al2O3(0001)衬底上生长Co3Sn2S2薄膜.X射线衍射(XRD,X?ray Diffraction)显示Co3Sn2S2薄膜的结构随厚度而变化.在不同衬底上,Co3Sn2S2薄膜的生长情况也不同,较薄的Co3Sn2S2 (<200 nm)适合生长在Al2O3(0001)衬底上,而较厚的Co3Sn2S2 (~5 μm)适合生长在SiO2(300 nm)/Si(100)衬底上.Co3Sn2S2纵向电阻率随着厚度的增加而增加,对导电起主要作用的表面层厚度保持在一定尺度内.

  • 王鑫宇, 刘红年, 俞布
    南京大学学报(自然科学版). 2023, 59(4): 713-721. https://doi.org/10.13232/j.cnki.jnju.2023.04.017
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    沿海城市的PM2.5和臭氧除受排放源、天气条件影响以外,还往往同时受城市热岛环流和海陆风环流的双重影响.利用2015年杭州市气象和环境监测数据以及数值模式RBLM?Chem,分析研究了杭州市在陆风天气、海风天气和海陆风三种环流条件下污染物浓度特征及城市效应对其的影响.得到了以下主要结论:海风使杭州市污染物浓度增大,在观测数据中PM2.5浓度和臭氧浓度分别最大增高了10.9 μg·m-3和12.0 μg·m-3,在模拟结果中相比于陆风天气型,海陆风天气型的PM2.5浓度和臭氧浓度分别增大13.1 μg·m-3和18.9 μg·m-3;相比于海风天气型,海陆风天气型的PM2.5浓度和臭氧浓度分别减小24.1 μg·m-3和11.6 μg·m-3.城市效应导致杭州市边界层高度增加63.8 m,地面风速减小0.99 m·s-1,地面气温增高1.14 ℃,PM2.5浓度增大2.86 μg·m-3,臭氧浓度增大10.2 μg·m-3.海风削弱了杭州的城市效应,城市对边界层高度、地面风速、地面气温和臭氧浓度的影响分别减小11.2 m,0.49 m·s-1,0.26 ℃和7%.

  • 林辰昕, 缪爱军
    南京大学学报(自然科学版). 2023, 59(4): 722-730. https://doi.org/10.13232/j.cnki.jnju.2023.04.018
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    银纳米颗粒(silver nanoparticles,AgNPs)由于其优越的性能,被广泛应用于医学制药、化学催化、个人护理等各个领域.在大规模的生产、消费和废弃过程中,大量AgNPs进入环境.研究表明,AgNPs在环境中会发生迁移转化,同时有可能在生物体内蓄积,并产生多种毒性效应,其生态风险不容忽视.作为毒理学研究中广泛使用的模式生物,秀丽隐杆线虫在纳米颗粒生态风险评估中具有独特优势.由此,对环境中AgNPs的来源和转化进行了阐述,同时总结了AgNPs在秀丽隐杆线虫中的累积、分布和毒性效应及内在作用机制,并进一步探讨了影响AgNPs生物累积与毒性效应的主要因素(如AgNPs的大小以及表面修饰、离子强度、天然有机质等),旨在为AgNPs生态风险评估提供科学支撑.