2023年, 第59卷, 第3期 
刊出日期:2023-05-31
  

  • 全选
    |
  • 方宇, 贾春虹, 吴思琪, 闵帆
    南京大学学报(自然科学版). 2023, 59(3): 363-372. https://doi.org/10.13232/j.cnki.jnju.2023.03.001
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    时间序列预测是大数据发展背景下的重要研究课题,具有广泛的应用前景,其主要任务是根据时序数据反映的发展规律去推测未来某阶段的走势,但大多数预测模型未能充分考虑残差带来的影响,无法取得更优的预测结果.提出一种三支残差修正的融合时序预测模型,能够有效地将残差圈定在一定范围内,提高时间序列的预测精度.首先,利用时间序列分解算法STL (Seasonal?Trend Decomposition Procedure Based on Loess)将时间序列分解为趋势项、周期项和余项;其次,针对分解后的三个分量,设计轻量级梯度提升机(Lightweight Gradient Boosting Machine,LightGBM)和时间卷积网络(Temporal Convolutional Network,TCN)的融合预测模型;最后,结合三支决策理论设计了三支残差修正算法,修正余项预测过程中产生的残差,进而修正时间序列的预测结果.实验结果证明,提出的模型在绝大多数情况下优于其他对比模型,预测效果更好.

  • 刘志中, 李林霞, 孟令强
    南京大学学报(自然科学版). 2023, 59(3): 373-387. https://doi.org/10.13232/j.cnki.jnju.2023.03.002
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    随着基于位置的社交网络的快速发展,POI (Point of Interest)推荐已成为推荐领域的研究热点,然而已有的工作未能充分挖掘用户的POI交互偏好以及POI转移偏好,影响了POI推荐效果.提出一种基于混合图神经网络的个性化POI推荐方法.首先构建用户社交网络图,利用图注意力网络(Graph Attention Networks,GAT)学习含有社交关系的用户特征;其次,构建用户与POI的标号交互二部图,基于标号二部图神经网络(Signed Bipartite Graph Neural Networks,SBGNN)学习含有用户POI交互偏好的用户特征与POI特征;构建POI有向转移图,基于会话图神经网络(Session?Based Recommendation with Graph Neural Networks,SRGNN)学习含有用户POI转移偏好的POI特征;之后,融合含有社交关系的用户特征与含有POI交互偏好信息的用户特征得到最终的用户特征表示,融合含有用户POI交互偏好的POI特征与含有用户POI转移偏好的POI特征,得到最终的POI特征表示;最后,将用户特征表示与POI特征表示做乘积操作,通过Sigmoid函数得到用户对每个POI的预测评分,并以此向用户推荐Top?K POI序列.基于三个公共数据集(Gowalla,Foursquare和Yelp)开展了大量的实验,结果表明,与七种基线模型的推荐效果相比,提出的方法的准确率和召回率分别平均提升19.95%和1.35%.

  • 张绎凡, 李婷, 葛洪伟
    南京大学学报(自然科学版). 2023, 59(3): 388-397. https://doi.org/10.13232/j.cnki.jnju.2023.03.003
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前,多视图子空间聚类在模式识别和机器学习领域得到了广泛的研究.以前的多视图聚类算法大多将多视图数据划分在其原始特征空间中,其功效在很大程度上隐式地依赖于原始特征呈现的质量.此外,不同视图包含同一对象的特定信息,如何利用这些视图恢复潜在的多样性信息对后续聚类尤其重要.为了解决上述问题,提出一种多样性诱导的潜在嵌入多视图聚类方法,使用特定于视图的投影矩阵从多视图数据中恢复潜在嵌入空间.考虑到多视图数据不同视图之间的多样性信息,采用经验的希尔伯特施密特独立准则约束特定于视图的投影矩阵,将潜在嵌入学习、多样性学习、全局相似性学习和聚类指标学习整合在同一框架中,还设计了一种交替优化方案来有效处理优化问题.在几个真实的多视图数据集上的实验表明,提出的算法具有一定的优势.

  • 曲皓, 狄岚, 梁久祯, 刘昊
    南京大学学报(自然科学版). 2023, 59(3): 398-412. https://doi.org/10.13232/j.cnki.jnju.2023.03.004
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    针对织物瑕疵检测中复杂纹理区域误判和边缘检测模糊问题,提出一种双端输入型网络架构WNet,使用两个骨干分支分别提取多尺度局部和全局特征,依靠自注意力机制的全局建模能力,在卷积深层网络中补充全局信息,减少深层网络中纹理特征的冗余.为了减少深层网络中局部细节信息的丢失,提出一种轻量级双分支池化金字塔,将浅层多尺度细节特征引入深层模块.搭建多尺度嵌套双分支模块,将各级尺度下不同感受野的特征信息进行融合,该模块更加关注瑕疵特征,可以生成较精确的预测图.实验证明,提出的方法在ZJU?Leaper的四个数据集上的综合评价指标较优,尤其是fmeasure、阳性预测率和阴性预测率较高.

  • 王昱翔, 葛洪伟
    南京大学学报(自然科学版). 2023, 59(3): 413-424. https://doi.org/10.13232/j.cnki.jnju.2023.03.005
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    金属表面缺陷检测旨在通过合理的算法判断工业生产中金属材料的表面图像中是否存在缺陷,是计算机视觉领域在工业应用中的重要研究内容,但现有的基于分割的金属表面缺陷检测算法存在抗干扰能力弱、容易背景误判和检测粒度不够细致等问题.针对具有各种干扰因子的金属表面图像,提出一种基于U2?Net的金属表面缺陷检测算法Attention?U2Net.首先,为了解决实际生产中金属表面图像噪点过多导致背景误判和采样层获取信息不够细致的问题,设计U型注意力编码模块,可以在编码时增大缺陷区域权重的同时,抑制背景噪声;然后,为了解决图像中存在的难检测样本和边界复杂问题,设计具有权重的损失函数并结合多层次监督方法,使检测算法更关注难检测样本和边界像素点,提高预测准确度;最后,使用根据图像结果自动计算灰度阈值进行结果优化的算法,最终生成高质量缺陷预测图.与六种常用的缺陷检测领域的像素分割方法在金属表面缺陷公开数据集上进行比较实验,实验结果表明,提出的算法的像素准确率、查准率、查全率、F?score、平均绝对误差和均方误差均取得了优良的结果,证明该算法拥有较强的抗干扰因子能力,最终缺陷预测图像素准确率高,边界明显.

  • 谭嘉辰, 董永权, 张国玺
    南京大学学报(自然科学版). 2023, 59(3): 425-434. https://doi.org/10.13232/j.cnki.jnju.2023.03.006
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    糖尿病视网膜病变是由糖尿病引起的一种重要眼部疾病,不及时治疗可能会导致失明,现有的诊断方法主要依靠医生手动分类,但这种方法耗时耗力.随着深度学习的发展,越来越多的自动分类技术被应用到医学领域.针对糖尿病视网膜病变严重程度的分类问题,样本图像十分稀缺,传统的单支模型很难达到较高的分类性能,提出一种孪生结构的分类模型Siamese Model with Swin?Transformer and MLP?Based U?Net (SSM),并利用数据扩增来解决此问题.首先,利用直方图均衡化、高斯滤波和增强对比度等方法预处理图像;然后,将预训练的Swin?Transformer作为SSM模型的特征提取分支网络来获得层次化的特征表示;此外,还设计了一个含有跳跃连接结构的MLP?Based U?Net (MU?Net)作为SSM模型的分类器来对提取的特征进行分类.在Messidor数据集上进行训练和测试,与现有最先进的模型相比,SSM模型性能更优,在测试集上的精确率达0.976,召回率达0.975,F1达0.976,准确率达0.975,Kappa系数达0.967.

  • 方明月, 冯早, 朱雪峰
    南京大学学报(自然科学版). 2023, 59(3): 435-445. https://doi.org/10.13232/j.cnki.jnju.2023.03.007
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目前工业现场采集的大部分数据缺失标记信息,若仅使用其中的标记数据和未标记数据的局部信息会造成学习器的性能下降,而传统半监督学习对标记数据的利用具有随机性且没有考虑监督信息数量的变化对性能的影响.针对上述问题,提出一种主动学习策略下基于最小生成树的变分贝叶斯推理半监督高斯混合模型,利用主动学习策略在标记信息中重新筛选构建高质量成对约束信息,利用最小生成树聚类来初始化模型参数,提升模型在标记样本数量受扰动时的鲁棒性.选用实验室采集的管道状态检测数据集对提出的模型进行验证,实验结果表明,当标记样本占总体样本的比例从50%下降到10%时,提出的组合模型的预测准确率依旧保持在72.4%以上,而且,当某一类别的样本完全失去监督信息时,该组合模型的聚类效果仍然可以分析判断数据类别的所属类型.

  • 吕佳, 肖锋
    南京大学学报(自然科学版). 2023, 59(3): 446-459. https://doi.org/10.13232/j.cnki.jnju.2023.03.008
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    深度规则分类器在处理大规模或高复杂度的分类任务时,模糊规则库的数量会过于庞大,导致其内部结构变得复杂,可解释性较差,测试时间也随着模糊规则数量的增加而线性递增,且在移动端设备内存有限的条件下无法保证内存的有效性.针对这些问题,提出一个新的内存有效的快速双层深度规则分类器,该分类器在深度规则分类器的基础上增设数据汇总和高描述性原型提取两个模块.仅当原型数量达到内存上限时执行一次数据汇总模块来删除部分原型,解决有限条件下内存不足无法训练出有效分类器的问题.高描述性原型提取模块将原型划分为底层和顶层的双层结构,底层由所有原型组成,用于展示分类器内部结构的全貌,顶层由少量高描述性原型组成,用于分类决策阶段.这样能有效地防止深度规则分类器在处理大规模数据时,因其复杂的内部结构导致较差的可解释性,同时提高分类决策阶段的效率.在基准数据集上的仿真实验验证了该方法的可行性和有效性.内存有效的快速双层深度规则分类器在处理大规模数据或数据流问题时,在达到较高分类性能的同时,保证模型的透明性、解释性和内存的有效性.

  • 程钦男, 莫志强, 曹斌, 范菁, 单宇翔
    南京大学学报(自然科学版). 2023, 59(3): 460-470. https://doi.org/10.13232/j.cnki.jnju.2023.03.009
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    篇章级别的服务事件序列抽取任务旨在发现给定服务的相关文本中所有服务事件的顺序序列关系,构建得到一组按照服务事件发生顺序排列的服务事件集合,其研究可以广泛应用于知识图谱构建、自动问答等任务.与该任务相关的现有工作分过程抽取和事件时序关系抽取两类:过程抽取相关研究默认事件真实发生的顺序与文本描述的顺序一致,忽略了许多非过程性文本中事件发生的顺序与文本描述顺序不一致的情况;.事件时序关系抽取的相关研究往往关注事件对之间的时序关系判断,无法建模所有事件的顺序序列关系.针对以上问题,提出一种基于多粒度信息编码和联合优化的篇章级服务事件序列抽取方法,使用多粒度信息编码模块获得服务文本中具有丰富语义信息的服务事件向量表示,再利用联合优化模块提取服务事件之间的顺序序列关系,得到篇章级别的服务事件序列.由于没有公开数据集可以直接用于服务事件序列抽取任务的评估,抽取基于事件时序关系抽取的公开数据集TimeBank (TB),AQUAINT (AQ),Platinum (PL)和MATRES中的数据,构建了可用于篇章级服务事件序列抽取任务评估的数据集,实验结果证明了提出方法的有效性.

  • 仲兆满, 熊玉龙, 黄贤波
    南京大学学报(自然科学版). 2023, 59(3): 471-482. https://doi.org/10.13232/j.cnki.jnju.2023.03.010
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    多元文本情感分析旨在对文本表达的情感色彩进行划分,但目前多标签文本情感分类仍然存在数据集类别不平衡、提取特征不充分等问题.为了提高句子级文本的情感分类能力,提出一种基于异构分类器的集成学习方法.基分类器分三种:基于自注意力机制的双向长短期记忆网络算法、基于词嵌入的卷积神经网络算法、基于文本信息熵的朴素贝叶斯算法,通过模糊积分算法确定各基分类器在待分类样本上的分类权重,最大程度地利用各分类器之间的联系与分类结果.实验结果表明,提出的集成学习方法与目前先进的集成模型SentiXGboost,3WD?AdaCNN?SVM相比,各项指标均得到提升,结合欠采样和重采样技术构建的集成分类模型能对类别不平衡文本情感进行准确的分类.

  • 杨京虎, 段亮, 岳昆, 李忠斌
    南京大学学报(自然科学版). 2023, 59(3): 483-493. https://doi.org/10.13232/j.cnki.jnju.2023.03.011
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    传统的情感分析方法主要针对句子、微博等形式的短文本,而对话长文本具有篇幅长、对话双方情感不同且情感易随对话发生变化等特点,使对话长文本中用户多重情感集成困难、情感分析任务精度低.为此,提出子事件交互模型TSI (Topic Subevents Interaction)、预训练模型ERNIE (Enhanced Language Representation with Informative Entities)和循环卷积神经网络(Recurrent Convolutional Neural Networks,RCNN)相结合的对话长文本情感分析模型(TSI with ERNIE?RCNN,TER).该模型通过动态滑动窗口抽取子事件,保留文本关键特征,降低文本冗余度,基于抽取的子事件分析对话双方的情感来识别情感主体,并集成各子事件的情感特征来解决对话双方情感不一致的问题.在真实数据上的实验结果表明,TER的精确率、召回率与F1均优于现有模型.

  • 张宇杰, 吕权, 李夏冰, 李磊
    南京大学学报(自然科学版). 2023, 59(3): 494-502. https://doi.org/10.13232/j.cnki.jnju.2023.03.012
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    双氧水是一种应用广泛的绿色氧化剂,在许多领域有重要作用,但国内的双氧水生产技术能耗高,工艺技术水平亟待提升.目前,工业上主要使用蒽醌法生产双氧水,氧化工段采用的多塔氧化流程存在设备投资高、尾氧含量高、氧化效率偏低等问题.为了探究微界面反应对氢蒽醌氧化工段的强化效果,基于传统三塔氧化流程,构建微界面体系的构效调控数学模型,通过模拟计算研究气泡尺寸和操作条件等因素对氧化工段的传质和反应的强化效果.计算结果表明,在工况条件下(空气压力为0.4 MPa,操作温度为50 ℃,空气流量减少10%),当气泡Sauter平均直径由5.0 mm减小至0.50 mm时,氧化效率从93%增大到99%,尾氧含量从6%减少到1%;此外,在保证反应效果的前提下,可以降低4~6 ℃的反应温度.本研究成果为推进微界面强化蒽醌法制双氧水的氧化工段的工业应用提供了理论基础.

  • 黄姝晗, 范振辉, 谷成, 金鑫
    南京大学学报(自然科学版). 2023, 59(3): 503-517. https://doi.org/10.13232/j.cnki.jnju.2023.03.013
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    天然矿物作为重要环境介质对有机污染物在环境中的迁移转化具有重要影响.干燥的矿物表面能展现出与在水溶液条件下截然不同的催化活性,如路易斯(Lewis)酸性和布朗斯特(Br?nsted)酸性等,对表面吸附的污染物具有更强的催化转化效应.决定矿物表面催化活性的性质包括矿物晶型结构,矿物表面活性金属原子位点密度和结构排列,矿物表面湿度.对于黏土矿物而言,层间交换性阳离子对其表面酸性和催化活性都具有重要影响.目前,有关非水饱和相矿物表面对有机污染物的催化转化过程多聚焦在水解反应和氧化还原反应.干燥的矿物表面能够通过极强的Br?nsted酸性和Lewis酸性作用,催化有机污染物的易水解官能团(如酰胺键、磷脂键等)发生显著的水解反应,也可以与富电子的酚类化合物发生直接电子传递形成酚自由基,进一步氧化聚合产生二噁英等有毒物质.由于自然界土壤和大气颗粒物表面往往处于水分非饱和状态,因此针对非水饱和相条件下矿物表面催化转化污染物的研究具有重要的环境意义.基于矿物非水饱和相表面性质,综述了天然矿物与有机污染物在非水饱和相条件下发生的水解和氧化聚合反应,为今后的工作提供了展望.

  • 施斌杰, 贾鼎, 葛勇
    南京大学学报(自然科学版). 2023, 59(3): 518-525. https://doi.org/10.13232/j.cnki.jnju.2023.03.014
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    基于蜂窝型声子晶体设计两种不同界面(Ⅰ与Ⅱ)的谷拓扑波导. 模式分析显示界面Ⅰ和Ⅱ中的谷边缘态分别具有反对称和对称分布的特征. 在此基础上,采用一对反相与同相声源分别激发包含界面Ⅰ和Ⅱ的谷拓扑波导,数值结果表明,一对反相与同相声源分别在界面Ⅰ和Ⅱ上激发产生反对称与对称分布的谷边缘态,并可以在体带隙中实现声能谷输运.此外,在谷拓扑波导的界面Ⅰ和Ⅱ中引入Z型和V型两种不同类型的缺陷,进一步验证了声能谷输运的鲁棒性.最后,在谷拓扑波导的两侧分别放置一对声源,通过主动控制声源初始相位,设计实现了可调控声非对称传输效应.本工作为制备高鲁棒性可调控的拓扑声学器件提供了设计思路与理论方案.

  • 王一如, 乔里斯·彼得斯
    南京大学学报(自然科学版). 2023, 59(3): 526-542. https://doi.org/10.13232/j.cnki.jnju.2023.03.015
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    通过比较骨骼形态学正确鉴定考古遗址中动物遗存所代表的相关物种的种属,是解读过去人?动物?环境关系的基础.然而,在中国西部,对史前遗址中的中型牛科动物遗存的鉴定是具有挑战性的,因为这个地区分布着尺寸重叠、形态极其近似的羊亚科(Caprinae)和羚羊亚科(Antilopinae)的八个不同属种,即盘羊(Ovis ammon)、岩羊(Pseudois nayaur)、斑羚(Naemorhedus goral)、鬣羚(Capricornis milneedwardsii)、北山羊(Capra ibex sibirica)、原羚(Procapra sp.)、瞪羚(Gazella sp.)和藏羚(Pantholops sp.).此外,史前时期家养绵羊(O. aries)和山羊(C. hircus)在该地区的引入,使对这些形态相似的物种的鉴定进一步复杂化.在以往对中国西部新石器时代和青铜时代的动物考古研究中,研究人员往往未能对这些不同生物分类物种进行准确的鉴定,这可能导致对古代动物资源获取模式的缺乏依据的假设.本研究基于以往的骨骼形态学研究和对大量现生标本的统计和比较,根据现藏于欧美国家自然历史博物馆和标本库中的大量现生羊亚科和羚羊亚科动物骨骼(每个种属≥27个成年个体),总结出了一系列区分这些不同种属羊亚科和羚羊亚科动物颅后骨的形态学鉴定特征和基本度量数据.盲测实验表明,在现代标本中使用这些解剖标准可以明确地区分肱骨远端的所有类群.将这些鉴定标准应用于青藏高原东北部的史前考古标本,结果表明:在距今4000年前后的齐家文化遗址中,家养绵羊已经传入甘青地区,但是人类仍大量捕猎当地野生羊亚科动物.研究提出,对中国西部青铜时代以及更早阶段遗址中的羊亚科遗存的鉴定和人?羊关系的解读应更加谨慎.文中提出的鉴定方法可成为评估中国西部史前遗址人类获取动物资源策略的一个有效工具.