2015年, 第51卷, 第4期 
刊出日期:
  

  • 全选
    |
  • 石 磊,朱广浩*
    南京大学学报(自然科学版). 2015, 51(4): 659-664.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在模拟信号光纤通信系统中,链路的线性化程度和增益大小直接影响传输系统的性能,而这两种特性在很大程度上取决于链路中电信号调制和解调的方式。传统的传输方法是在发送端使用强度调制器对光信号进行强度调制,然后在接收端使用光电探测器实现电信号的解调。然而,由于传统方法中系统传递函数所固有的非线性效应,系统解调后的传输电信号质量会明显下降,产生信号失真,同时,系统的传输增益也较低,一般不超过-20 dB。本文针对上述传统方法中的缺陷,提出了一种基于负反馈解调机制的模拟信号光纤通信方法。该方法能够显著地减少电-光调制过程中所产生的非线性效应,同时提高了信号输出增益。经过一系列的数学推导,得到了关于该系统传输性能的解析表达式,并通过与数值仿真结果相比较,验证了该解析表达式的准确性和该传输系统的性能优越性。
  • 吴 琼,柏业超*,张兴敢

    南京大学学报(自然科学版). 2015, 51(4): 665-672.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    宽带雷达回波处理中存在采样速率高、存储压力大、信号处理时间长的问题。压缩感知理论(Compressive Sensing,CS)利用以远低于奈奎斯特速率采样的样本可实现信号高概率重构,有效地降低了数据采样率,缓解了宽带雷达数字信号处理的压力。该文利用贝叶斯压缩感知(Bayesian Compressive Sensing,BCS),实现对雷达回波信号的压缩采样,减小数据量的同时能够充分恢复信号的目标信息。BCS理论基于相关向量机(Relevance Vector Machine,RVM)原理,采用快速边际似然算法提高了目标信息的重建效率。仿真实验表明,相比于普通压缩感知,贝叶斯压缩感知对低维回波采样样本的重构精度更高,重构信号时域峰值相对误差降低10%以上,并且在相同误差水平下,对信噪比的要求降低5 dB,具有更强的抗噪声能力。基于贝叶斯方法的回波信号处理可以实现对目标回波的自适应观测采样,进一步降低了回波信号的采样率。
  • 王亚亚1,2,王 琼1*,方 晖1,柏业超1,张兴敢1
    南京大学学报(自然科学版). 2015, 51(4): 673-677.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    瞬时测量目标的极化特性,雷达要针对水平极化和垂直极化同时发射和接收两个互相正交的信号。匹配滤波输出峰值旁瓣电平(peak sidelobe level, PSL)和正交信号隔离度(isolation, I)是影响极化测量结果的重要因素。改进正交信号隔离度和峰值旁瓣电平比能提高极化测量精度。极化测量常用的正交信号分别是正负线性调频。线性调频信号海明加权后匹配滤波输出峰值旁瓣电平比可达42dB, 正负线性调频隔离度达到22dB。本文针对极化测量的高峰值旁瓣电平比及高隔离度的要求,研究非线性调频信号和线性调频信号组成混合调频正交信号对,根据线性调频信号参数设计和优化非线性调频信号。计算和仿真结果表明,设计的混合调频正交信号对,隔离度比正负线性调频信号提高了1.5dB,其中非线性调频信号的峰值旁瓣电平比线性调频信号提高了7dB,改进了雷达极化测量的波形。
  • 盛希冬,李建,陈启美*
    南京大学学报(自然科学版). 2015, 51(4): 678-683.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    交通路况监控与意外事故处理是我国的一个重要难题为解决固定摄像机监控盲区及视频清晰度不足的问题,提出了基于4G的移动实时视频传输系统简要阐述了系统的整体框架与层次结构,并引入基于Reactor模型的高并发I/O复用方式,在此基础上设计了一种基于动态缓冲区的发送端速率控制方法,实现了移动视频的QoS(Quality of Service)质量保障。实验结果表明在4G网络环境下,移动实时视频传输稳定,清晰度高,可应用于对交通路况的监测与实时控制。
  • 陈 雷1,吴阳江1,李晓慧1,傅 超1,王 芳1, 2,胡志军1,2*
    南京大学学报(自然科学版). 2015, 51(4): 684-691.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    铁电聚合物P(VDF-TrFE)具有可兼容硅基元件和可溶液加工等优点,在未来可擦写式非易失存储领域极具应用前景。构建多级存储态是提高存储密度和降低生产成本的有力途径。我们以纳米压印为主要实现手段,通过构建高度有序的纳米图案化导电基底的方式,简单快捷地实现了P(VDF-TrFE)薄膜高密度的多级存储功能。文中主要应用压电响应力显微镜(PFM)从微观上观测了图案化导电基底上P(VDF-TrFE)在电压加载后的极化变化情况,直观地证实了其在外电场的作用下可形成了三种不同的极化状态。

  • 聂慧琴,许如银,陶 海,周 政*,张志炳*
    南京大学学报(自然科学版). 2015, 51(4): 692-699.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    以大孔强酸性阳离子交换树脂为催化剂,莰烯与2-甲基-1,3-丙二醇反应主要生成异冰片基羟异丁基醚。在小试搅拌反应釜内分别考察了不同阳离子交换树脂、搅拌速度、催化剂用量、反应物配比、溶剂和反应温度等对该烷氧基化反应的影响。结果表明,较佳的工艺条件为:催化剂为无水Lewatit2620,用量为总的液体物料质量的20%,莰烯与2-甲基-1,3-丙二醇的初始质量比为1.5:1,反应温度为353 K,反应时间为4 h,此时莰烯的转化率为78.80%,异冰片基羟异丁基醚的选择性为93.5%。Lewatit2620重复使用八次后仍具有良好的反应活性。为校正溶液的非理想性,采用UNIFAC基团贡献法估算活度系数,并得到不同温度下的反应平衡常数。此外,基于同样的反应条件,在放大20倍的搅拌反应釜器中,莰烯的转化率与小试的结果基本一致。
  • 李长浩1,巫先坤2,王志祥1*,张 锋2*,张志炳2
    南京大学学报(自然科学版). 2015, 51(4): 700-706.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在303.2 ~ 333.2 K范围内,首先考察了低压苯蒸汽在5种咪唑离子液体中的溶解性能。然后采用NRTL活度系数模型关联二元体系的等温汽液平衡,关联误差在2%以内。最后,基于关联数据,获得了苯蒸汽在离子液体中的无限稀释活度系数和亨利系数,评价了体系的热力学变化:吸收焓、吸收熵与偏摩尔过量焓。结果表明,亨利系数随温度增大而增大,离子液体吸收苯蒸汽属于物理吸收。相同阳离子,当阴离子由[BF-4]、[PF-6]变为[Tf2N-],无限稀释活度系数逐渐降低,混合溶液由正偏差溶液变为负偏差溶液,溶解度增大;阴离子相同时,延长阳离子烷基侧链长度,可降低无限稀释活度系数。热力学分析表明离子液体吸收苯蒸汽由体系的吸收熵控制。[hmim][Tf2N]吸收熵变值最大,与苯混合物的热力学稳定性高,分子间作用力较强,对苯蒸汽的溶解性能强。苯的溶解度由阴离子决定,且按如下顺序递增:[BF-4] < [PF-6] < [Tf2N-]。
  • 张莉1*刘昱显2
    南京大学学报(自然科学版). 2015, 51(4): 707-713.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    双语的术语抽取和对齐在跨语言检索、构建双语词典和机器翻译等研究领域有着重要的作用。提出一种基于语序位置特征信息的汉英术语对自动对齐算法。该算法对双语术语抽取两步走策略中的术语对齐部分进行了改进,将基于短语的机器翻译中的语序位置特征融合进术语对齐算法中,通过对基准方法的对比,新方法显著提高了术语对齐的精确率,特别在术语翻译概率较低时提高更为明显,同时又避免了基于短语的机器翻译中计算效率低的缺陷。
  • 魏巍1,2*魏琪1王锋1,2
    南京大学学报(自然科学版). 2015, 51(4): 714-722.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    不确定性度量是粗糙集理论中的重要研究内容之一,它可以度量属性之间的依赖度和相似度,并为属性约简和聚类分析提供了有效的度量工具. 然而,不同的不确定性度量对于属性依赖度和相似度的刻画能力并不相同,这将会很大程度上影响属性约简和聚类分析等算法的结果对常见的属性依赖度度量近似分类精度、近似分类质量、Shannon条件熵、互补条件熵和常见的属性相似性Shannon互信息、互补条件熵在不确定性度的差异进行了深入分析,发现了这些度量之间的差异,为属性约简和聚类分析等算法中不确定度量的选择提供了理论依据
  • 胡学钢*,许尧,李培培,张玉红
    南京大学学报(自然科学版). 2015, 51(4): 723-730.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    多标签数据的过滤式特征选择依靠特征评价对特征选择,快速有效得到候选特征。但现有算法多将标签集合简单化,将其视作独立标签加以研究,忽视了多标签集合内部相互关系。近年来,由于MRMR算法在单标签数据领域方面简单、快速、高效的特征选择能力,成为过滤式特征选择算法的流行算法之一。提出一种基于MRMR(Max-Relevance Min-Redundancy)过滤式多标签特征选择算法(ML-MRMR),直接通过对特征进行权重计算,得到特征与多标签集合的相互关系,以获得更好的候选特征子集。同时,算法的特征评价过程中不仅考虑了特征间以及特征与多标签的相互影响,更考虑到多标签内部可能存在的相互关系,将标签相关性加入特征评价当中,提出了可适应多标签数据的度量标准。最后,在真实多标签数据集上的实验结果表明:所提算法能够对数据大幅降维并稳定有效地提高降维后数据的分类效果。
  • 陈梅雯1钟一文1王李进1,2
    南京大学学报(自然科学版). 2015, 51(4): 731-740.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    蝙蝠算法是一种模拟蝙蝠回声定位行为的新型启发式智能搜索算法,其随机游走于最佳解附近的局部搜索导致算法的搜索效率低且易陷入局部极小值。针对此不足,提出一种正交交叉和指数交叉相互协作的局部搜索策略。正交交叉操作是在父个体空间内基于正交设计的一种有系统的精细化搜索,能有效的避免随机游走的盲目性,指数交叉用于弥补正交交叉受限于父个体空间的不足,使种群保持足够的多样性,正交交叉和指数交叉相互协作使蝙蝠算法能有效地平衡搜索的集中性和多样性。实验结果表明改进的算法能够有效地提高蝙蝠算法的搜索能力,在求解多维函数优化问题上是具有竞争力的。
  • 周治平,张道文*,王杰锋,孙子文
    南京大学学报(自然科学版). 2015, 51(4): 741-748.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    近邻传播算法是一种快速有效的聚类方法。针对近邻传播算法在无先验知识条件下偏向参数选择的问题,使用Silhouette聚类有效性指标确定偏向参数。针对近邻传播算法在处理结构复杂或高维数据时,存在数据信息重叠的问题,提出将局部保持投影方法与近邻传播算法相结合的方法,在有效保留数据内部非线性结构的前提下,有效删除数据空间中的冗余信息。仿真结果验证了提出的算法优于传统的近邻传播算法。
  • 徐广斌,刘惊雷*
    南京大学学报(自然科学版). 2015, 51(4): 749-761.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    形成有效的联盟是多Agent系统研究中的关键问题。为了有效地完成个体的或共同的目标,Agent集合划分成相互独立的团体,即联盟的形成。联盟结构生成(coalition structure generation,CSG)问题研究的是Agent集合划分成联盟,从而使得收益最大化。传统的算法利用不同的方法来解决这个问题,但都没有对联盟个数进行约束。利用动态规划(dynamic programming,DP)原理设计了新的算法——联盟约束动态规划(coalition constrain dynamic programming,CCDP)算法,并通过该算法生成最优(福利最大化)联盟结构。随后证明了算法的时间复杂度为O(3n)。最后通过实验,分析并验证了Agent个数对算法性能的影响,以及联盟个数约束值的大小对算法性能的影响。实验结果证明在Agent集合的个数较大的情况下,在联盟结构搜索图中越靠近中间部分,即联盟个数约束条件的取值越靠近中间部分,算法的效果越好。

  • 刘燕丽*,黄 飞,张 婷

    南京大学学报(自然科学版). 2015, 51(4): 762-771.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    最大可满足性问题(MaxSAT)是可满足性问题的优化求解问题,是经典的NP难问题。基于分支限界的MaxSAT完备算法采用推理规则、失败文字检测等方法缩短算法计算时间。推理规则产生的新子句可以构成更多的冲突集,从而有效地提高了二叉树的剪枝率和算法性能。在已有的工作基础上,针对环型结构冲突集进行分析,找到与步长大于2的环型结构冲突集等价的新子句集,并利用整数规划证明了新子句集和冲突集的MaxSAT等价性。该环型扩展推理规则产生的新3元子句亦可以提高冲突集数,提高下界。在Maxsatz2013算法的基础上实现了新算法。测试了MaxSAT竞赛4个类别算例集。实验结果表明环型扩展推理规则对子句长度大于等于3的MaxSAT问题,可以提高二叉树分支点的下界值,最终有效地缩减算例运算时间。
  • 曹江中1*,陈 佩2,戴青云3,凌永权1
    南京大学学报(自然科学版). 2015, 51(4): 772-780.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    谱聚类是一种基于图谱理论的聚类方法 由样本数据构成的相似图是谱聚类的基础,也是影响谱聚类性能的一个重要因素提出一种基于Markov随机游走模型的稀疏相似图构造方法 提出的方法在常规的k最近邻图上定义一个Markov随机游走点,利用游走点的高阶转移概率来选择近邻点 由于高阶转移概率反映的是数据间多层复杂的关联程度,因此通过高阶转移概率确定的近邻数据更可靠 在人工仿真和实际数据集上的对比实验表明,提出的方法较常规的近邻图能更好地反映存在数据中的结构,提高谱聚类的效果
  • 辛冠琳,刘惊雷*
    南京大学学报(自然科学版). 2015, 51(4): 781-795.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    偏好处理是人工智能中的一个重要研究内容。CP-nets(conditional preference networks,条件偏好网)是一个带标记的有向图,它编码相关变量之间的偏好关系。作为一种简单直观的图形偏好表示工具,却很少有工作对CP-nets的结构进行研究。研究CP-nets的结构,提出了基于G方检验对CP-nets进行结构学习的算法,并给出算法的时间复杂度为O (n·2n).作为一种对数似然比检验方法,G方检验特别适合于判断变量之间的因果关系。由于CP-nets的核心概念是条件偏好无关,因此利用G方检验可有效地实现CP-nets的结构学习。通过构造G方检验的统计量,在给定的成对比较样本集中,执行零假设检验,从而依次求出每个顶点的父亲集,进而得到CP-nets的结构。最后,通过随机生成的模拟数据,验证了所提出算法的有效性。与相关CP-nets的学习算法对比,本文提出的方法具有被动的,离线的,和基于统计学习的特征。
  • 刘 炜*,丁 宁,张雨嘉,谭 悦,刘宗田
    南京大学学报(自然科学版). 2015, 51(4): 796-809.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    文本事件的表示一直缺乏针对事件要素的有效表示和推理方法,采用传统描述逻辑对基于事件的知识进行形式化表示存在表达能力不足的问题。提出一种新的事件本体结构模型,在此基础上对描述逻辑的子语言SROIQ进行扩展,同时提出事件要素投影理论实现对事件本体的形式化。该方法利用SROIQ丰富的表达能力,将动态的事件转换为静态的复杂概念,既统一了事件与事件状态的表示方法,也建立起了事件之间、事件要素之间的语义关系。基于SROIQ的事件要素投影方法能够有效表示各领域的事件类、事件实例与事件要素,提取事件、事件关系在事件要素上的普遍规律,有助于领域事件本体的构建和形式化,以及针对事件要素的推理。
  • 孙金亮,姚 睿*,周 勇,陈 岱
    南京大学学报(自然科学版). 2015, 51(4): 810-817.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    视频融合变换模型的设计是视频融合的关键技术,传统的视频融合变换模型使用单一的投影变换矩阵,投影变换在视频融合过程中通常会引起视频帧图像的变形,尤其是对于存在较大视差的视频帧图像,变形会更加严重。针对此问题,提出一种形状与内容保护的多摄像机视频融合变换模型,该模型通过拼接缝查找算法得到接缝均值,使用接缝均值将图像划分为两个半空间,在左半空间进行投影变换,右半空间使用相似变换代替投影变换,投影变换与相似变换的结合保护了视频帧图像在变形过程中不会发生较大的拉伸与缩放;同时在拼接缝邻域应用内容保护变形算法,更好地保证了过渡区域的融合精度。把新的视频融合变换模型应用于实际拍摄的视频数据上,实验结果表明该方法具有较高的鲁棒性与较强的实用性。

  • 翁世洲1,吕跃进2,
    南京大学学报(自然科学版). 2015, 51(4): 818-825.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有文献对区间粗糙数的数据分布形式处理欠缺以及排序方法存在不足的问题,首先结合实际对区间数的分布情况进行了更为切合实际的假设,提出了一种带参数的新型区间粗糙数在此基础上研究了区间粗糙数的相关数学性质,并给出了区间粗糙数的期望、方差等度量指标,决策者可依据期望方差对区间粗糙数进行排序和比较。然后对区间数的两两比较问题提出了基于随机变量分布的可能度面积法计算公式,并结合优势关系给出了基于区间粗糙数的多属性决策方法。最后通过实例验证了排序方法的可行性与有效性。
  • 胡亚慧,2,李石君1余伟1杨莎1方其庆2
    南京大学学报(自然科学版). 2015, 51(4): 826-833.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大数据环境下,对用户进行兴趣推荐时常遇到高维数据难于处理、运行速度慢以及数据稀疏等问题,引进一种新的模型因子分解机FM。同时考虑到位置服务研究中,结合用户的文化影响提出一种新的方法CFM。由于用户的兴趣具有区域特性,即不同城市、区域或国家的用户对同一事物的兴趣受所属区域的文化特性影响反映出的喜好程度差距较大,在分析出用户的文化特性基础上,结合用户的个人属性,应用因子分解机FM进行用户评分预测。FM不仅具有良好的通用性和高效率性,而且能够很好解决大数据的稀疏问题,提出的CFM方法能够在线性时间中处理数据,有效的解决数据稀疏问题并提高运行效率。在大量真实数据集上的实验结果表明:该方法预测的准确率较传统方法均有显著提高。
  • 林耀进*张佳,林梦雷,李进金
    南京大学学报(自然科学版). 2015, 51(4): 834-841.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    药物重定位是指发现已上市或批准药物的新用途, 受到了广泛的关注 . 为此, 提出一种基于协同过滤的药物重定位算法 . 首先, 收集药物及疾病的描述信息以构建药物―疾病关联矩阵 . 其次, 根据药物对疾病有适应症和有副作用的相关信息, 设计了一种刻画药物之间趋同程度的度量方法, 该方法同时考虑了不同药物在适应症和副
    作用上的相似度 . 然后, 搜寻目标药物的近邻以预测药物对疾病的评分 . 最后, 采用平均绝对偏差和覆盖率二项评价指标衡量系统的预测质量 . 另外, 针对某种特定疾病, 利用新的协同过滤模型预测药物在该疾病上的未评分项, 根据预测的评分信息发现对该疾病有治疗作用的药物 . 实验结果表明, 该算法不仅能提高系统的预测质量, 而且能够发现有治疗作用的药物―疾病组合, 验证了所提算法能有效地应用于药物重定位 .
  • 杨静1 王瑞波2李济洪2*
    南京大学学报(自然科学版). 2015, 51(4): 842-849.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在统计机器学习中, 交叉验证方法利用对一个数据集的多次切分, 来构造多次重复实验, 并以此估计机器学习模型的预测误差 . 然而交叉验证估计的稳定性与数据集的切分方式有着密切的关系 . 也就是说, 不同的切分方式会导致训练集中所含共同样本的个数不同, 当共同样本较多时, 交叉验证估计具有较大的方差 . 为此构造了一种均衡的 RH S ( R e p e a t e dH a l f - s a m p l i n g ) 交叉验证, 使得训练集所含共同样本的个数的总和最小, 并且任意两个切分之间的共同样本个数保持均衡, 进而降低泛化误差估计的方差, 进而有效地提高泛化误差估计的稳定性 . 从理论上证明了 6 次均衡的 RH S 交叉验证估计的方差小于组块 3×2 交叉验证, 并且进一步通过模拟实验验证这一结论 . 同时, 从实验结果可以说明 6 次均衡的 RH S 交叉验证估计的方差小于随机 RH S 交叉验证估计的方差 . 进一步, 在真实数据集上大量的实验验证了这些结论 .
  • 张杰峰,郑宇军*
    南京大学学报(自然科学版). 2015, 51(4): 850-857.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    水波优化(water wave optimization, WWO)算法是一种基于浅水波理论的新兴智能优化算法,在大量基准问题上表现出了极为优越的性能。提出该算法的一个改进版本,将原算法中的固定种群规模改为线性递减的种群规模,从而在搜索的早期更好地支持全局探索,而在搜索的后期更多地进行局部开发。通过在CEC 2014测试集30个函数优化问题上的实验比较,改进后的算法在12个问题上显著优于原WWO算法,在4个问题上劣于原算法,在14个问题上无显著性差异。此结果表明提出的种群可变策略能够提高WWO算法的综合性能。
  • 张燕平1,2张顺1,2钱付兰1,2严远亭1,2
    南京大学学报(自然科学版). 2015, 51(4): 858-865.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    传统的协同过滤推荐系统认为用户之间的行为相互独立,忽视了用户之间的影响关系。而用户的历史行为数据不同、社交网络关系不同,其相互之间存在的影响力不同。为了分析用户的社交影响力在推荐中所起到的作用,通过历史行为数据和社交网络结构分析用户的局部影响力和全局影响力,分别提出基于局部影响力和基于全局影响力的模型以及两种影响力综合的模型。通过在真实的数据集上的实验表明,与以往方法相比,本文提出的基于影响力的三种模型在推荐精度上有一定提升,且在稀疏的数据集上基于全局影响力的模型和综合模型提升效果比更明显。
  • 周 啸1,史瑞芝1*,李少梅1,巩现勇1, 2,管凌霄1
    南京大学学报(自然科学版). 2015, 51(4): 866-879.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数字半色调又称数字加网,它实现了连续调图像到半色调图像的转变。频率调制(FM)半色调是数字半色调技术中继幅度调制半色调之后出现的另一种技术。调频网点数量大且尺寸微小难以控制,网点容易丢失导致图像阶调损失。同时,远超过调幅加网的网点总周长直接造成网点的严重扩大变形,致使数字图像还原存在较大色偏。为有效控制网点扩大,真实再现数字原稿图像,提出了一种高阶网点集聚型重心定位频率调制半色调算法。首先对重心定位进行建模分析,确定用于随机数选取的发生器,并建立组合随机数组筛选模型以选取网点重心。根据网点重心和灰度级分配方案,具体构建了生成高阶网点集聚的算法模型。针对存在的问题,确定了重心取舍和压盖关系处理模型,最后通过实验对算法做出评价。实验表明,该算法能够生成高阶网点集聚的半色调图像,在网点统计数据等多项指标上均优于传统算法,能够有效控制网点周长和扩大,真实再现原稿图像。
  • 周 涛1,2,陆惠玲1*,张艳宁2,马 苗2,3
    南京大学学报(自然科学版). 2015, 51(4): 880-893.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    遗传算法是求解粗糙集最小约简这个NP-hard问题的一种有效方法,适应度函数的构造是其中的关键问题。针对这个问题,提出一个基于粗糙集的高维特征选择混合遗传算法(HGA-RS),算法从粗糙集的代数和信息熵两个角度出发,综合考虑约简集中属性的数目、染色体编码、基因取值、属性重要度、属性依赖度、属性相关度等因素,提出一个通用的适应度函数混合构造框架,通过调节各个因素的权重系数来实现不同适应度函数。最后通过提取MRI前列腺肿瘤ROI的102维特征构建前列腺肿瘤患者的决策信息表,通过4组实验对高维特征进行选择,并用神经网络对约简后的样本集进行识别来验证不同参数对识别精度的影响程度,实验结果表明算法是有效的,但是不同参数对结果影响较大,针对不同的问题,应该采用合适的参数组合,以得到较好的识别精度。
  • 苏美红1,2,张 海2*,张凌洁3
    南京大学学报(自然科学版). 2015, 51(4): 894-900.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    高维、海量数据分析是机器学习以及统计学研究热点,而数据之间的高相关性以及噪声的重尾分布是经典机器学习算法失效的主要原因。基于此,提出了LAD-Elastic Net模型,并进一步研究了其模型选择一致性的问题。该模型所选用的损失函数为绝对值损失,相比于平方损失函数,其受噪声影响比较小,具有稳健性。所选用的罚函数为罚和罚的组合,从而可以很好地解决变量之间相关性问题。首先简要回顾了模型选择方向的研究进展;其次,给出了所要研究的LAD-Elastic Net模型;最后通过近似逼近的方法,将绝对值损失用平方函数来近似逼近,进一步从理论上证明了其模型选择一致性。结果表明,不可表示条件EIC起到了关键的作用,在其成立的前提下,LAD-Elastic Net所选出的模型是一致的。
  • 李 钝,薛昊原,李 伦,郑志蕴*
    南京大学学报(自然科学版). 2015, 51(4): 901-908.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    实体链接的任务是将自由文本中的名称链接到知识库中的一个相关实体,可以解决一词多义的问题,帮助用户快速理解文中名称的意义。目前已有很多实体链接的相关研究,以往效率很高的方法使用相对简单的上下文特征,避免了复杂的计算,导致准确率偏低;准确率高的方法由于使用了较多的上下文特征效率很低,并且以往研究集中在对人名地名等名称进行链接。针对教学资源中的知识概念实体领域性强、专业性强等特点,提出基于标注―实体图的两阶段实体链接方法TSELG:第一阶段,采用传统算法链接相对明确的名称,并根据已经链接的实体确定文章所属领域;第二阶段,对相对不易链接的词进一步根据知识领域进行链接。实验表明,该方法与经典算法比较,能够取得了较高的标注准确率及效率。