2012年, 第48卷, 第2期 
刊出日期:
  

  • 全选
    |
  •  郭昌辉1·2,刘贵全1.2**,张磊1·2
    南京大学学报(自然科学版). 2012, 48(2): 123-132.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     存储设备性能预测在存储系统的自动化管理以及规划任务中发挥重要的作用.传统的方法是利用分析模型、仿真模型来预测存储设备性能,但这类方法需要大量领域专家知识,也无法适应越来越
    高端、复杂的存储系统;利用机器学习的方法构建存储设备的预测模型不需要了解存储设备的内部结构和调度算法,但缺陷是预测精度不够高.木文提出一种基于回归树与K-近邻这两种具备潜在优劣互
    补特性的交互模型来预测存储设备性能,以获取更高的预测精度.通过实验表明,该混合模型较单一模型(回归树或KNN)有更好的稳定性和预测精度.此外,在工作负载特征化的设计上,考虑到一个非常重
    要的特征—缓存效应,该特征能够显著提高模型的预测精度.
  •  解晓敏1,李云2**
    南京大学学报(自然科学版). 2012, 48(2): 133-139.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     利用最小最大模块化网络实现模式分类的关键问题之一就是找到一种有效且复杂度较低的训练样木划分方法,以便缩短训练的时间,得到相对平衡的划分子集.木文提出一种新的基于二分K-均值的训练集划分方法,它可以得到全局最优解,时间复杂度较低,并且可以通过层次聚类得到相对平衡的样木划分效果.在现实数据集上的实验表明,该划分方法在不降低分类精确率的情况卜能有效地缩短最小最大模块化网络的训练时间.
  •  程波,张道强**
    南京大学学报(自然科学版). 2012, 48(2): 140-146.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     老年痴呆症(Alzheimer’s disease, AD)的临床变量值和多模态特征都是对其内在致病病理的外在反映.木文提出一种多模态相关向量回归机,通过对多模态特征的学习来预测临床变量值.首先采
    用核方法将多模态数据融合成一个混合核矩阵,然后使用相关向量回归机对临床变量简易精神状态检查(mini mental state examination, MMSE)和老年痴呆症评定量表(Alzheimer’ s disease assessment
    scale, ADAS-Cog)建立回归模型,最后用相关系数和平方根均方误差来验证算法的性能.在标准数据集ADNI上的实验结果表明,木文提出的多模态方法的预测性能优于单模态方法.
  •  蒋才智**,王浩,姚宏亮
    南京大学学报(自然科学版). 2012, 48(2): 147-153.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     木文在朴素贝叶斯分类器的基础上,融入了知网语义的元素,构建了一个统计与语义相结合的中文人名识别模型.其基木思想是,首先利用贝叶斯分类器对中国人名进行定位和粗略识别,然后使用知网语义做进一步修正.该模型在继承了贝叶斯算法公式简单和具有一定学习能力的基础上,避免了
    人名规则的大量使用,同时克服统计方法中人名边界难于界定的问题.实验结果表明,其准确率和召回率分别为95. 67%和97. 78%.
  •  刘娜1.2,肖智博1,鲁明羽1**
    南京大学学报(自然科学版). 2012, 48(2): 154-163.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     木文利用形态学的方法确定聚类数目,并对单词一文档谱聚类方法进行改进.确定聚类数目主要分三个步骤:第一步将单词一文档谱聚类方法中产生的矩阵转换成可视化聚类趋势分析方法(visual assessment of tendency, VAT)灰度图,第二步利用灰度形态学、图像二值化、距离转换等图像处理技术过滤产生的V A’I}灰度图,第三步对过滤后的V AT 灰度图建立信号图,并进行平滑处理,通过平滑后的信号图的波峰波谷数目确定文档集的聚类数目.实验表明,该方法能够提高单词一文档谱聚类方
    法的聚类效果.
  •  陈玉明**,吴克寿,孙金华
    南京大学学报(自然科学版). 2012, 48(2): 164-171.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     粗糙集理论是一种新的处理不精确、不完全与不一致数据的数学理论工具,决策表属性约简是粗糙集理论研究的核心内容之一针对决策表最小属性约简穷举算法时间复杂度较高问题,从改变决
    策表属性约简问题的知识表示入手,在决策表中引入树的表示方式,定义幂树表示约简问题空间,给出了旋转和回溯两种剪枝搜索方法.进一步针对决策表提出了基于幂树的最小属性约简完备性算法,该算
    法在幂树空间中进行穷举搜索,同时采用了旋转和回溯剪枝策略,提高了完备性算法的搜索效率,分析了算法的时间与空间复杂度,指出了完备性最小属性约简算法复杂度的指数级别特点.理论分析和实例
    表明该方法是有效可行的.
  •  郑瑞连1,钟宝江2.3**徐东升1
    南京大学学报(自然科学版). 2012, 48(2): 172-181.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     尺度空间技术由于能够很好地模拟人类的视觉机能,己经成为理解和分析图像的一种现代化工具.木文提出了一种基于I曲率的尺度空间形状分析技术.考虑了该技术在形状描述和角点检测中的
    应用,并具体地给出了一种检测角点的多尺度曲率积算法.I曲率的尺度空间图表明它的零点和极值点关于尺度参数是稳定的,具有较强的鲁棒性.新的角点检测算法能够增强形状特征点的信息,抑制噪声,
    可以得到良好的实验结果,且计算量较少.
  •  白龙飞1,王文剑2**,郭虎升1
    南京大学学报(自然科学版). 2012, 48(2): 182-189.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     木文提出一种新的支持向量机(support vector machine, SVM)主动学习策略,称为Dix- SVMactive.通过定义新的数据置信度度量来挑选最有价值样木进行人工标注,并在每次迭代中对训练集的平衡度进行调整,以获得更好的泛化能力.在UCI标准数据集上的测试结果表明,与基于随机选样的SVMactive和传统SVMactivce(Tong SVMactive)方法相比,木文算法不仅可以提高分类精度,而且能减少人工标注的工作量.
  •  郝水龙**,吴共庆,胡学钢
    南京大学学报(自然科学版). 2012, 48(2): 190-197.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     用户兴趣建模是个性化服务的基础与核心,而用户的兴趣会随着时间发生变化,这种用户兴趣漂移现象会导致系统预测用户兴趣的准确性卜降.提出一种基于层次向量空间模型(VSM)的用户兴
    趣模型表示及更新处理机制,基于特征项形成兴趣主题,基于兴趣主题形成用户兴趣,由此建立层次型用户兴趣模型.采用基于用户浏览行为来计算用户对网页的兴趣度,快速估计网页兴趣度,以提高个性
    化系统的实用性,从而更好地满足用户个性化需求.实验结果表明,设计的用户模型表示及更新机制能有效提高个性化服务性能,准确率及召回率均有所提高.
  •  李睿1**,王法松2,李宏伟3
    南京大学学报(自然科学版). 2012, 48(2): 198-205.
    摘要 ( )   可视化   收藏
     基于概率密度非参数估计的]’一义高斯密度(GGD)核估计和线性独立成分分析(ICA)神经网络,木文提出了一种新的非参数lCA算法,实现了对源信号分布的全自要求.该算法直接由观测信号样本出发,对分离信号评价函数直接估计,可以只用一种灵活评价函数分离任意的杂系混合信号,并且GGD核可以根据源信号的高阶统计性质自适应的改变以适应不同的要求,从而在一定程度上解决了ICA算法中选取估计信号评价函数的问题.模拟实验说明了所提算法的性能优越性.
  •  梁广民1**,王健2
    南京大学学报(自然科学版). 2012, 48(2): 206-213.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     不同于以往只考虑最短路径或只依靠转发行为评价信任或基于信誉推荐机制的传统路由算法,提出了一种兼顾通信可靠性和路径长度的主观信任路由模型.该模型借鉴人类信任关系建立模式,通过引入属性相似度概念将邻居选择、信任评估、数据转发等路由环节紧密相连,在陌生节点间建立信任关系,从而实现了一种兼顾通信可靠性和链路长度的可信路由协议.仿真结果表明,提出的信任路由模型较传统的动态源路由协议协议具有较高的抵抗恶意节点存在的能力,并研究了通信半径和移动速度等参数对模型效率的影响.
  •  丁轶,郭乔进,李宁**
    南京大学学报(自然科学版). 2012, 48(2): 214-220.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     图像目标检测的任务是通过对图像分块或者分区域提取特征,进行学习和分类,从而检测出目标在图像中的位置.基于潜在迪利克需分布模型,提出一种应用于目标检测的主题模型latent Dirichlet classification(LDC),结合图像连续值局部特征和共生关系来进行目标检测.LDC模型将latent Dirichlet allocation(LDA)生成的主题信息作为权重赋予样木,生成多份样木,然后利用多份样木训练多个分类器进行集成分类.实验结果表明利用LDC模型能有效提高检测精度.
  •  郭丽娜1**,杨杨2
    南京大学学报(自然科学版). 2012, 48(2): 221-227.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     不平衡数据的分类问题是机器学习研究领域的重要问题,有着广泛的应用,如软件模块缺陷检测.基于支持向量机的不平衡数据分类方法是主流的分类方法之一,受到研究者广泛的关注.木文在己有的基于模糊支持向量机的不平衡数据分类方法的基础上,结合抽样技术,提出了基于模糊支持向量机的不平衡数据分类算法和基于模糊支持向量机的不平衡数据分类集成算法.在NASA的两个软件模块缺陷度量数据集CMl和KC3上的实验结果表明了木文新提出算法的有效性.
  •  李力,江静**,周洋
    南京大学学报(自然科学版). 2012, 48(2): 228-235.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     利用中尺度大气数值模式(MM5)研究了全球气候变暖的背景下西北太平洋热带气旋活动的气候特征.设计了两组模拟试验,每组实验模拟44个热带气旋共88个个例,分别代表现在和未来情景下热带气旋活动.现在情景模拟,采用1971-2000年平均的美国国家环境预报中心(NCEP)的再分析资
    料作为初始场和侧边界场,表示现在的气候背景;未来情景的模拟则以联合国气候变化政府间专家委员会(IPCC)第四次评估中的美国国家海洋和大气管理局(NOAA)的地球物理流体动力学实验室(GFDL)CM2. 0模式模拟的A2情景下2031 -2060年数据作为初始场和侧边界场,表示未来全球变暖的背景.
    A2情景是指在2000-2100年这100年间,对大气中的二氧化碳分子浓度由现在的380 ppm增长至800ppm.结果表明,在全球变暖的背景下,热带气旋的强度明显较强,相比较现在的气候背景,在西部生成的热带气旋比东部更强些,而且未来的热带气旋的路径整体上比现在的热带气旋偏东.热带气旋活动与
    大尺度环流背景有密切联系,未来热带气旋在130?E以西增强,主要是由于该区域海表面温度的增高,而在试验区中南部5?附近热带气旋减弱可能与风切变以及相对湿度的变化有关,热带气旋路径的变化则与未来西太平洋副高强度偏强、脊线偏南有关.