2012年, 第48卷, 第4期 
刊出日期:
  

  • 全选
    |
  •  黄兵**
    南京大学学报(自然科学版). 2012, 48(4): 367-375.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     针对信息系统安全审计风险判断知识获取的困难,考虑条件属性取值为优势区间直觉模糊数、分类结果精确的优势规则获取问题.引入一种区间直觉模糊数的大小排序方式,构建区间直觉模糊条件属性取值确定的对象邻域;通过比较对象邻域与决策类的关系建立决策类及对象的上卜近似;根据对象的上卜近似和分类结果确定对象间的区分关系,利用分辨矩阵给出知识约简和规则提取算法最后将优势区间直觉模糊粗糙模型应用于信息系统审计风险判断,得到合理的审计风险判断规则.
  •  陈林,邓大勇**,闰电勋
    南京大学学报(自然科学版). 2012, 48(4): 376-382.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     针对约简长度和时间效率两方面问题,提出了一种基于属性重要度并行约简的优化算法.该算法通过对每个子表赋权值,并在所建立的属性重要度矩阵中选择权值之和最大的列所对应的属性作为约简属性,所得到的约简即为并行约简.最后,通过UCI机器学习数据库中的几个实例验证了改进后算法的正确性和有效性.
  •  郭剑毅1.2**,李真1·2,余正涛1·2,张志坤1.2
    南京大学学报(自然科学版). 2012, 48(4): 383-389.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     研究了如何使用协作分类器(协作使用条件随机场(LRFs)和支持向量机(SVM) )解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82. 7%及F值达到为83. 6%,相比于词语共现F值提高了20个百分点.

  •  赵成兵,李天瑞**,王仲刚,高子喆
    南京大学学报(自然科学版). 2012, 48(4): 390-396.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     从高铁数据中分析得到高速列车的运行状况对保障高铁安全至关重要.列车的振动数据就是其中之一,这些振动数据是通过多个传感器以一定的采样频率得来的.一个1 - 2d的测试实验将得到GB以上的数据,因此振动数据分析之前的预处理过程必不可少,包括异常点处理、消除线性趋势项等.异常点处理是指先用通用规则发现异常点,并用其邻近的数据点来恢复它的值.线性趋势项是指测试设备的原因使得采集的数据有一个线性的偏移,不处理偏移,则误差将会进一步累积.传统的振动数据预处理方法是顺序逐个处理文件,处理时间长,不能满足要求,且受内存的限制不能处理大文件.木文旨在提高振动数据的预处理效率,在研究现有高铁振动数据预处理方法和MapReduce机制的基础上,实现了包括异常点处理,线性趋势项消除方法的并行化,并在Hadoop平台上实现.同时设计了实验来验证方法的有效性和并行结果的一致性.实验在含6个节点((1个Master,5个Slaws)的集群上进行,实验结果表明所提出的方法可以处理大数据文件而且提高了处理效率.而且三个并行计算性能评价指标Speedup,Scaleup,Sizeup,的实验结果也显示出木方法的优越性.


  •  张继1·2,王洪元1.2**
    南京大学学报(自然科学版). 2012, 48(4): 397-404.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     在视频跟踪任务中,以上一帧跟踪到的目标位置为基础,在当前帧内相应位置周围生成若干候选区域样木进行分类,并从中获取待跟踪目标在当前帧中的位置和更新分类器,这是基于判别式方法的基木跟踪流程.对于每帧产生的大量未标记类别的候选区域样木,现有的基于子空间学习的跟踪方法大多忽略了这些样木内在的几何结构,而是直接向子空间投影,并在子空间内进行二分类,区分出其中的正类样木(前景)和负类样木(背景).在半监督判别分析方法的基础上,提出一种基于增量半监督判别分析的跟踪方法框架.首先,使用区域协方差特征描述子提取图像中不同区域的大量图像特征;然后,为保持这些特征间的几何结构,将它们映射至欧氏空间内进行处理;再将原始半监督判别分析方法扩展到增量形式,给出类内散度矩阵、类间散度矩阵和正则项的增量更新方法,并由此给出目标跟踪的流程框
    架;通过实验显示,该方法对于目标跟踪问题具有良好的实时性和鲁棒性.
  •  常瑜1.2** ,梁吉业1, 2,高嘉伟1,2,杨静1·2
    南京大学学报(自然科学版). 2012, 48(4): 405-411.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     半监督聚类研究如何利用少量的监督信息来提高聚类性能,目前己经成为机器学习领域的一个研究热点.现有的大多数半监督聚类方法没有综合考虑Seeds 集和成对约束这两种监督信息,因而提出了一种基于Seeds 集和成对约束的半监督聚类算法.该算法运用丁tri-training算法扩充Seeds 集,结合成对约束优化Seeds 集并指导聚类过程.实验结果表明,该算法能够有效提高聚类性能.
  •  姚宏亮**,袁正,王浩
    南京大学学报(自然科学版). 2012, 48(4): 412-420.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     贝叶斯网络的灵敏性分析是研究模型局部参数或证据微小变化对于目标结点所产生的影响,以发现复杂系统的重要参数和结构.然而对于动态贝叶斯网络,当前还没有一种有效的灵敏性分析算法.针对隐马尔科夫模型(HMM)灵敏性分方法不能用于分析动态贝叶斯网络灵敏性和灵敏性分析计算复杂性高的问题,提出一种可有效处理动态贝叶斯网络灵敏性分析算法(SA FF). SA FF算法利用FF近似推理算法(Factored Frontier)思想求解动态贝叶斯网络的灵敏性函数,通过对马尔可夫毯所构
    成边界(Frontier)的动态推理建立参数与目标结点条件概率分布之间的函数关系;SAjF算法在灵敏性函数推理计算过程中,通过对局部性边界的边缘化进行信息传播,不需要对模型的联合概率分布进行更新,显著提高了计算的效率,且可用于多参数灵敏性分析,但会引入一定的误差;进而,通过误差分析证明所引入的误差是有界的.最后,通过实例计算的比较和分析显示SA FF算法的有效性.
  •  李文生1**,解梅1,2,邓春健1
    南京大学学报(自然科学版). 2012, 48(4): 421-428.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     针对动态手势识别中传统神经网络训练算法存在收敛速度慢、网络精度低等缺陷,提出一种自适应MIMO-Chebyshev神经网络(MIMO-CNN)算法实现动态手势学习和识别.以Chebyshev正交多项式作为隐含层神经元激励函数构造多输入、多输出三层前馈神经网络,并给出权值直接确定方法和隐含层节点数目自适应确定算法.给出一个基于颜色直方图的指尖检测算法和基于二部图最优匹配的指尖跟踪算法以便实时获取动态手势轨迹.针对动态手势识别要求对MIMO- CNN进行输入输出结构设计和网络权值学习训练,并运用经过训练的MIMO-CNN识别动态手势.测试结果表明:MIMO-CNN能够提高网络训练速度和精度,从而提高动态手势学习速度和识别准确率,而且在动态手势识别方面具有较好的鲁棒性和泛化能力.
  •  江效尧,黄兵**
    南京大学学报(自然科学版). 2012, 48(4): 429-435.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     在群决策理论及应用中,如何获取合理而有效的群决策规则是一个重要的研究内容.针对条件属性具有优劣关系,决策属性取值为模糊值的群决策系统,将每个决策对象的群决策模糊值转化为一个决策区间,由每个对象的不可分辩优势类构建基于优势关系的模糊区间目标信息系统粗糙集模型,给出该模型的三种知识约简定义;通过构造区分矩阵和区分函数,获得求取优势模糊区间决策系统的优势卜近似的约简算法.最后将该模型及算法应用于商业银行审计风险评估,获得较为合理的商业银行风险群决策评估规则.
  •  王丽娟 1.2**,杨习贝1.2,杨静宇1,吴陈2
    南京大学学报(自然科学版). 2012, 48(4): 436-444.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     首先将悲观多粒度的概念引入不完备粗糙集,给出了容差关系下不完备悲观多粒度粗糙集模型.其次,针对缺席型未知属性值,将非对称相似关系引入多粒度空间,提出了一种新的不完备多粒度粗糙集模型.该模型包括非对称相似关系下的乐观多粒度和悲观多粒度这一对不完备多粒度粗糙集模型. 随后分析了这对新模型的具体性质,并将其与基于容差关系的不完备多粒度粗糙集进行了对比分析,发现使用基于非对称相似关系的不完备多粒度粗糙集,可以获得更高的近似精度.
  •  马丽1,2**李仲玲1,米据生1
    南京大学学报(自然科学版). 2012, 48(4): 445-451.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     概念格是数据分析和知识发现的一种有效的形式化工具.利用一种相似度,引入两种新的Galois联络并讨论了它们的性质,在此基础上研究了由特定Galois联络诱导产生的概念格的有关基木性质.给出一种特定约简的定义和协调集的两个判定定理,将概念格的己有相关结果做了推广.

  •  封筠1**,梁晓霞1,穆志纯2

    南京大学学报(自然科学版). 2012, 48(4): 452-458.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     人耳特征体具有普遍性、唯一性、稳定性和可采集性等作为生物特征识别必备的基木特性,易实现非打扰式识别.研究一类新型的基于梯度方向直方图的人耳身份识别方法,将人耳图像划分为不同子区域,分别提取各子区域梯度方向直方图特征,采用模糊隶属度匹配融合策略获取识别结果.重点讨
    论了局部遮挡时基于梯度方向直方图特征描述的人耳识别问题,定义并分析了人耳子区域识别贡献率,探讨累计遮挡问题,可为人耳图像有效鉴别子区域的确定提供参考.实验结果表明,基于梯度方向直方图的人耳身份识别方法是可行的与有效的.
  •  曹连连,陈松灿**
    南京大学学报(自然科学版). 2012, 48(4): 459-465.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     传统的Laplacian分类器通过Parzen窗估计概率密度函数,而后基于Cauchy-Schwarz散度(Cauchy-Schwarz Divergence,CSD)定义分类准则进行分类,主要强调了小概率类别,致使对较高概率的类的分类效果较一般.针对此,提出了一个改进方法.关键是对小样木类用加权代替无权的Parzen窗概率密度估计,并用CSD作为代价函数优化相应的权值,而后依据Laplacian分类准则设计出加权Laplacian分类器( Weighted Laplacian Classifier, WLC).在所用测试数据集,尤其是不平衡数据集上的
    实验表明,WLC的结果明显优于Lapalcian分类器.
  •  程显毅1**,朱倩2
    南京大学学报(自然科学版). 2012, 48(4): 466-474.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     设计未定义类型关系抽取系统是目前研究的热点.但在没有特定领域的、机器可读的知识作为指导的情况下,面向自然语言文木的关系抽取很难取得令人满意的精确度和召回率,约束可以有效辅助语义关系的抽取.木文描述了一个提取“实体一属性一值”关系的半监督的机器学习框架,在半监督学习任务中,种子主要从维基百科的信息表格中获取,首先用线性分类器找出一些强反例,然后迭代的使用己有的反例数据重新训练分类器再应用到余下的未标注数据上找出更多反例.经过半监督学习得到了一个关系候选实例集,接下来讨论了关系类别验证问题,对于噪声模式,给出关系模式置信度评价指标,对于冲突模式提出了控制匹配顺序(高置信度模式优先匹配的原则)算法.经过这两个算法后,关系类别的描述仍具一定的多样性,提出凝聚型层次聚类算法,该算法将维基百科描述的结构特征表示为向
    量{nw, cw, Iw, Bw),进而给出两个关系模式相关度计算模式,完成关系类别聚类.最后,在Wikipedia XMI.数据集进行了相关的实验,结果表明:根据维基百科的结构特征,动态的确定关系类别,减少了对预定义类型的依赖,提高了关系识别系统的可移植性.
  •  谢志鹏1.2**
    南京大学学报(自然科学版). 2012, 48(4): 475-481.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     压缩感知包括压缩采样与稀疏重构.压缩采样突破了传统的香农采样定理限制,降低了采集数据量,是新兴的信号采集方法.稀疏重构算法是恢复原始高维信号的关键步骤,己成为信号处理及相关领域的研究热点.设计了一种稀疏重构算法FPSP3,该算法包含3个要素:不动点迭代,SPG2非单调线搜索及热启动技术.将非光滑Ll范数罚最小二乘的最优解表示为梯度算子与次微分算子和的零点,采用前向后向算子分裂法推导出最优解方程为包括前向梯度步与后向邻近步的不动点迭代,通过
    证明后向邻近步对应L1范数的邻近算子即软阂值收缩,从而将不动点迭代表示为梯度卜降与软阂值收缩.通过证明梯度算子逆是强单调的从而简化了收敛步长分析,给出了不动点迭代线性收敛于最优解的简要证明.采用SPG2非单调线搜索与热启动技术显著加快了算法实际运行速率,在稀疏重构实验中与某些著名的L1范数方法进行了比较,结果表明FPSP3具有运算速度与重构精度优势.

  •  李士进**,王万国,谢萍,万定生
    南京大学学报(自然科学版). 2012, 48(4): 482-490.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     传统的水平集C- V模型主要关注颜色特征,对纹理特征研究得较少,而在遥感图像分割过程中,纹理特征亦具有很重要的作用;并且对于不同类型的遥感目标,颜色信息和纹理信息在分割过程中所起作用亦不相同.提出一种自适应特征选择的水平集Chan- Vese模型(C-V模型),把多个颜色特征分量和纹理特征分量作为初始特征集,通过建立相似性函数的距离度量来自适应地选择特征.同时,根据不同图像特点自适应地调整不同特征分量的权重,最后把这些特征以及相应的权重融入到C-
    V模型中,进而对遥感图像进行分割.与以往的方法相比,木文方法不仅取得了较好的分割效果,而且所需时间消耗更少,效率更高.
  •  毕方明1**,王为奎2,陈龙1
    南京大学学报(自然科学版). 2012, 48(4): 491-498.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise, DBSCAN)的所需内存及l/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了改进.首先根据数据的空间分布特性,将整个数据空间划分为多个较小的分区,使分区的局部密度相对更均匀;然后将每个局部分区运用改进的DBSCAN算法进行聚类,改进的算法可以根据空间数据的分布,对一个中心点自适应的选取近邻,并对这些近邻点进行取样、扩展,有效提高了算法的准确性和效率;接着将所得到的聚类结果按照合并规则进行合并.最后通过仿真实验,验证了改进的DBSCAN算法解决了内存消耗过大、聚类质量差及全局参数敏感的问题.

  •  季薇1,李云2**
    南京大学学报(自然科学版). 2012, 48(4): 499-503.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    特征选择是机器学习和数据挖掘领域的关键问题之一,而特征选择的稳定性也是目前的一个研究热点.基于能量学习模型,分析了基于局部能量的特征选择方法并根据集成特征选择的原理,对基于局部能量的特征排序结果进行集成,以提高算法的稳定性.在现实数据集上的实验结果表明集成特征选择可以有效
    提高算法的稳定性.

  •  李晓翠**,孟凡荣,周勇
    南京大学学报(自然科学版). 2012, 48(4): 504-512.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     目前经典的聚类算法在内存空间有限的情况下,聚类受到时间、空间等各方面的限制,提出一种基于代表点的快速聚类算法FCBRP(fast clustering based representative points).首先,判定数据集中所有节点的属性,当节点的D临域内存在大于等于K个邻居节点时,将其定义为代表点,代表点T)临域
    内所有邻居节点与该代表点之间的平均欧氏距离即为该代表点的相关密度RT),所有的代表点组成代表点集合;将所有在代表点的D临域内的节点定义为能被代表的节点,并将其进行存储;既不是代表点、又不能被其它节点所代表的节点,将其定义为噪音节点;其次,对代表点集合进行聚类,对于给定的密度
    标准a,如果两个代表点满足密度相关,即两个代表点的相关密度分别乘以密度标准a后同时大于等于两者之间的欧氏距离,则将其划分到同一类簇中,通过对代表点的聚类,达到对数据的区域划分,得到所有类簇的基木形状;最后,对于被其它代表点所代表的节点,通过检测代表它们的代表点所属的类簇,判
    定被代表的节点所属的类簇,对于少数位于不同类簇中的代表点的D临域内的节点,将其划分到相对距离较近的代表点所属的类簇中.实验证明,FCYRP算法对空间需求较小,效率快,精度高,鲁棒性更佳.
  •  万夫敬,袁慧玲**,宋金杰,王元

    南京大学学报(自然科学版). 2012, 48(4): 513-525.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     南京地区地处东亚季风影响下的长江下游地区,又是梅雨锋暴雨的成灾区,以南京地区为例研究长江卜游地区的降水特征,具有重要的典型性和示范性.利用南京市2004-2006年5-9月T213 模式数值预报场资料和同期降水观测资料,使用模式输出统计(model output statistics,MOS)预报方法,借助逐步回归和logistic回归等统计工具,研究了南京地区的降水事件,并将logistic回归预报结果与事件概率回归(REEP)方法作了比较.结果表明,logistic回归方法在降水概率预报方面比事件概率回归有明显优势.为了改善降水预报效果,使用当地降水发生的频率作为新的阂值,称为优化阂值,将它作为判断概率预报有无降水的标准.同时,对入选降水方程的预报因子进行分析,提出了南京地区汛期降水的热动力概念模型.