2013年, 第49卷, 第5期 
刊出日期:
  

  • 全选
    |
  • 张燕平1,2,汪  洋1,2,赵  姝1,2, 段  震1,2**
    南京大学学报(自然科学版). 2013, 49(5): 539-545.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    社团结构是复杂网络普遍存在的拓扑特性之一,发现复杂网络中的社团结构是复杂网络研究的基础性问题,近年来受到广泛关注,涌现出一批新颖的算法,但时间复杂度和准确率仍然是大规模复杂网络社团结构分析算法面临的两个主要问题。提出一种新的基于覆盖的社团发现算法,该算法的时间复杂度低,得到的社团结构准确率高,并且有效避免了一些经典算法无法识别小于一定粒度社团的问题。首先,以每个节点为中心构造覆盖,并提取其中的一部分覆盖以达到一定的覆盖率;其次,对提取的覆盖进行合并处理;最后,对重复覆盖和未覆盖到的节点做邻居节点投票划分。算法的时间复杂度为 ,实验部分测试了算法的准确率,并同标签传播算法(Label Propagation Algorithm, LPA)和Newman快速算法(NFA)作了比较。测试结果显示了本文算法的有效性,在已知社团结构的Zachary数据集上得到与实际完全一致的结果,在未知结构数据集上的Q值也高出LPA算法。
  • 林姿琼,姚 华
    南京大学学报(自然科学版). 2013, 49(5): 546-552.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    对于划分的粒度,现在已经定义了很多公式。相对于同一个论域来说,这些定义所遵循的一个整体的原则显然是划分块数越少其粒度越大。对于同一论域的具有相同块数的两个不同划分,在某些情况下,其粒度也被认为是不同的,可称之为局部原则。现有的公式基本上都兼顾了这两个方面。讨论一个相对简单的公式,且主要研究的是局部原则对整体原则某种程度的破坏。首先定义划分的方差,给出划分的粒度公式与划分的方差之间的关系。然后给出一个界限,证明在相同论域上,当一个划分的块数大于另一个划分的块数超过这个界限时,这个划分的粒度一定大于另一个划分的粒度。
  • 李同军** ,王 霞,徐优红
    南京大学学报(自然科学版). 2013, 49(5): 553-560.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    形式概念分析是用于知识表示和知识发现的一个重要方法. 将布尔矩阵方法引入形式概念分析之中, 提出布尔形式背景的概念, 利用布尔向量和布尔矩阵的蕴含运算, 给出了布尔形式概念的定义, 研究了布尔形式概念的计算和性质. 同时, 针对布尔形式背景的与、或和乘积运算, 研究对应的布尔形式概念的计算问题
  • 苏礼润,林姿琼,祝峰
    南京大学学报(自然科学版). 2013, 49(5): 561-566.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    拟阵是一种图和矩阵的同时推广的概念,而覆盖粗糙集是经典粗糙集的推广。广义粗糙集与拟阵的结合已被广泛研究。通过结合拟阵中的基公理和覆盖中的友元,一方面,用友元构造出一个集族并且证明其满足拟阵的独立集公理,从而建立了一种覆盖的拟阵结构且介绍了一种拟阵即友元拟阵另一方面,在此结构下,讨论了拟阵的相关集极小圈秩函数闭包等表达形式,进一步还讨论了由不同覆盖能导出相同覆盖的条件以及由覆盖导出拟阵的闭包和覆盖上近似的关系。
  • 顾沈明,吴伟志,徐优红
    南京大学学报(自然科学版). 2013, 49(5): 567-573.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在许多场合下,由于不同标记尺度对数据有不同的分割,得到不同层次的信息粒度。首先介绍了不完备信息系统信息变换函数知识粒度的层次结构。在每一个层次中,利用相似关系定义相似类,进而定义多粒度粗糙集的下近似、上近似、边界、近似精度和粗糙度等概念。在不同层次之间,分别讨论了下近似、上近似、边界、近似精度和粗糙度的变化性质,在不同的标记粒度下探索的知识粒度的变化规律。
  • 刘盾1, 李天瑞2, 李华雄3
    南京大学学报(自然科学版). 2013, 49(5): 574-581.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    从三支决策的视角出发,系统地介绍了三支决策与粗糙集理论相融合的理论、方法和应用。考虑到粗糙集理论中的正域、负域和边界域可分别生成相应的接受、拒绝和延迟决策规则,三支决策赋予粗糙集新的语义解释。通过分析三支决策与概率粗糙集、决策粗糙集间的关系;三支决策与二支决策、多支决策的关系以及三支决策在扩展模型、属性约简和规则推导方法在信息工程管理医学等方面的应用,给出三支决策研究的现状。最后,指出了三支决策发展的未来方向。
  • 张 宁,邓大勇,裴明华
    南京大学学报(自然科学版). 2013, 49(5): 582-587.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    三支决策粗糙集模型进行决策时,往往将数据集中在一个信息表中,从整体角度分析客观事物并对其进行决策。然而在多人决策这种情况中,不同的人由于其自身知识不同会对同一事物做出不同的决策,这体现了局部性认识与决策过程。为了能从整体和局部认识事物并做出合理的最终决策,提出了基于-粗糙集的三支决策模型,并给出了一个疑难杂症的医疗诊断过程中具体应用该模型的例子。
  •  张艳桃, 王国胤, 于 洪
    南京大学学报(自然科学版). 2013, 49(5): 588-595.
    摘要 ( ) PDF全文 ( )   可视化   收藏
     在社会化标签系统Folksonomy中,标签不仅能描述资源的内容,而且能体现用户的兴趣偏好。通过标签来表征用户的兴趣,定义了标注行为一致程度、用户资源共享程度和好友间兴趣相似度概念。使用用户对资源的认知一致程度来建立用户兴趣模型。通过统计实验发现:Folksonomy系统内好友间兴趣相似度高,但用户资源共享程度却较低;因此,将好友间兴趣相似度引入用户间兴趣相似度的计算公式中。将新的用户间兴趣相似度计算方法使用于SCAN社区发现算法中,社区发现结果验证了用户间兴趣相似性度量方法是有效的。
  • 翟俊海1,2王婷婷1王熙照1,2
    南京大学学报(自然科学版). 2013, 49(5): 596-602.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在以前工作的基础上,提出了一种改进的样例约简支持向量机,利用相容粗糙集方法求属性约简的边界域,并从中选择样例作为候选支持向量训练支持向量机该方法的特点是可同时对属性和样例进行约简。实验结果证实了这种方法的有效性,能有效地减少存储空间和执行时间。
  • 潘世超1,王文剑1,2**,郭虎升1
    南京大学学报(自然科学版). 2013, 49(5): 603-610.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    增量支持向量机(Incremental Support Vector Machine, ISVM)模型通过每次加入一个或者一批样本进行学习,将大规模问题分解成一系列子问题,以提高支持向量机(Support Vector Machine, SVM)处理大规模数据的学习效率,但传统ISVM(Traditional ISVM, TISVM )模型中增量样本的选择方法不当可能降低其效率和泛化能力。针对ISVM中增量样本的选择问题,提出了一种基于概率密度分布的ISVM算法,称为PISVM,该方法通过概率密度分布选择含有较多重要分类信息(有可能成为支持向量)的增量样本进行训练,使得分类器能够以最快的速度收敛到最优。在标准数据集UCI上的实验结果表明PISVM模型可以在保持其泛化能力的同时进一步提高学习效率。
  • 俞亚君,霍静,史颖欢,高阳,张剡
    南京大学学报(自然科学版). 2013, 49(5): 611-618.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    学习分类系统作为一种自适应的机器学习技术,已经被成功地运用于解决多种学习问题。传统的学习分类系统的工作主要关注监督学习分类和无监督学习聚类环境下的研究,而学习分类系统在半监督学习环境下的效果不得而知。新的半监督学习分类系统(SSXCS),目的是研究学习分类系统是否能够在已知少量的已标记数据的情况下利用大量的未标记数据来提高学习性能。SSXCS先通过更新与进化得到对应的已标记规则集与无标记规则集,然后利用提出的规则标记算法对无标记规则集进行标记,约简规则后生成最终的分类系统。实验结果表明SSXCS能够有效地利用提供的无标记数据来提高分类器性能,同时相比较于一般的半监督学习算法,SSXCS能够取得更好或者相当的分类性能。
  • 贾洪杰1,2丁世飞1,2
    南京大学学报(自然科学版). 2013, 49(5): 619-627.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    谱聚类算法是近年来机器学习领域的研究热点,它基于代数图论,可以有效地解决很多实际问题。但是传统的谱聚类算法无法很好地处理高维数据,容易受到噪声和不相关属性的干扰。为了降低计算复杂度,同时减弱噪声数据和冗余属性对聚类的负面影响,提出了一种基于邻域粗糙集约减的谱聚类算法(NRSR-SC)。该算法将信息熵引入到邻域粗糙集中,在保持样本区分能力的前提下,去除冗余的属性,保留对聚类贡献最大的属性;然后基于约简后的属性集合,计算样本点之间的相似度,构造相似性矩阵和拉普拉斯矩阵;最后利用谱方法得到最终的聚类结果。实验表明,NRSR-SC算法在处理高维数据时,具有较强的抗干扰能力,其运行效率和准确率都有明显改善。
  • 许行1,梁吉业1,2,王宝丽1
    南京大学学报(自然科学版). 2013, 49(5): 628-636.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    决策树是一种智能进行实例分类的数据挖掘方法,已被广泛应用于机器学习、数据挖掘、智能控制等人工智能领域。单调决策树可以解决属性具有单调序关系的分类问题,近年来引起了国内外研究者的广泛关注。Hu提出了基于优势关系的有序信息熵的概念,并将其成功地运用于有序决策树的构造算法中,得到了较好的效果。在Hu的算法的基础上,利用双向的有序互信息生成不同的决策树,再集成其分类规则得到最后的决策结果,实验数据表明,相对于单向的有序分类树,此算法可以提高分类准确率,缩短分类规则的长度。
  • 包文颖1,胡清华2,王长忠1**
    南京大学学报(自然科学版). 2013, 49(5): 637-643.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    support vector machine based on multi-granulations, MG-SVM)。首先,利用多粒度理论对数据进行粒化与压缩;然后,对压缩后的数据利用支持向量机寻找最优超平面并进行分类;最后利用UCI中一些标准数据进行数据压缩与分类试验。与传统的支持向量机分类方法相比,MG-SVM算法在保持或提高经典支持向量机的分类和泛化能力的同时,有效地降低了时间复杂度。
  • 张宇1,王文剑1,2,郭虎升1
    南京大学学报(自然科学版). 2013, 49(5): 644-649.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    粒度支持向量机(Granular support vector machine, GSVM)通过选取粒的代表点构成精简训练集以提高支持向量机(Support vector machine, SVM)的学习效率,然而选取个别代表点有可能丢失部分重要分类信息,导致模型泛化能力不高。针对这一问题,提出基于粒分布的GSVM(Distribution based GSVM, DGSVM)加速训练方法,该方法依照粒内正负样本分布选取粒代表点,根据粒的混合度将这些代表点分为精简训练样本集和修正集,使用精简训练样本集训练得到分类器,用修正集迭代优化分类器。本质上DGSVM是用少量难分的样本训练快速得到初始分类器,然后再进行进一步调整。在标准数据集上的实验结果表明DGSVM方法可以在保证算法学习效率的同时提高分类器的泛化能力。
  • 张仕光1,2,米据生1,3**, 胡清华4
    南京大学学报(自然科学版). 2013, 49(5): 650-654.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在-支持向量回归和粗糙-支持向量回归模型的基础上,研究了新的粗糙-支持向量回归模型. 利用固定对称边界粗糙-不敏感损失函数,得到粗糙-不敏感管,构造固定对称边界粗糙-支持向量回归模型;利用固定非对称边界粗糙-不敏感损失函数,得到粗糙--不敏感管,构造固定非对称边界粗糙-支持向量回归模型
  • 刘 群1,顾 金1,张足生2
    南京大学学报(自然科学版). 2013, 49(5): 655-663.
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对现有车辆分类算法精度不高的问题,基于既有的车辆检测算法,提出一种基于决策树初次分类,K邻近算法细分的车辆分型算法,实验证明算法行之有效并取得了较好的分类效果。为了验证算法的可行性,还设计实现了停车管理系统PMS(Parking Management System),包括终端、路由、基站节点的硬件、软件,协议栈,网络的架构以及上位机的整套监控软件。对PMS运行数月得到的数据进行分类,分类准确率显著提高。