本期目录
基于双支持向量机的偏二叉树多类分类算法*
谢娟英触,张兵权,汪万紫
提出一种基于双支持向量机的偏二叉树多类分类算法,偏二叉树双支持向量机多类分类算法.该算法综合了二叉树支持向量机和双支持向量机的优势,实现了在不降低分类性能的前提卜,大大 缩短训练时间.理论分析和UCl(Univcrsity of California lrvinc)机器学习数据库数据集上的实验结果共同证明,偏二叉树双支持向量机多类分类算法在训练时间上具有绝对的优势,尤其在处理稍大数据集的 多类分类问题时,这一优势尤为突出;实验仿真结果还证明,在采用非线性核时,该算法取得了比基于经典支持向量机的一对其余多类分类算法及二叉树支持向量机更好的分类效果;同时该算法还解决了后 两种算法可能存在的样木不平衡问题,以及基于经典支持向量机的一对其余多类分类算法可能存在的不可分区域问题.
2011, 47 (4): 354363
粒子群优化算法惯量权重控制方法的研究*
刘杨1 ,田学锋2 ,詹志辉1**
粒子群优化算法(PSO)是一类随机全局优化技术,算法简单、容易实现而功能强大,目前己成为国际进化计算界研究的热点.粒子群算法的性能受到参数惯量权重。的影响,大量研究表明,较小的 。具有较好的局部搜索能力,可提高求解精度;较大的。具有较好的全局搜索能力,在一定程度上可以避免陷入局部最优.很多研究者提出了多种动态调整惯量权重的方法.木文系统地介绍和分析比较了目 前动态调整惯量权重的通种典型方法,即线性递减惯量权重、随机惯量权重、凹函数递减惯量权重和凸函数递减惯量权重.为了调查这些控制方法对PSO性能的影响,木文在10个不同的单峰和多峰函数上 系统地对这通种方法进行了测试和比较,完整的实验结果比较分析对选择合适的参数控制方法以求解单峰函数和多峰函数具有一定的指导作用.
2011, 47 (4): 364371
一种基于半监督的大规模数据集聚类算法*
申 彦**,宋顺林,朱玉全
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用, 现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集 的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收 半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集 指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性.
2011, 47 (4): 372382
基于邻域粗糙集的不完整决策系统特征选择算法*
谢娟英**,李楠1,2 ,乔子茵1
针对不完整决策系统属性约简算法时间复杂度较高问题,基于正域不变条件卜,决策系统分类能力保持不变原则,提出不完整决策系统前向顺序特征选择算法.该算法从约简集为空集开始,根据 在约简集合中加入各属性后对正域影响程度大小将属性降序排列,采用顺序前向搜索,选择当前最佳特征加入特征约简集合,确定最佳特征子集.将该算法扩展到基于邻域粗糙集的实值和混合型不完整决策 系统,得到基于邻域粗糙集的不完整决策系统前向顺序特征选择算法.同时,将基于相容关系的不完整决策系统快速属性约简算法推]’一到实值和混合属性的不完整决策系统,得到适用于实值、混合属性的不 完整决策系统后向特征选择算法.理论分析和University of California lrvinc机器学习数据库数据集的实验共同表明,木文提出的基于邻域粗糙集的不完整决策系统前向特征选择算法有效降低了不完整决 策系统特征选择算法的时间复杂度,在保持系统识别能力的情况卜,用更少的时间得到决策系统的属性约简子集,即特征子集.然而,木文前向特征选择算法的缺陷是有可能因为无法选择到第一个最重要的 特征(属性)而使特征选择过程不能进行卜去,从而不能完成特征选择过程.
2011, 47 (4): 383390
基于粒计算的商业数据流概念漂移特征选择*
据春华,帅朝谦**,封毅
商业数据流具有动态性、漂移性等特性,概念漂移特征选择是数据流挖掘的重要工作之一 木文从数据流的特点和概念漂移特性出发,提出了数据流的概念形式化分析流程和基于粒计算构建数 据流的概念形式化描述模型;商业数据流的概念漂移实际上取决于其概念外延的变化,文中使用包括外延偶合度和内涵偶合度在内的概念偶合度来描述概念间的相似性;经过粒化的数据流由概念格来表 示,进而通过概念格对的松弛偶合度来分析数据流特征;结合概念偶合分析和数据流变化特征,阐述了一种基于数据流概念格对的松弛匹配偶合度算法,并据此分析概念格对来选择数据流的漂移特征. 通过实例验证、评价了特征选择,证明其有效性.
2011, 47 (4): 391397
海洋平台振动采集的超低频无线传感器设计*
周雷1 ,喻言2**, 李志瑞2 ,王洁3 ,孙贞1 ,欧进萍4
海洋平台结构体积庞大、构造复杂、造价昂贵,所处的服役环境恶劣,对海洋平台振动响应进行快速检测、分析、诊断和维护,己成为平台安全运营的必要措施和手段.木文结合无线传感器网络和数 据挖掘技术,进行了平台快速检测超低频无线传感器的设计:首先,分析了平台振动测试超低频、快速性的要求;其次,采用模块化方法,完成了超低频传感器机理分析、微处理系统、无线系统、电源管理系统的 设计,并集成为无线加速度传感器节点;最后,分析了节点软件功能,采用数据挖掘分类和预测方法来加以实现.所设计无线加速度传感器节点,具有超低频、高分辨率的特性,能够满足海洋平台结构振动响应 数据的精确和快速测量与诊断需求,具有很好的应用前景.
2011, 47 (4): 414419
基于自然梯度的独立子空间盲信号处理方法*
王法松1,2**, 张林让1
作为自信号处理的独立成分分析方法的扩展,独立子空间分析具有更广阔的应用前景.本文首先给出了独立子空间分析的一般定义和正则化定义,同时把其与独立成分分析方法进行了对比.此 外,讨论了独立子空间分析的可分离性与解的唯一性问题.基于极大似然估计和自然梯度方法,木文给七了独立子空间分析的自然梯度算法.仿真实验通过二维的独立子空间分析说明木文提出算法的有效性.
2011, 47 (4): 420425
基于统计回归模型的红外人脸温度归一化*
谢志华12 **,刘国栋1 ,伍世虔2 ,方志军2 ,卢宇2
为了减小环境温度对红外人脸图像的影响,木文提出了一种基于统计回归模型的红外人脸温度归一化方法.为了得到环境温度与红外人脸温谱图在对应像素点灰度之间的关系,将环境温度改变值 和对应人脸上的温度变化值作为研究对象,利用统计回归方法对这两个对象进行二次多项式拟合即可得到环境温度变化和对应的人脸上温度变化的函数关系.通过得到的函数关系,建立归一化模型对红外 图像进行温度归一化处理,减小环境温度对红外人脸识别的影响.实验结果表明:相对于归一化前的图像,温度归一化后的红外人脸图像与参考图像之间的信噪比有了明显改善,木文提出的归一化方法提高了红外人脸识别识别率.
2011, 47 (4): 426431
基于有限内存Broyden-Fletcher-Goldf arlrShanno 优化算法的图像非刚性配准方法*
丁辉,张兴敢**,唐岚
图像配准可以分为刚性配准和非刚性配准两类,图像非刚性配准是图像处理研究的热点和难点,其中的参数模型往往转化为无约束优化问题的求解,当参数数目较大时求解比较费时,提高此类算 法效率的关键之一是减少迭代算法中矩阵的计算量和存储量.木文研究了一种非刚性配准方法,该方法应用Basic样条自由变形模型,此模型改变控制点只影响其附近局部区域的形状,可以通过计算变形场 的偏移量来控制局部变形,隐含地强加了平滑约束,将此问题转化为求解无约束优化问题.同时应用有限内存Broyden-Fletcher-Goldfarb-Shann。优化方法求解代价函数的最优解,此优化方法避免了计算 Hcssian矩阵及其逆矩阵,而且不要求存储矩阵,降低了计算量和存储量,减少内存开销,使得优化时间大为缩短.实验证明该方法不仅效率高,而且配准效果好.
2011, 47 (4): 432437
一种基于概率粗糙集模型的图像语义检索方法*
徐久成,李晓艳**,孙林
针对目前图像数据信息量大、检索不易和人们对图像检索习惯于对图像概念语义进行检索的难题,木文将概率粗糙集理论和图像的语义标注技术引入图像的信息检索中,提出了一种基于朴素贝叶 斯理论和概率粗糙集模型的图像语义信息检索模型.首先,针对图像库中的图像构造精确标注词空间,并通过朴素贝叶斯理论对图像进行精确标注和模糊加权标注.将概率粗糙集模型和朴素贝叶斯理论的 后验概率相结合,计算每对图像标注词的条件概率和模糊条件概率,并求得每个标注词的支持集和被支持集,在此基础上,计算每个标注词的支持集和被支持集的上、卜近似,并通过上、卜近似构造图像的语 义相似度计算方法,之后计算待查询图像的查询特征与图像库中图像之间的语义相似度,并根据相似度的大小给出检索的排序和输出.最后,给出一个简单的仿真实验,实验结果表明该方法是有效可行的.
2011, 47 (4): 438455
对等云存储系统信誉机制研究 *
吴吉义1,2** , 陈德人 2
云存储是分布式存储技术与虚拟化技术结合的产物,是分布式存储技术的最新发展.云存储意味着存储可以作为一种服务,通过互联网提供给用户.相对于当前主从(Master/Slave)结构的C}FS (Uoogle File System),H DFS(Hadoop Distributed File System),Sector, KFS (Kosmos File System)等云存储系统,提出了一种基于DHT (Distributed Hash Table)的对等云存储系统MingCloud.重点研究 了系统的信誉机制问题,具体包括综合信誉度的计算、信任模型设计、信誉机制的工作过程、安全性分析等方面.仿真实验表明,该机制具有较好的有效性和健壮性,能有效保护系统中的诚实节点,迅速降低恶 意节点的信任值,抑制恶意交易行为.引入MingCrcdit之后,系统不再简单地以节点的物理性能诸如存储空间大小、网络带宽等方面的客观能力,以及在线时间作为评价标准,而是与节点参与到对等存储交 易的行为特征密切关联起来.
2011, 47 (4): 446458
基于混沌算子模型的人口数据序列预测*
邹晓玫1 **,修春波2
采用混沌算子预测模型对我国人II出生率、死亡率、自然增长率以及人II总数等数据进行预测分析.多个基木混沌算子单元通过加权和的形式构成预测模型.利用己知的人II数据组成预测网络的 训练样木,根据网络预测值与期望值之间的误差,调节各混沌算子参数来减小误差,以此改变预测模型的动力学特性,使之逐渐与被预测系统的动力学特性相一致,从而完成预测模型参数的调节和人II数据 的预测.与现有预测方法相比,该方法具有更高的预测精度.预测结果表明未来几年我国人II自然增长率将处于卜降的趋势,但人II总数仍处于上升的趋势.预计201年我国人II总数将达到13. 7亿左右.
2011, 47 (4): 459464
血管内皮生长因子C嵌合体(CA65 ) 转基因小鼠的建立和分析*
韩文灿1,2,3**,张禄卿2,王博2,徐朗莱3
摘要:将血管内皮生长因子C嵌合体CA65插入角蛋白14(kcratin l4, Kl4)启动子卜游,构建了嵌合体CA65转基因表达载体,通过显微注射法建立转基因小鼠.利用特异引物聚合酶链式反应法鉴定转 基因小鼠的基因型后,通过逆转录聚合酶链式反应检测嵌合体CA65的表达水平,证实成功建立了皮肤特异表达嵌合体CA65转基因小鼠.对转基因小鼠耳部皮肤进行免疫荧光染色,分析嵌合体CA65在血 管和淋巴管发育中的影响和作用.结果发现转基因小鼠的血管没有明显差异,但是嵌合体CA65可以选择性诱导淋巴管的生成,致使淋巴管增多,管径变粗.
2011, 47 (4): 465469
江苏沿岸大型绿藻主要物种及其季节性变化*
穆新武12 陆勤勤3 ,胡传明3 ,沈颂东4 ,胡希亮5 ,张 涛2 王苗苗1 ,朱建一2 ,许璞2**
采用形态学与分子生物学手段,调查并分析了江苏沿岸水域大型绿藻物种、数量及其时空变化规律等主要生物学特征.结果表明,该区域大型绿藻的优势种为缘管浒苔(Ulva linza,Linnaeus)和浒 苔(U. prolifera O. F. Muller).藻体形态随栖息地、生长季节等发生较大变化.大型绿藻生物量呈南高北低的趋势,在春末夏初达到顶峰,随后快速卜降,与江苏以北黄海海域漂浮浒苔相比差异明显.黄海绿 潮的来源复杂,分子标记法和形态学观察方法的判定仍有不足,还需要更深入的开展生物学研究工作.
2011, 47 (4): 470480
模式湿物理过程的组合对一次南京大暴雨降水模拟的影响分析*
周祖刚1,2 ,谈哲敏1** ,张熠1 ,姜勇强1,2
以第五代中尺度模式(MME)为基础,木文对一次南京大暴雨个例进行了三组数值模拟试验,研究了模式湿物理过程参数化方案的组合对梅雨暴雨降水预报的影响.试验结果表明:模式的积云对流 参数化方案的选用对南京大暴雨的预报至关重要,积云对流参数化方案的选用比边界层参数化对暴雨数值预报的影响大;对20 km模式分辨率而言,采用单一的积云对流参数化方案时,Bctts-Millcr方案占 显著优势;模式粗、细网格采用不同的积云对流参数化方案进行组合,可以改进模式降水预报,对于60 kmi 20 km的二重嵌套网格来说,Anthcns-Kuo and Bctts-Millcr或者Kain-Fritsch and Bctts-Millcr组合 具有一定的优势.在此基础上,积云对流参数化方案与不同微物理过程组合可以进一步改进梅雨锋暴雨的预报,不同组合方案预报降水的中心位置和强度各不相同.另外,暴雨的分布、中心位置和强度对边界 层参数化方案的选用表现出一定的敏感性.
2011, 47 (4): 481492
刊 名: 南京大学学报自然科学
主管单位:中华人民共和国教育部
主办单位:南京大学
主 编:龚昌德