针对传统聚类算法存在样本形状及孤立点敏感的问题,提出基于修剪树的优化聚类中心(Optimized Clustering Center Based on Trimmed Tree,OCT)算法.该算法自适应地寻找裁剪尺寸来修剪并分割最小生成树为森林,获取森林全部叶子结点并再次构造最小生成树,根据预设簇数n,修剪最小生成树的n-1条最长边,得到包含n棵树的森林,计算森林中每棵树的质心并将其置为初始类簇聚类中心.在仿真数据集和真实数据集上的测试结果表明,OTC算法的平均识别率分别为98.8%和95.7%,平均耗时为57 ms和10.53 ms.
k?means和谱聚类是两种应用最广泛的聚类技术.k?means是基于矩阵分解的聚类方法,并且是在数据空间上基于误差极小化的聚类方法.谱聚类是基于图的聚类方法,并且是基于两点在数据空间和特征空间的相似性保持的聚类方法.为了利用两者的优势,提出一种基于乘法更新规则的k?means和谱聚类的联合学习方法,该方法将k?means和谱聚类结合成一个统一的聚类模型,该模型可在单次优化中同时优化k?means和谱聚类的目标;此外,还基于乘法更新规则设计了对聚类中心C与聚类指示器Y进行迭代更新的优化算法.重要的是,在理论上证明了所设计算法的正确性和收敛性.在典型的数据集上进行测试,实验结果表明提出的联合学习算法在聚类精度和标准互信息度指标上都有所提高.
聚类集成的目的是通过集成多个不同的基聚类来生成一个更好的聚类结果,近年来研究者已经提出多个聚类集成算法,但是目前仍存在的局限性是这些算法大多把每个基聚类和每个簇都视为同等重要,使聚类结果很容易受到低质量基聚类和簇的影响.为解决这个问题,研究者提出一些给基聚类加权的方法,但大多把基聚类看作一个整体而忽视其中每个簇的差异.受到信息熵的启发,提出一种基于信息熵加权的聚类集成算法.算法首先对每个簇的不稳定性进行衡量,然后提出一种基于信息熵的簇评价指标,进而从簇层面进行加权,在对加权矩阵进行划分后得到最终的聚类结果.该算法有两个主要优点:第一,提出了一个有效的簇评价性指标;第二,从比基聚类层面更细化的簇层面进行加权.一系列的实验证明了该算法的有效性和鲁棒性.
尽管现有的社会推荐方法,特别是基于矩阵分解的社会推荐方法,取得了一定的推荐效果,但这些方法使用评分数据空间的用户偏好去约束社交关系数据空间的用户偏好,而这两种用户偏好却处于不同的数据空间,这限制了推荐模型的准确性.为解决这个问题,提出一种使用填充数据的偏好来约束评分数据偏好的学习过程的方法.该方法首先设计一个算法生成填充数据,然后,在概率矩阵分解的过程中约束填充数据偏好的先验分布服从评分数据偏好的先验分布.在四个真实数据集(TrustFilm,Ciao,MovieLens 1m和Jester)上测试的结果表明,提出方法的推荐效果比现有的代表性方法都要好,为概率矩阵分解模型中先验约束的研究提供了新思路.
不同类别物体之间的共生关系对多标签航拍图像分类任务有非常重要的作用.提出一种基于像素?目标级共生关系学习网络的多标签航拍图像分类方法,主要包括像素级共生关系学习模块和目标级共生关系学习模块.像素级共生关系学习模块利用不同空间位置像素点之间的特征相似性来间接度量共生关系,但由于单个像素点不能完全表征整个物体,所以这种像素级的共生关系可能无法有效地帮助目标像素点判断其所属类别.目标级共生关系学习模块则从整体的角度考虑物体之间的关系,因而可以弥补像素级共生关系学习的不足.实验结果表明,提出的方法在UCM和DFC15两个公共评测数据集上均取得了较好的分类性能.
针对长时间运动目标跟踪中因目标严重形变、短暂离开视线、遮挡而引起的跟踪漂移或丢失问题,提出一个多特征融合的长时间目标跟踪算法.首先,提取图像的方向梯度直方图和纹理特征后,训练两个独立的特征模板,线性加权融合得出滤波模型.其次,设计一个存放高置信度跟踪结果的标签库,记录跟踪结果的位置信息、置信度、使用次数.最后,在跟踪漂移或失败时,结合EdgeBox产生的目标候选框,并快速从标签库中获取重新跟踪的初始帧,在线训练更新滤波模型,从而使算法在长时间跟踪时保持较高的鲁棒性和高效性.在公开数据集上与流行算法进行对比测试,证明该算法在距离准确率、跟踪成功率和鲁棒性方面优于其他对比算法.研究结果表明,多特征融合方法能有效解决遮挡、颜色相近、形变等复杂场景下的长时间目标跟踪问题.
将行人检测算法和行人重识别算法相结合,提出一种多目标跨摄像头跟踪算法,该算法由行人检测、行人重识别和行人数据关联三大模块组成.首先利用基于YOLOv3的行人检测改进算法检测视频中出现的行人,并保存视频号、帧号和行人的全身位置信息;其次,利用基于生成对抗网络和重排序的行人重识别改进算法,为已检测的行人图片赋予一个标签;最后整合前两步得到的行人信息,生成包含视频中所有行人信息的JSON(JavaScript Object Notation)文件.该算法可以快速、高效地完成多目标跨摄像头跟踪任务,有一定实用价值,在南京市举办的全球人工智能应用大赛中获得了单项奖.
在目标检测算法中,尺度变化是目标检测的关键问题之一.针对不同目标拥有不同尺度的问题,构建一个三分支网络,生成能表示对应尺度的特征图,每个分支对应特定的感受野,分别负责检测大、中、小物体.通过筛选合适尺度的对象实例进行训练,保持各分支的尺度不变性.为保证小物体的检测效果,没有对检测小物体的分支采用下采样,同时使用膨胀卷积增加语义信息;检测大物体的分支则采用更大膨胀率的膨胀卷积,扩大感受野,获得更多的语义信息.在保证尺度不变性的情况下,特征融合必不可少,因此使用多尺度融合的思想,在不影响并行的三分支网络的情况下,对低层特征与高层特征进行了选择性融合.
针对视频运动目标分割中目标快速移动、障碍物遮挡、相似干扰时存在剧烈位移或目标消失等问题,提出一种基于空间感知与细化残差的视频运动目标分割方法.首先,将标签图像输入小型神经网络获取视觉信息;其次,通过空间感知器对当前帧获得预测的目标热图,以获取空间位置信息;最后,利用空间信息和视觉信息,融合细化残差模块细致轮廓边缘,完成目标分割任务.引入空间感知器,可以减少空间位置的误差,提升了空间调制器网络的准确性;利用多级细化残差模块改善特征图的边缘细节,可以提高目标分割的准确度.在DAVIS 2016和DAVIS 2017数据集上的实验结果表明,该方法可以获得良好的分割结果.
现有的混合结构学习算法受制于变量的邻居集,导致混合结构学习算法在约束学习阶段,若变量的邻居集没有包含真实结构的节点,该节点将再也不会被考虑.为改进这一问题,通过探索贝叶斯网络结构与节点影响度间存在的可能性关系,设计基于节点影响度的变量序调整方法并将调整后的变量序应用于网络结构学习.调整后的变量序在减少搜索空间的同时,也改善了传统约束空间过于依赖变量邻居集的问题,进而提升网络结构的学习质量.实验结果表明,该算法能有效地提升现有混合结构学习算法的精度,同时也验证了从节点影响度的角度去探索贝叶斯网络结构图的可行性.
信息粒度和近似方法是粗糙集理论进行数据描述的两个关键.现实中数据分布情况复杂多变,现有的模型缺乏对不同数据区域进行区分的能力,且易受到异常数据的干扰,导致最终分类决策的失误.为此提出基于合理粒度的局部邻域决策粗糙集模型.首先,根据邻域中对象的个数和类别识别一些极端情况(例如离群点和标签噪声点),分别给出不同分布情况下数据点的粗糙隶属度;其次,为已识别的标签噪声数据提供一组伪标记,用伪标记对原始标签进行修正;最后引入合理粒度准则,构造由信息覆盖性函数和特殊性函数融合的新的评估标准,并通过粒子群优化算法对其进行优化,得到最佳邻域半径.实验结果表明,该方法为复杂数据处理提供了一种有效的解决方案.
随着网络入侵行为的多样化和智能化,传统的入侵检测算法难以提取入侵行为包含的特征,在入侵检测性能上存在一定的不足.为此提出一种基于深度信念网络(Deep Belief Network,DBN)和三支决策(Three?Way Decisions)的入侵检测算法.首先利用深度信念网络从高维数据中提取特征,在多次特征提取后构建一个多粒度的特征空间;然后利用基于三支决策理论的分类器对入侵行为或正常行为进行即时决策,并根据不同粒度特征使用KNN分类器进一步分析边界域内不确定的网络行为.在NSL?KDD数据集上进行实验,结果表明该算法可以提升入侵检测系统的性能.
空间模式匹配在各类基于位置的服务中有广泛的应用,但在面向空间大数据时,现有空间模式匹配算法的效率难以满足实际要求.针对上述问题,采用并行计算框架Spark,设计基于空间模式边匹配并行的空间模式匹配算法PMSJ (Parallel Multi Star Join).PMSJ算法将空间模式匹配问题分解为可以独立、并行执行的称为边匹配的子问题,将计算量分散至集群中各个计算节点以提高计算效率.具体地,PMSJ将边匹配分为针对空间区域的最小边界矩形匹配与针对具体空间对象的边匹配两个并行步骤,并在计算边匹配前对最小边界矩形匹配的结果进行剪枝,排除无法产生完整空间模式匹配的匹配对.在四个真实数据集上的实验结果表明,在面向空间大数据时,PMSJ算法的效率优于现有算法.
社交网络中隐私泄露受多种因素的影响,针对不能有效度量隐私泄露的问题,尤其是在攻击者拥有背景知识的时候,必须综合考虑背景知识来设计隐私泄露度量方法.构建一个个人隐私泄露多维分析模型,对隐私泄露的影响因素进行较全面的分析,结合泄露指标的计算,推导出影响较大的因素.提出一种背景知识分类和量化方法,能划分关键背景知识和非关键背景知识;在此基础上提出一个攻击背景下隐私泄露度量信息熵模型和隐私泄露的综合度量方法,解决隐私泄露有效度量的问题.所提出的模型和背景知识量化方法可为攻击背景下隐私泄露风险分析与评估提供可行的计算基础,实验验证和分析结果表明度量模型是可行的、有效的.
轮轨作用力是列车对轨道状态的激励响应,是列车安全监控的重要信息指标,对保证列车的行车安全意义重大.现有的轮轨力采集设备存在容易磨损、使用周期短等问题,导致数据采集困难,使用成本高昂;而列车的振动信号数据则更容易采集,利用振动信号来反演轮轨力一直是相关研究的热点和重点.但常见的轮轨力反演方法大多基于模型驱动,识别精度低,且辨析条件较为苛刻,难以真正应用于工程实践.结合振动信号和轮轨力的数据特性,提出一种数据驱动的轮轨力反演模型.经过实验验证,在直线轨道工况下,相关系数可达0.9911,而目前传统模型最好结果仅为0.82;在传统模型较难处理的曲线轨道工况下,相关系数也能达到0.9754,与动力学仿真结果高度拟合,为列车轮轨力的安全监测提供了一种新的方案.
语音信号和面部表情是人们表达情感的主要途径,也被认为是情感表达的两个主要模态,即听觉模态和视觉模态.目前情感识别的研究方法大多依赖单模态信息,但是单模态情感识别存在信息不全面、容易受噪声干扰等缺点.针对这些问题,提出一种融合听觉模态和视觉模态信息的两模态情感识别方法.首先利用卷积神经网络和预先训练好的面部表情模型,分别从语音信号和视觉信号中提取相应的声音特征和视觉特征;然后将提取的两类特征进行信息融合和压缩,充分挖掘模态间的相关信息;最后,利用长短期记忆循环神经网络对融合后的听觉视觉双模态特征进行情感识别.该方法能够有效地捕捉听觉模态和视觉模态间的内在关联信息,提高情感识别性能.利用RECOLA数据集对提出的方法进行验证,实验结果证明基于双模态的模型识别的效果比单个的图像或声音识别模型更好.
心律失常是常见的心血管疾病,目前临床软件对其识别的准确率不高,医师复核需要大量时间.针对以上问题,提出时空级联网络(CascadedNet)的心电图识别与心律失常分类模型.CascadedNet的双层级联结构提取心电图心搏形态特征并挖掘节律关联信息,实现异常心搏和异常节律的识别.引入端到端的心搏与节律识别双任务学习方法,使任务间共享特征表达式.CascadedNet在MIT?BIH心律失常数据集上的测试结果表明:CascadedNet比内部算法(支持向量机、朴素贝叶斯网络、梯度上升树和随机森林)的准确率高出19.7%以上;比长短时记忆网络和循环神经网络准确率高出5.23%;与单维卷积网络相比,CascadedNet的总体准确率相当,但召回率和精确度分别高出9.96%和7.94%,且网络复杂度比单维卷积网络更低,结构有更好的可解释性.
声品质主观评价实验中,如果样本数量较大或已完成现有样本评价后又有新样本加入评价系统,传统的成对比较法所需的实验时间较长,难以实现,且自适应分组成对比较法缺乏对多个关联样本的研究.基于自适应分组成对比较法提出多种子自适应分组成对比较法,通过多个种子样本建立任意两组样本之间的映射关系,从而获得全体样本的评价结果.阐述了多种子自适应分组成对比较法的基本原理及具体实现方法,给出多种子自适应选取种子的经验公式.并通过设计两种主观评价实验,与传统成对比较法和自适应分组成对比较法对比,验证了所提方法的有效性和可靠性.
研究Antimycin类天然产物对三阴性乳腺癌细胞MDA?MB?231特异性生长抑制和杀伤作用.三种结构类似的天然产物Antimycin?1,?2和?3对MDA?MB?231细胞生长都有很强的抑制作用,其IC50分别为1.34±0.07,160±20和180±50 nmol·L-1,Antimycin?1活性是Antimycin?2和Antimycin?3的一百多倍.10 nmol·L-1的Antimycin?1就可有效抑制MDA?MB?231细胞增殖,药物处理细胞24和48 h后的抑制率分别达到约80%和90%.显微镜下可以观察到,10和100 nmol·L?1的Antimycin?1都不同程度地杀伤MDA?MB?231细胞,1000 nmol·L-1的Antimycin?1甚至使细胞几乎消溶,只留下突起的核和胞质残骸.而同样浓度药物造成的乳腺正常细胞MCF?10A和结肠癌细胞HCT116形态的改变不明显.1和5 nmol·L-1的Antimycin?1对细胞集落抑制率分别达到52%和95%.20和50 nmol·L-1的Antimycin?1也明显改变MDA?MB?231细胞核形态,核呈畸形,皱缩严重,核膜破损.5,10和100 nmol·L-1的Antimycin?1处理MDA?MB?231细胞12,24和48 h引发细胞凋亡和坏死数量增加,并呈现时间和剂量依赖性.5,10和20 nmol·L-1的Antimycin?1处理MDA?MB?231细胞6,12和24 h后,没有观察到对细胞周期时相的明显影响.20 nmol·L-1的Antimycin?1处理MDA?MB?231细胞12,16,20和24 h后,引起胞内活性氧(reactive oxygen species,ROS)水平随处理时间延长呈逐渐下降趋势.以上结果证明,纳摩尔级的Antimycin?1能有效抑制和杀伤三阴性乳腺癌MDA?MB?231细胞.