南京大学学报(自然科学), 2022, 58(6): 1020-1029 doi: 10.13232/j.cnki.jnju.2022.06.010

基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法

马学森,1,2, 马吉1,2, 蒋功辉1,2, 许雪梅1,2, 周天保1,2

1.合肥工业大学计算机与信息学院, 合肥, 230601

2.安全关键工业测控技术教育部工程研究中心, 合肥工业大学, 合肥, 230601

Insulator defect detection method based on attention mechanism and multi⁃scale feature fusion

Ma Xuesen,1,2, Ma Ji1,2, Jiang Gonghui1,2, Xu Xuemei1,2, Zhou Tianbao1,2

1.School of Computer and Information,Hefei University of Technology,Hefei,230601,China

2.Engineering Research Center of Safety Critical Industrial Measurement and Control Technology,Hefei University of Technology,Hefei,230601,China

通讯作者: E⁃mail:mxs@hfut.edu.cn

收稿日期: 2022-07-04  

基金资助: 国家重点研发计划.  2020YFC1512601
国家电网有限公司总部科技项目.  SGTYHT/19⁃JS⁃215
合肥工业大学智能制造技术研究院智能网联汽车专项.  IMIWL2019003.  IMIDC2019002
合肥市自然科学基金.  2022015

Received: 2022-07-04  

摘要

随着深度学习的快速发展,利用目标检测算法对航拍绝缘子图像进行缺陷检测成为绝缘子巡检的主要方式.针对传统目标检测算法对小目标的检测精度较低、特征图的表征能力较弱和提取的关键信息较少的问题,提出以YOLOv5l为基础网络的改进的基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法AMF⁃YOLOv5l (Attention Mechanism and Multi⁃Scale Feature Fusion Based on YOLOv5l).首先,通过增加一个小目标检测头,提高模型对小目标的检测性能;然后,构造DSPP (Dilated Spatial Pyramid Pooling)模块,充分融合多尺度特征,增强特征图的表征能力;最后,引入CA (Coordinate Attention)注意力机制,使网络更加专注于关键信息.在航拍绝缘子数据集APID (Aerial Photo⁃graphic Insulator Dataset)以及两个公共数据集PASCAL VOC和MS COCO上分别验证该方法的可行性.实验结果表明,在APID数据集中该方法的AP (Average Precision)比YOLOv5l算法提升5.2%,FPS (Frames Per Second)仅降低2.3,并且在公共数据集上和其他算法相比均有明显优势,证明提出的方法在较大提升检测精度的同时,还可以保持较高的检测速度,能够很好地满足绝缘子缺陷检测的工程应用需求.

关键词: 绝缘子 ; 缺陷检测 ; 小目标检测 ; 多尺度特征融合 ; 注意力机制

Abstract

With the rapid development of deep learning,the use of object detection algorithms to detect defects in aerial insulator images has become the main way of insulator inspection. Aiming at the problems that traditional object detection algorithms have low detection accuracy for small objects,weak representation ability of feature maps and less key information extracted,the AMF⁃YOLOv5l (Attention Mechanism and Multi⁃Scale Feature Fusion Based on YOLOv5l) is proposed,an improved insulator defect detection method based on attention mechanism and multi⁃scale feature fusion with YOLOv5l as the base network. Firstly,a small object detection head is added to improve the detection performance of the model for small objects. Secondly,the DSPP (Dilated Spatial Pyramid Pooling) module is constructed to fully integrate multi⁃scale features and enhance the representation ability of feature maps. Finally,the CA (Coordinate Attention) attention mechanism is introduced to make the network focus more on key information. The feasibility of the proposed method is verified on the aerial photography insulator dataset APID (Aerial Photographic Insulator Dataset) and the public datasets PASCAL VOC and MS COCO,respectively. Experimental results show that the AP (Average Precision) of our method in the APID dataset is 5.2% higher than that of the YOLOv5l algorithm,and the FPS (Frames Per Second) is only reduced by 2.3. And it has obvious advantages over other mainstream algorithms on public datasets. It shows that the method in this paper greatly improves the detection accuracy while still maintaining a high detection speed,which well meets the engineering application requirements of insulator defect detection.

Keywords: insulator ; defect detection ; small object detection ; multi⁃scale feature fusion ; attention mechanism

PDF (1979KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

马学森, 马吉, 蒋功辉, 许雪梅, 周天保. 基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法. 南京大学学报(自然科学)[J], 2022, 58(6): 1020-1029 doi:10.13232/j.cnki.jnju.2022.06.010

Ma Xuesen, Ma Ji, Jiang Gonghui, Xu Xuemei, Zhou Tianbao. Insulator defect detection method based on attention mechanism and multi⁃scale feature fusion. Journal of nanjing University[J], 2022, 58(6): 1020-1029 doi:10.13232/j.cnki.jnju.2022.06.010

绝缘子是高压输电线路中十分重要的组成部分,有支撑保护和电流绝缘的良好作用.由于绝缘子长时间处于野外非常恶劣的工作环境中,所以非常容易产生自爆等缺陷,绝缘子出现缺陷后会使高压输电线路产生安全隐患,甚至可能因此造成巨大的经济损失1.所以,为了保障电力系统处于稳定的运行状态,对绝缘子进行定期的检查维护具有重大意义.

传统的绝缘子巡检方式主要依靠人力手持检测工具进行实地勘察,接着出现直升机载人巡检;随着无人机的普及,电力系统开始通过无人机沿高压输电线路采集绝缘子图像,借助图像处理算法对采集的绝缘子图像进行诊断分析.但由于我国电力系统基础设施普遍存在规模较大、覆盖范围较广及输电线路间的结构复杂多变等特点,导致上述巡检方式检测的准确率、安全性和效率偏低,成本高昂.目标检测等深度学习技术有强大的自主学习能力,无需人为提取特征并能快速处理大量图像数据,所以国内电网公司开始在电力系统的无人机绝缘子缺陷检测工程应用中广泛采用深度学习方法2.但无人机航拍视野大、角度多变,航拍的绝缘子图像具有缺陷目标较小、背景复杂多变以及干扰目标多等特点,导致传统的目标检测算法面临对小目标的检测精度较低、特征图的表征能力较弱和提取的关键信息较少等问题.

针对上述问题,本文提出以YOLOv5l为基础网络的改进的基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法AMF⁃YOLOv5l (Attention Mechanism and Multi⁃Scale Feature Fusion Based on YOLOv5l).

本文的主要贡献:

(1)在YOLOv5l网络原有的三个检测头的基础上,增加一个输出分支作为小目标检测头,提高模型对小目标的检测性能.

(2)使用空洞卷积构造DSPP (Dilated Spatial Pyramid Pooling)模块,通过空洞卷积扩大感受野,避免损失图像的细节信息.融合多尺度特征,使局部特征和全局特征得到充分利用,增强特征图的表征能力,提高模型的检测性能.

(3)将CA (Coordinate Attention)注意力机制引入YOLOv5l的网络,使网络在背景复杂多变和存在较多干扰信息的图像中提取感兴趣区域,从而专注于有效目标的关键信息,进一步提高模型的检测性能.

(4)在航拍绝缘子数据集APID以及公共数据集PASCAL VOC和MS COCO上验证本文提出方法的有效性,还与其他目标检测算法进行了对比实验.实验结果表明,AMF⁃YOLOv5l不仅具有较高的检测精度,检测速度也有较大优势.

1 相关工作

本节主要分析近年来目标检测算法、多尺度特征融合方法、注意力机制和绝缘子相关的目标检测算法的相关工作.

1.1 目标检测算法

目前主流的目标检测算法主要采用两种结构:双阶段结构和单阶段结构.

双阶段结构的目标检测算法首先由R⁃CNN (Region⁃Convolutional Neural Networks)3推广.然后Fast R⁃CNN4引入一个RoI池化层,该层允许网络使用每幅图像的特征图,而不是每个对象的一个特征图.然后,Faster R⁃CNN5定义区域建议网络RPN (Region Proposal Network),将建议区域的生成第一次集成到网络中.特征金字塔网络FPN (Feature Pyramid Network)6通过向Faster R⁃CNN添加带有跳跃连接的自上而下的架构,生成具有更高层语义的特征图.

单阶段目标检测算法,如SSD7和YOLO8,采用直接计算最终检测集的方式,将密集的边界框作为输入,而不是针对建议区域,而且它基于全局回归和分类,直接生成目标的位置和类别.因此,和双阶段目标检测算法相比,单阶段算法速度更快,实时性更强.由于单阶段结构目标检测算法需要处理感兴趣的对象和网络中的背景示例之间的高度不平衡问题,所以检测精度有所下降.Lin et al9提出一个新的代价函数来消除正负样本之间的不平衡带来的影响,提高单阶段算法的检测精度.YOLOv5作为新一代单阶段目标检测算法,在速度方面展现了极大的优势,还在数据增强、特征融合和损失函数等方面进行了诸多改进,使检测精度也得到进一步提升.

1.2 注意力机制

注意力机制在深度学习领域中的运用逐渐普遍,如目标跟踪、图像识别和图像分类等.其中SENet10的运用最广泛,它采用简单的方式把每个2D特征图进行压缩,体现通道间的依赖性.后来的研究,如GENet,GALA,AA和TA,有的构造更先进的注意力网络,有的深入研究不同的空间注意力结构,使注意力机制得到进一步发展.近年来,非局部/自注意力网络也比较流行,因为此类网络能建立空间或通道性注意力,如NLNet,GCNet,A2Net,SCNet,GSoP Net和CCNet等,它们通过非局部机制获取不同类型的空间信息.然而自注意力机制网络的计算量较大,所以常用于大模型,不适用于移动网络.和这些昂贵且复杂的注意力机制相比,CA11的注意力机制十分简单轻巧,可以在几乎不增加计算开销的情况下结合到网络结构中.

1.3 多尺度特征融合

有效处理多尺度特征是目标检测的难点之一.开始,目标检测算法一般是直接提取骨干网络的特征进行检测输出,后来特征金字塔网络FPN8使用自顶而下的方式融合不同尺度的特征,为业内提供新的思路.PANet12进一步在FPN的结构上补充一个新的自下而上的分支,增强网络的聚合能力.STDL13网络中设计了尺度转换模块来利用跨尺度的特性.Retina⁃Net9同样采用多尺度特征融合的思想,使用自底向上的方式融合多尺度特征,实现多尺度目标检测.YOLOv5采用FPN+PAN的结构形式,同时融合自顶向下传达的强语义特征信息和自底向上传达的强定位特征信息.

1.4 绝缘子相关的目标检测算法

目前已经存在一系列基于深度学习的与绝缘子相关的目标检测算法.Liao et al14将深度残差网络Resnet101集成到Faster R⁃CNN算法中来检测绝缘子的缺陷部位,和其他目标检测算法相比提高了对绝缘子缺陷部位的检测精度,但计算成本较大,导致检测速度较低.赵文清等15采用特征融合和多尺度缩放的方法构造STDN网络对绝缘子进行识别,通过增大网络的小尺度特征图提高对绝缘子的识别率,但没有展现出较好的检测速度.Yao and Qin16使用改进的YOLOv3算法来对绝缘子进行缺陷检测,用新的损失函数GIoU替换原本的IoU损失函数,在不增加计算成本的情况下,和原本的YOLOv3算法相比,提升了检测绝缘子缺陷的精度,并且拥有较好的检测速度,但依然没有很好地解决漏检的问题.Wang et al17提出一种拥有较好的区域建议网络的绝缘子检测算法,通过对ResNeSt网络的进一步改进,并结合多尺度的区域建议网络RPN,使网络的检测精度得以提高,但是检测速度仍然较低.

综上所述,一方面,双阶段目标检测算法精度较高,但检测速度较慢;另一方面,单阶段的目标检测算法的检测速度较高,但检测精度较低.为了满足一定的检测速度的同时仍然保证较高的检测精度,本文选择基于目前速度较快的YOLOv5网络来构造绝缘子缺陷检测算法.

2 AMF⁃YOLOv5l绝缘子缺陷检测方法

YOLOv5是单阶段的目标检测算法,主要由Backbone,Neck和Head模块构成,其中,Backbone主要使用Focus模块、Conv卷积模块和CSPdarknet+SPP结构;Neck使用FPN+PAN结构;Head使用yolov3 head,包含三个输出检测头.YOLOv5包含YOLOv5s,YOLOv5m,YOLO⁃v5l和YOLOv5x四种网络结构,模型的深度和特征图的宽度依次增大,相应的检测精度越来越高,但模型的计算成本也越来越高.在综合考虑模型的性能和计算成本后,选择YOLOv5l模型作为基础网络进行改进,提出基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法AMF⁃YOLOv5l,网络结构如图1所示.首先增加一个小目标检测头,然后构造DSPP模块运用到网络的Backbone结构中增强特征图的表征能力,最后将CA注意力机制结合到网络的Backbone结构中,使模型更加专注于有效目标的关键信息.

图1

图1   AMF⁃YOLOv5l网络的结构

Focus:切片操作模块;Conv:卷积模块;C3:BottleneckCSP模块;CA:CA注意力机制模块;DSPP:DSPP模块

Fig.1   The structure of AMF⁃YOLOv5l network


2.1 增加小目标检测头

航拍绝缘子图像中部缺陷目标的尺寸非常小,不足图像尺寸的0.12%(图2),传统算法难以提取足够的特征信息.针对小目标检测问题,借鉴Zhu et al18的思想,在拥有三个检测头的原始YOLOv5l网络的基础上再添加一个用于检测小目标的检测头,增强模型检测小目标的能力.

图2

图2   航拍绝缘子图像的缺陷目标

Fig.2   Defective objects in aerial insulator images


为了更好地检测小目标,需要获取大量小目标信息,而浅层的特征图分辨率更高,蕴含的小目标信息更多.如图1所示,从Backbone结构的第二层提取浅层特征,同时在Neck结构的第20层后添加卷积层和上采样层,继续扩大特征图,获取浅层特征图缺少的语义信息,然后在第23层使用Concat操作融合前一层提取的特征图和从第二层提取的浅层特征,最后从融合富含小目标信息的特征后的第24层生成一个输出分支作为小目标检测头(Head1).因此,该小目标检测头可以获取更多小目标特征信息,有利于对小目标的检测.

2.2 构造DSPP模块

为了增强特征图的表征能力,使用空洞卷积构造DSPP模块,融合多尺度特征,使局部特征和全局特征都得到充分利用.原始YOLOv5结构中的空间金字塔池化模块SPP如图3所示,该模块主要由最大池化构成.最大池化在增加感受野的同时会损失分辨率,分辨率损失过多会导致图像细节信息的丢失,降低模型的检测性能,所以本文使用空洞卷积,避免在扩大感受野时损失分辨率.但空洞卷积引入“空洞”会造成“网格化”问题,如图4a所示,对于卷积核尺寸为3×3,dilation rate为2的空洞卷积,在原本拥有25个像素的区域中只计算其中9个,提取的信息会减少,而且dilation rate的增大使遗漏的信息更多.为了解决“网格化”问题,将多个具有不同dilation rate的空洞卷积组合,组合的多个空洞卷积必须满足dilation rate不能存在大于1的公约数这一原则.如图4b所示,将三个dilation rate为1,2和3的空洞卷积组合之后,顶层能在相同大小的区域内获取更多的像素信息19.

图3

图3   SPP模块的结构

Fig.3   The structure of SPP module


图4

图4   网格化示意图

(a) dilation rate均为2;(b) dilation rate分别为1,2,3

Fig.4   Schematic diagram of gridding


如上所述,将多个dilation rate不同的空洞卷积进行组合,构造DSPP模块,如图5所示.该模块由四个分支组成:第一个分支是一个跃连接;第二个分支是一个卷积核尺寸为3×3且dilation rate为1的空洞卷积;第三个分支是一个包含两个卷积核尺寸为3×3且dilation rate分别为1和2的空洞卷积组合结构;第四个分支是一个包含三个卷积核尺寸为3×3且dilation rate分别为1,2和3的空洞卷积组合结构.其中,第四个分支的感受野为13,而池化核为13×13的最大池化的感受野也为13,所以该空洞卷积的组合结构能够在避免池化造成分辨率损失的同时,实现与最大池化一样增大感受野的效果.第三个分支的感受野为7,池化核为9×9的最大池化的感受野为9,该分支没有选择与最大池化操作感受野相同的空洞卷积,一方面因为小感受野更有利于检测小目标,另一方面因为和两个dilation rate为2的空洞卷积组合相比,采用dilation rate分别为1和2的两个空洞卷积组合能避免“网格化”造成的信息丢失.第二个分支同理.此外,在每个空洞卷积后都加上BatchNorm层和SiLU激活函数.BatchNorm层可以消除训练网络时数据分布的变化带来的影响,缓解梯度发散,使网络的训练更快更稳定.SiLU激活函数能增加网络的非线性,提高网络的表征能力.并且,为了不降低模型的检测速度,削减DSPP模块中的通道数,可以降低计算量.

图5

图5   DSPP模块的结构

Fig.5   The structure of DSPP module


DSPP模块通过使用空洞卷积,在不损失图像细节信息的前提下扩大感受野,且结构中的不同分支拥有不同的感受野,可获得不同尺度的特征信息;再通过Concat操作融合不同尺度的特征,使局部特征和全局特征得到充分利用,增强特征图的表征能力,提高模型的检测性能.

2.3 引入CA注意力机制

为了使网络可以提取感兴趣区域,抵抗混乱信息的干扰,专注于有效目标的关键信息,本文将CA11注意力机制引入YOLOv5l网络.CA是一种轻巧且高效的注意力机制,它在通道注意力中插入坐标信息.常规的通道注意力机制的做法是利用池化操作把张量形式的特征变换成一个个向量形式的特征,CA注意力机制与之不同,它把通道注意力先拆分成两部分,两部分按各自不同的方向进行特征编码,最后再将两部分合并起来,如图6所示.通过这种方式,既能在一个方向上得到长距离的依赖关系,又能使坐标信息在另一个方向上得到保留.对得到的特征图编码,分别得到一个具有方向感知性的Attention Map和一个具有坐标敏感性的Attention Map,最后将这些Attention Map以互补的形式融合到输入特征图中,使特征图对感兴趣对象的表征能力得到增强.

图6

图6   CA模块的结构

Fig.6   The structure of CA module


为了尽可能地将注意力机制的作用最大化,探索将CA注意力机制结合到网络中更适合的方式,从而更好地提升模型的检测性能.本文将CA注意力机制分别引入YOLOv5l的Backbone,Neck和Head结构中进行检测效果对比,实验结果如表1所示.由表可见,将CA注意力机制引入网络的Backbone结构中的效果最好,所以将CA注意力机制引入YOLOv5l的Backbone结构中.在引入CA注意力机制后,网络可以在具有复杂背景的图像中专注于有用的目标对象,能提高模型对绝缘子缺陷的检测性能.并且,由于CA注意力机制十分轻巧,几乎不增加计算开销.

表1   将CA注意力机制引入YOLOv5l不同位置的实验结果对比

Table 1  Experimental results of CA attention mechanism integrated into different positions of YOLOv5l dataset

网络引入位置数据集mAP
YOLOv5lBackbone+CAAPID93.4
Neck+CAAPID92.8
Head+CAAPID92.3

新窗口打开| 下载CSV


3 实验

3.1 实验环境与评价指标

实验基于64位操作系统Ubuntu 18.04 LTS,深度学习框架为Pytorch v1.7.0.具体的实验环境配置如表2所示.

表2   实验环境

Table 2  Experimental environment

实验环境版本型号
操作系统Ubuntu 18.04 LTS
CPUintel(R) Core(TM) i9⁃10900K
GPUNVIDIA GeForce RTX3080
内存16 G
深度学习框架Pytorch v1.7.0
IDEPycharm v2020.1

新窗口打开| 下载CSV


用目标检测领域中被广泛使用的平均精度(Average Precision,AP)来衡量模型的性能,当检测目标为多个时选择均值平均精度(mean Average Precision,mAP);使用每秒帧率(Frames Per Second,FPS)来评价模型的检测速度.各指标的具体定义如式(1)至式(5)所示:

R=TPTP+FN
P=TPTP+FP
AP=01PRdR
mAP=APN
FPS=1t

其中,TP是被正确预测的正样本数量,FN是被错误预测为负样本的正样本数量,FP是被错误预测为正样本的负样本数量,R (Recall)为召回率,P (Precision)为精确率,N为检测目标的总类别数,t为处理一张图片的时间.

3.2 APID数据集

目前没有用于绝缘子缺陷检测的公共数据集来训练网络,本文用某电网公司提供的使用无人机巡检拍摄的绝缘子图像来构造绝缘子数据集(Aerial Photographic Insulator Dataset,APID).利用图像处理技术,如翻转、对比度调整和对称变换等,将数据集扩增到15570张图片,其中训练集12400张,测试集3300张.图7给出了APID数据集中绝缘子图像的部分示例.

图7

图7   APID数据集部分图片示例

Fig.7   Examples of the APID dataset images


3.3 实验结果与分析

在航拍绝缘子数据集APID和公开数据集PASCAL VOC,MS COCO上进行实验和对比分析,验证本文方法的有效性.实验分三部分:

(1)在APID数据集上进行实验,验证本文方法的可行性,并与其他目标检测方法在此数据集上的实验结果进行对比,验证本文方法的优势.

(2)在公共数据集PASCAL VOC和MS COCO数据集上分别进行实验和对比分析,验证本文方法的普适性.

(3)设计消融实验,进一步验证本文提出的改进策略对绝缘子缺陷检测的有效性.

3.3.1 APID数据集实验结果与分析

本文算法和其他对比算法在APID数据集上的实验结果对比见表3.由于APID数据集中的图像具有缺陷目标较小、背景复杂多变和干扰目标多等特点,给检测任务带来一定难度.由表可见,经过一系列改进后本文方法AMF⁃YOLOv5l的AP在APID数据集上取得了最好的结果,达到93.4%,比原始YOLOv5l算法提高了5.2%.但由于在改进网络的同时,网络结构的增加带来的复杂度使计算成本有所提升,因此FPS比原始YOLOv5l算法下降2.3,不过下降幅度较小,所以和其他目标检测算法相比,本文方法仍然具有较高的检测速度,能够很好地满足绝缘子缺陷检测任务的要求.另外,对于Faster R⁃CNN5,SSD7,RetinaNet9和DetectoRS20等其他目标检测算法以及同样基于YOLOv5改进的TYOLOv521算法,本文方法在检测精度和速度方面均有明显的优势,证明了该方法在航拍绝缘子图像的缺陷检测中的有效性.

表3   本文算法和其他对比算法在APID数据集上的实验结果对比

Table 3  Experimental results of our algorithm and other algorithms on APID dataset

方法骨干网APFPS
AMF⁃YOLOv5lCSPDarkNet⁃5393.4%25.4
Faster R⁃CNNVGG⁃1685.6%5.1
SSDVGG⁃1686.3%17.3
RetinaNetResNet⁃5087.5%15.4
DetectoRSResNet⁃5090.6%3.3
YOLOv5lCSPDarkNet⁃5388.2%27.7
TYOLOv5CSPDarkNet⁃5391.3%21.2

新窗口打开| 下载CSV


本文方法AMF⁃YOLOv5l与原始YOLOv5l算法在APID数据集上检测效果的可视化对比如图8所示.由于图像中绝缘子缺陷的目标很小且部分目标十分密集,同时背景也比较复杂,原始YOLOv5l算法存在漏检和误检.如图8第一行图像所示,YOLOv5l算法只检测出两处缺陷中的一处;如图8第二行图像所示,YOLOv5l算法将绝缘子以外的高架部件误当成存在缺陷的绝缘子.而在同样的情况下,本文方法能准确区分目标且全部检测出来,直观地体现了该方法的优势.

图8

图8   本文AMF⁃YOLOv5l和原始YOLOv5l算法在APID数据集上的检测效果可视化对比

Fig.8   Visual comparison of detection effects of our AMF⁃YOLOv5l and original YOLOv5l on APID dataset


3.3.2 公共数据集实验结果与分析

为了进一步验证本文方法的普适性,在目前常用的两个公共数据集PASCAL VOC和MS COCO上分别进行对比实验.

PASCAL VOC包含VOC 2007和VOC 2012两种版本,两个数据集都有20个不同类别,VOC 2007总数为9963张,VOC 2012总数为17125张.使用VOC 2007的训练集和VOC 2012的训练集共同作为训练集来训练模型,使用VOC 2007的测试集来对模型进行测试.在PASCAL VOC数据集上的实验结果如表4所示.

表4   本文算法和其他对比算法在VOC数据集上的实验结果对比

Table 4  Experimental results of our algorithm and other algorithms on VOC dataset

方法骨干网mAPFPS
AMF⁃YOLOv5lCSPDarkNet⁃5383.1%41.2
Faster R⁃CNNVGG⁃1672.4%6.3
SSDVGG⁃1675.1%24
RetinaNetResNet⁃5077.2%19.3
DetectoRSResNet⁃5080.8%4.2
YOLOv5lCSPDarkNet⁃5380.4%44.3
TYolov5CSPDarkNet⁃5382.7%36.7

新窗口打开| 下载CSV


通过分析,AMF⁃YOLOv5l与YOLOv5l算法相比,速度虽然略微下降,但mAP提高了2.7%.与同样基于YOLOv5算法改进的TYOLOv5方法相比,本文方法的FPS提升4.5,而mAP同样更高.与Faster R⁃CNN5,SSD7,RetinaNet9和DetectoRS20等其他目标检测算法相比,本文方法的mAP和检测速度都展现出一定的优势,说明本文方法在公共数据集VOC上同样具有普适性.

MS COCO数据集分MS COCO 2014和MS COCO 2017两个版本.使用MS COCO 2017版本的数据集,该数据集数据量大、种类多,共有80个不同的类别,其中训练集总数为118287张,测试集总数为5000张.在COCO数据集中常用APAP50作为评价指标,APIoU=0.5~0.95间隔为0.05的十个IoU对应的mAP的平均值,AP50IoU=0.5时的mAP.在COCO数据集上的实验结果如表5所示.

表5   本文算法和其他对比算法在COCO数据集上的实验结果对比

Table 5  Experimental results of our algorithm and other algorithms on COCO dataset

方法骨干网APAP50
AMF⁃YOLOv5lCSPDarkNet⁃5347.3%67.8%
SSDVGG1629.4%49.3%
RetinaNetResNet⁃10137.8%57.5%
YOLOv4CSPDarkNet⁃5343.5%65.7%
YOLOv5lCSPDarkNet⁃5345.7%65.9%

新窗口打开| 下载CSV


通过分析,本文方法AMF⁃YOLOv5l与原始YOLOv5l算法相比,AP提高1.6%,AP50提高1.9%.与其他目标检测算法相比,如同为YOLO系列的YOLOv422,RetinaNet9和SSD7算法,本文方法的APAP50都展现了较好的优势,说明该方法在公共数据集COCO上同样具有普适性.

3.3.3 消融实验

为了验证本文提出的各种改进策略对模型检测效果的影响,在APID数据集上设计消融实验,测试不同改进策略的检测效果,实验结果如表6所示.由表可见,本文在原始网络的基础上增加一个小目标检测头之后,提高了模型对小目标的检测性能,AP提升了2.4%,但由于增加了网络层数,使计算量有所增加,FPS下降了1.8.在加入DSPP模块后,局部特征和全局特征都得到了充分的利用,提高了特征图的表征能力,使模型的检测性能得到进一步的提高,因此AP提高了1.9%.另外,本研究在设计DSPP模块时削减了其中的通道数,降低了计算量,因此DSPP模块的加入没有降低检测速度.在网络中引入CA注意力机制后,使网络在复杂的背景中更加专注于感兴趣区域的关键信息,使AP提高了2.1%,由于CA注意力机制十分轻量化,所以FPS仅下降了0.4.

表6   本文算法在APID数据集上的消融实验结果

Table 6  Results of ablation experiments of our algorithm on APID dataset

实验Head1DSPPCAAPFPS
1---88.2%27.7
2--90.6%25.9
3--90.1%28.1
4--90.3%27.3
5-91.9%26.1
693.4%25.4

“-”表示不添加,“√”表示添加

新窗口打开| 下载CSV


4 结论

利用目标检测算法对航拍绝缘子图像进行缺陷检测一直受到许多科研团队和研究人员的关注.本文针对传统的目标检测算法对小目标的检测精度较低、特征表征能力较弱和提取的关键信息较少等问题,提出基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法AMF⁃YOLOv5l.首先,增加一个小目标检测头,提高模型对小目标的检测性能;接着,使用空洞卷积构造DSPP模块,充分融合多尺度特征,增强特征图的表征能力;然后引入CA注意力机制,使模型能够在背景复杂的图像中排除干扰,专注于关键信息;最后,实验结果证明本文提出的AMF⁃YOLOv5l具有明显优势,充分证明该方法在航拍绝缘子图像的缺陷检测任务中的有效性.在接下来的研究工作中,将尝试研究更加轻量级的网络,在满足检测精度和速度要求的同时,让模型能够更灵活便捷地部署在无人机等移动终端上.

参考文献

Govindaraju PSaranya KMuniraj C.

Condition monitoring of transmission line insulators using PMU for smart grid environment

2016 6th International Conference on Intelligent and Advanced Systems. Kuala Lumpur,MalaysiaIEEE20161-6.

[本文引用: 1]

He S YWang LXia Yet al.

Insulator recognition based on moments invariant features and cascade AdaBoost classifier

Applied Mechanics and Materials,2013(433-435):362-367.

[本文引用: 1]

Girshick RDonahue JDarrell Tet al.

Rich feature hierarchies for accurate object detection and semantic segmentation

Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus,OH,USAIEEE2014580-587.

[本文引用: 1]

Girshick R.

Fast R⁃CNN

Proceedings of 2015 IEEE International Conference on Computer Vision. Santiago,ChileIEEE20151440-1448.

[本文引用: 1]

Ren S QHe K MGirshick Ret al.

Faster R⁃CNN:Towards real⁃time object detection with region proposal networks

Proceedings of the 28th International Conference on Neural Information Processing Systems. Montreal,CanadaMIT Press201591-99.

[本文引用: 3]

Lin T YDollár PGirshick Ret al.

Feature pyramid networks for object detection

Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu,HI,USAIEEE2017936-944.

[本文引用: 1]

Liu WAnguelov DErhan Det al.

SSD:Single shot multiBox detector

The 14th European Conference on Computer Vision. Amsterdam,The NetherlandsSpringer201621-37.

[本文引用: 4]

Redmon JDivvala SGirshick Ret al.

You only look once

:Unified,real⁃time object detection∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas,NV,USAIEEE2016779-788.

[本文引用: 2]

Lin T YGoyal PGirshick Ret al.

Focal loss for dense object detection

Proceedings of 2017 IEEE International Conference on Computer Vision. Venice,ItalyIEEE20172999-3007.

[本文引用: 5]

Hu JShen LSun G.

Squeeze⁃and⁃excitation networks

Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City,UT,USAIEEE20187132-7141.

[本文引用: 1]

Hou Q BZhou D QFeng J S.

Coordinate attention for efficient mobile network design

Proceedings of 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville,TN,USAIEEE202113708-13717.

[本文引用: 2]

Liu SQi LQin H Fet al.

Path aggregation network for instance segmentation

Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City,UT,USAIEEE20188759-8768.

[本文引用: 1]

Zhou PNi B BGeng Cet al.

Scale⁃transferrable object detection

Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City,UT,USAIEEE2018528-537.

[本文引用: 1]

Liao G PYang G JTong W Tet al.

Study on power line insulator defect detection via improved faster region⁃based convolutional neural network

2019 IEEE 7th International Conference on Computer Science and Network Technology. Dalian,ChinaIEEE2019262-266.

[本文引用: 1]

赵文清张海明徐敏夫.

面向改进尺度缩放网络的绝缘子识别

中国图象图形学报,202126(11):2561-2570.

[本文引用: 1]

Zhao W QZhang H MXu M F.

Insulator recognition based on an improved scale⁃transferrable network

Journal of Image and Graphics,202126(11):2561-2570.

[本文引用: 1]

Yao L NQin Y Y. Insulator detection dased on GIOU⁃YOLOv3∥2020 Chinese Automation Congress. Shanghai,ChinaIEEE20205066-5071.

[本文引用: 1]

Wang S QLiu Y FQing Y Het al.

Detection of insulator defects with improved ResNeSt and region proposal network

IEEE Access,2020(8):184841-184850.

[本文引用: 1]

Zhu X KLyu S CWang Xet al.

TPH⁃YOLOv5:Improved YOLOv5 based on transformer prediction head for object detection on drone⁃captured scenarios

Proceedings of 2021 IEEE/CVF International Conference on Computer Vision. Montreal,CanadaIEEE20212778-2788.

[本文引用: 1]

Wang P QChen P FYuan Yet al.

Understanding convolution for semantic segmentation

2018 IEEE Winter Conference on Applications of Computer Vision. Lake Tahoe,NV,USAIEEE20181451-1460.

[本文引用: 1]

Qiao S YChen L CYuille A.

DetectoRS:Detecting objects with recursive feature pyramid and switchable atrous convolution

Proceedings of 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville,TN,USAIEEE202110208-10219.

[本文引用: 2]

Duran-Vega M AGonzalez⁃Mendoza MChang Let al.

TYolov5:A temporal Yolov5 detector based on quasi⁃recurrent neural networks for real⁃time handgun detection in video

2021,arXiv:.

[本文引用: 1]

Bochkovskiy AWang C YLiao H Y M.

YOLOv4:Optimal speed and accuracy of object detection

2020,arXiv:.

[本文引用: 1]

/