南京大学学报(自然科学), 2023, 59(4): 580-589 doi: 10.13232/j.cnki.jnju.2023.04.005

基于特征类内紧凑性的不平衡医学图像分类方法

孟元, 张轶哲,, 张功萱, 宋辉

南京理工大学计算机科学与工程学院,南京,210094

Imbalanced medical image classification based on intra⁃class compactness of features

Meng Yuan, Zhang Yizhe,, Zhang Gongxuan, Song Hui

School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing,210094,China

通讯作者: E⁃mail:zhangyizhe@njust.edu.cn

收稿日期: 2023-06-19  

基金资助: 国家自然科学基金.  62272232.  62201263
江苏省自然科学基金.  BK20220949

Received: 2023-06-19  

摘要

近些年,基于深度学习的算法和模型在各种图像分析任务中都取得了显著的成功,与常见的自然图像相比,医学图像数据集依然面临高度不平衡的问题,不平衡数据会导致特征空间里的决策边缘倾向样本多的类别,导致分类效果的下降.为了解决该问题,提出一种基于卷积神经网络考虑特征类内紧凑性的不平衡医学图像分类方法(Z⁃Score Compactness⁃based Convolutional Neural Network,ZC3NC).首先,从一个卷积神经网络的最后一层卷积层提取训练集样本与测试集样本的特征图,随后引入一个新的Z分数来度量测试集数据的特征图相对训练集每个类在特征空间上的偏离度,偏离度的度量基于类内的紧凑度,其主要关注样本的分布特性,对各类样本数量的不平衡性不敏感.最终,根据计算的偏离度,对测试集的数据进行分类.在DermaMNIST数据集上的实验表明,在不对数据和神经网络模型做任何额外增强的情况下,该方法的平衡准确率比原卷积神经网络模型平均提高11.15%,最多提高14.08%,证明提出的分类方法能有效地提高多种卷积神经网络对不平衡医学图像数据的分类性能.此外,和最先进的不平衡分类方法Under⁃Bagging KNN相比,该方法的性能平均提升了2.36%.

关键词: 卷积神经网络 ; 类别不平衡 ; 医学图像 ; 特征 ; 分类

Abstract

In recent years,algorithms and models based on deep learning have achieved significant success in various image analysis tasks. However,compared to common natural images,medical image datasets often face highly imbalanced problems,which lead to decreased classification performance. Imbalanced data causes decision boundaries in the feature space to tend towards the class with more samples. To solve this problem,this paper proposes an imbalanced medical image classification method based on convolutional neural networks considering intra⁃class compactness of features (Z⁃Score Compactness⁃based Convolutional Neural Network,ZC3NC). First,feature maps of training and testing set samples are extracted from the last convolutional layer of a convolutional neural network. Then,we introduce a new Z⁃score based measure to test the deviation of the testing set data feature maps relative to each class of the training set in the feature space. The measure of deviation is based on intra⁃class compactness,which focuses on the distribution characteristics of the samples and is insensitive to the imbalance of the number of samples in each class. Finally,based on the calculated deviation,we classify the testing set data. Experiments on the DermaMNIST dataset show that without any additional data or neural network model enhancements,the balanced accuracy of the proposed method increases by an average of 11.15% compared to the original convolutional neural network model,with a maximum increase of 14.08%. This verifies that the proposed classification method effectively improves the classification performance of various convolutional neural networks for imbalanced medical image data. Furthermore,compared to the state⁃of⁃the⁃art imbalanced classification method,Under⁃bagging KNN,the average improvement of ZC3NC is 2.36%

Keywords: convolutional neural network ; class imbalance ; medical image ; feature ; classification

PDF (1007KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

孟元, 张轶哲, 张功萱, 宋辉. 基于特征类内紧凑性的不平衡医学图像分类方法. 南京大学学报(自然科学)[J], 2023, 59(4): 580-589 doi:10.13232/j.cnki.jnju.2023.04.005

Meng Yuan, Zhang Yizhe, Zhang Gongxuan, Song Hui. Imbalanced medical image classification based on intra⁃class compactness of features. Journal of nanjing University[J], 2023, 59(4): 580-589 doi:10.13232/j.cnki.jnju.2023.04.005

目前的医疗实践中,临床医生对疾病监测和诊断的主观判断可能存在误差1,为了克服这一问题,研究者提出了许多计算机辅助检测和诊断方法来帮助临床医生更有效地阅读医学图像并作出诊断决策.医学图像分类是其中的热点研究之一,通过该方法可以将从CT、X射线、皮肤镜等医学检测中得到的不同图像正确地划分到各自的类别中,协助医生得到更可靠的诊断结果2.

近年来,深度学习已经成为医学图像分类中使用最广泛的技术之一3,其优势是在处理非常复杂的数据时,可以在训练过程中自动提取特征,并利用多层次的神经网络对数据进行抽象表示,提高分类器的性能.然而,由于在医学环境中收集罕见疾病或其他不寻常的实例的固有困难以及获取医学图像数据和标记的高昂成本或隐私风险,许多医学图像的数据集具有高度不平衡的长尾分布(Long⁃Tailed Distributions)的特点4,即常见病拥有最多的样本数量,而罕见疾病的样本数量极少.如图1所示,在色素性皮肤病变的多源皮肤镜图像数据集DermaMNIST5的训练集中,占比最高的一个疾病类别的样本量比其他的类别样本的总和更多.由于深度学习技术普遍需要足够的图像来进行训练,这种高度不平衡会导致模型在部分疾病类上的表现明显下降6,这对于临床诊断是不可接受的.

图1

图1   DermaMNIST数据集中各类别的数量

Fig.1   Class distribution of the DermaMNIST dataset


为了提高深度学习对不平衡医学图像数据集的分类性能,研究者主要从数据和模型两个层面进行改进.从数据的角度出发,主要是结合欠采样(Under⁃Sampling)和过采样(Over⁃Sampling)两种方法7.Hassan and Haque8采用可调Q因子小波变换信号处理技术和RUSBoost分类模型来设计自动阻塞性睡眠呼吸暂停的筛选方案,结合随机欠采样方法训练分类网络,实现睡眠呼吸暂停的自动检测.Xu et al9设计了一种混合采样算法,将面向错误分类的合成少数过采样技术(M⁃SMOTE)和基于随机的编辑最近邻欠采样(Edited Nearest Neighbours,ENN)相结合,并动态调整M⁃SMOTE和ENN的几率,可以利用甲状腺功能体检图像来筛查甲状腺功能的异常.在模型层面,研究者使用修改模型来强调少数类的重要性.Ghorbani et al10基于图卷积网络,提出一种重新加权的对抗图卷积网络,在训练时对类样本加权并改变每个样本对分类器的重要性.此外,还有一些研究者使用集成学习的方法将多个模型结合到一个任务中,在数据不平衡场景下也取得了很好的表现.然而,以上大部分解决方案都缺乏通用性,对其他模型不兼容,或者和原模型相比使用难度更高11.

针对上述挑战,本文提出一种适用于多种卷积神经网络的基于特征类内紧凑性的不平衡医学图像分类方法ZC3NC,无须重新训练即可进一步优化已有卷积神经网络模型在不平衡数据集上的分类结果.该方法的大致流程:首先,得到训练集训练完成的模型最后一层卷积层的特征图并按类集群,计算得到类内紧凑性信息;然后得到测试集特征图,引入Z分数来衡量未知类特征图偏离每个类的程度,实现对网络的分类优化.在Derma⁃MNIST和EyePacs数据集上,分别将该方法应用于ResNet18,ResNet50,ResNeXt50和GoogLe⁃Net四类卷积神经网络进行分类,结果其平衡准确率分别比原模型平均提升11.15%和7.02%,显示出良好的性能和对不同网络的适用性.

1 背景知识

1.1 卷积神经网络

卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,由一系列卷积层、池化层、全连接层组成,现已被广泛应用于图像分析和语音信号处理等任务12,如图2所示.

图2

图2   卷积神经网络的结构

Fig.2   The architecture of CNN


其中,卷积层是CNN的核心,每个卷积层包括多个可学习的卷积核,负责对输入图像进行扫描,生成一组高维特征图.每个卷积核可以捕捉输入图像的某种特定模式,如边缘、纹理、形状等,其计算如式(1)所示:

y=fwixi+bi

其中,xi是第i层卷积的输入数据,是卷积计算,wi是卷积核权重矩阵,bi是偏置项,f表示激活函数,y是输出特征图.

池化层是CNN的降采样层,可以降低特征图的维度,减少模型参数和计算量,在保留重要信息的同时避免过拟合.

全连接层是CNN的输出层,负责将池化层输出的特征图展开成一维向量,并通过权重矩阵和偏置向量与输出节点相结合,最后由输出节点对应模型的分类或回归任务.

1.2 Z分数(Z⁃Score)

也称标准分数(Standard Score),是统计学中常用的一个概念,表示某一数据点与其所在数据集的平均值之间的差异,以标准差的形式来衡量,其计算如式(2)所示:

Z=𝒳-μσ

其中,𝒳是需要测量的值,μ代表总体的平均值,σ代表总体标准差.

Z分数是一种测量某分数在分布中相对位置的方法13,可以描述需要测量的值高于或低于某特定总体平均值的标准偏差.Z分数的绝对值越大,说明其偏离该平均值的程度越大,差异越显著.如今,Z分数已被广泛应用于数据归一化、异常检测、财务状况预测等领域14.

1.3 类内紧凑性

类内紧凑性(Intra⁃Class Compactness)被用于衡量同一类别内部样本的近似程度和聚集性,机器学习任务中通常希望同一类别的样本彼此之间更加接近,形成更紧凑的簇,这有助于提高分类准确性,降低泛化误差,增强模型的可解释性15.类内紧凑性可以通过计算样本之间的距离或相似度来度量,例如方差、类内平均距离和DB指数等.较小的类内距离表示同一类别内的样本更相似,而较大的类内距离则意味着类内分散性较高,样本之间的差异性更大.

本文不关注如何修改模型或样本来提高某一类别特征的类内紧凑性,而是考虑利用不同类之间类内紧凑性的差异,比较测试集特征图和不同类训练集特征图的实际偏离程度,进而提升不平衡数据集的分类效果.

2 ZC3NC方法

本文提出的ZC3NC方法的基本结构如图3所示.ZC3NC主要包含两个部分:基础网络模块和度量模块.其中,基础网络模块即需要提升的卷积神经网络,用于对训练集和测试集数据进行特征提取;度量模块在基础网络模块的最后一个卷积层末端引入,用于度量未知类特征图偏离测试集各类特征图集合的程度.

图3

图3   基于特征类内紧凑性的不平衡医学图像分类方法框架

Fig.3   The framework for imbalanced medical image classification based on intra⁃class compactness of features


2.1 特征提取

特征(feature)指图片在经过CNN堆叠的卷积层和池化层后产生的结果,Ali Amirshahi et al16证明,通过CNN提取图像的特征在大多数质量衡量标准中优于其他方法制作的特征.

本文用Q:n0,1c表示分类神经网络,其中,xn是输入数据,c是类别数.设网络QL层,Ql代表网络的第l层,ql代表第l层的输出(其中q0=x),即输入x通过第一层到第l层的非线性变换后获得的特征图.网络Q的每一层都允许提取和输入x的独特特征,而卷积神经网络的最后一层卷积层,即网络的倒数第二层Ql-1通常会提取对于分辨输入类很重要的特征17.因此,本文方法将从卷积神经网络中提取训练集和测试集图像的qL-1用于度量模块.

图4展示了在DermaMNIST数据集上训练的ResNet18模型倒数第二层提取的特征的二维表示,通过DensMAP算法18-19进行了可视化,可以直观地看出数据集中不同类的特征已被较好地分隔开.

图4

图4   在DermaMNIST上训练的ResNet18模型的倒数第二层中提取的特征的二维表示

Fig.4   Two⁃dimensional representations of features extracted from a ResNet18 model trained on the Derma⁃MNIST dataset


2.2 度量模块原理

通过提取训练集和测试集的特征图来分析图像是很常见的方法,然而其中大多数都是直接比较特征之间的距离或重新训练新的分类器模型.这类方法仅能体现类内或类间的相对关系20,却没有考虑同类特征图之间的距离、方差等类内要素,忽略了测试集特征图和训练集特征图的实际偏离程度.在特征空间中分类新样本时可能出现如图5所示的情况,无论是将新样本特征图与最近邻居A*,B*比较,或与两类中心点值A,B比较,都可能错误地将该样本分类为类别2,因此无法提升分类效果.

图5

图5   在特征空间比较新样本的示意图

Fig.5   Illustration of comparing new samples in the feature space


针对上述问题,本文认为应当在样本分类时重点考虑某些类别样本特征图内部的紧凑性,以此为依据,重新确定拥有更远绝对距离但更近相对距离的特征图的分类情况.因此,本文提出利用Z分数对测试集特征与不同类训练集特征集群之间的偏差程度进行度量并分类.

具体地,度量模块首先将训练集样本的特征图按类集群,分别计算每类集群内特征图两两之间的距离,并求平均距离及其标准差,以此表示不同类训练集特征图的类内紧凑性.然后,将新样本特征图分别与每个类的样本特征计算平均距离,最后代入Z分数得到新样本相对于每个类的偏差程度,以此判断新样本的类别.

2.3 ZC3NC算法

本方法的算法流程图如图6所示,算法流程如下.

图6

图6   ZC3NC算法的流程图

输入:不平衡数据集的训练集Dtrain,测试集未知类图像Dtest.

输出:Dtest分类结果.

Fig.6   The algorithm flowchart of ZC3NC


1.使用训练好的卷积神经网络模型,从最后一层卷积层Ql-1分别提取Dtrain中每类的特征图qiDtest特征图q˜.

2.计算训练集每类特征集合qi内部特征两两之间的距离矩阵AN×Ni,如式(3)所示:

AN×Ni=qi1,qi1qi1,qiNqiN,qi1qiN,qiN

其中,x,y表示特征xy之间的欧式距离,N是集合qi中特征的数量.

3.计算集合qi的矩阵AN×Ni的平均距离μqi和标准差σqi,如式(4)和式(5)所示:

μqi=1N2a=1Nb=1NAa,b
σqi=1N2a=1Nb=1NAa,b-μqi2

4.使用测试集特征q˜,分别与训练集每类特征图集合qi的计算平均距离distanceq˜,qi,如式(6)所示:

distanceq˜,qi=1Nn=1Nq˜,qin

5.将训练集特征集qi的平均距离μqi、标准差σqi和特征q˜与集合qi的平均距离distanceq˜,qi代入式(1),计算新样本相对于类i的偏差程度zi并求绝对值,若distanceq˜,qi-μqi取负,绝对值越大同样说明特征过于紧凑,如式(7)所示:

zi=distanceq˜,qi-μqiσqi

其中,训练集特征集qi相对于m类集合的偏差程度zi,形成数列=z1,z2,,zm.

6.取数列的最小值所在索引作为分类结果,如式(8)所示:

y^=argminz1,z2,,zm

3 实验与结果分析

本文对方法的验证主要包括三部分:

(1)构建ResNet18,ResNet50,ResNeXt50和GoogLeNet四类卷积神经网络并设计网络参数,在数据集中进行训练和测试.

(2)从上述四类卷积神经网络中提取特征图,应用ZC3NC方法与原模型进行比较,验证方法的有效性.

(3)应用本文方法与多种不平衡数据集分类方法进行比较.

3.1 实验数据集

为了验证提出的ZC3NC分类方法的有效性,在色素性皮肤病变的多源皮肤镜图像数据集DermaMNIST和糖尿病视网膜病变图像数据集EyePacs21上进行实验.数据集的大小、类别数和不平衡比等详细信息如表1所示.

表1   实验使用的数据集信息

Table 1  Information of datasets used in experiments

DatasetsInstancesClassesMajorityMinorityIR
DermaMNIST10015766.95%1.15%58.30
EyePacs88702573.67%2.16%34.14

新窗口打开| 下载CSV


其中,不平衡比率(Imbalance Ratio,IR22是最多数类的样本量与最少数类的样本量之比,IR越大,代表数据集的不平衡程度越大.

DermaMNIST是基于色素性皮肤病变的多源皮肤镜图像数据集HAM1000023处理得到的,作为MedMNIST的一个子集用于多类分类任务.该数据集由10015张皮肤镜图像组成,被标记成七个不同类别,分别是黑色素瘤(Melanoma,MEL)、黑色素细胞痣(Melanocytic nevus,NV)、基底细胞癌(Basal Cell Carcinoma,BCC)、光化性角化病(Actinic Keratosis,AKIEC)、良性角化病(Benign Keratosis,BKL)、皮肤纤维瘤(Dermatofibroma,DF)和血管病变(Vascular Lesion,VASC).以7∶1∶2的比例将数据集图像分为训练集、验证集和测试集,并将图像由3×600×450调整为3×28×28,示例图片如图7所示.

图7

图7   DermaMNIST数据集的部分示例图片

Fig 7   Partial examples of images of the DermaMNIST dataset


EyePacs是糖尿病视网膜病变(Diabetic Retinopathy,DR)分级任务中最大的公开数据集,被标记了属于五种可能的DR分级,范围从DR0(无DR)到DR4(增生性DR).该数据库包括约35000个训练样本和55000个测试集样本,并使用10%的训练集图像作为验证集,如图8所示.

图8

图8   Eyepacs数据集的DR分级

Fig.8   DR grading of the EyePACS dataset


3.2 实验细节

采用Pytorch框架,在NVIDIA GeForce2080 Ti GPU 48 GB RBM的Ubantu18服务器上训练.选用Torchvision24提供的结构用于对比和提取特征的卷积神经网络模型.依照数据集推荐的超参数设置,训练网络时Batch大小为256,最初学习率为0.01,使用Multistep策略调整,衰减学习率为0.1,epoch的最大训练值为100.选取交叉熵损失函数(Cross⁃EntropyLoss)和自适应矩估计(Adaptive Moment Estimation,Adam)优化器,并加入样本类权重进行训练.

3.3 评价指标

对于不平衡数据集的分类,准确率不能很好地反映一个分类算法的性能.本文选取了更适应不平衡数据集的评价指标——平衡准确度(Balanced Accuracy,Balanced ACC)和加权精确度(Weighted⁃Precision,Weighted⁃P).

Balanced ACC本质上是召回率的算术平均值,它给予每个类以同样的重要性,可以更好地预测整个不平衡数据集25-26,如式(9)所示:

Balanced ACC=1Ci=0C-1TPiTPi+FNi

Weighted⁃P是一种综合考虑各个类别样本数量和预测准确性的指标,其原理是将每个类别的精确度(Precision)和该类别在总样本中的比例相乘,然后求和27,如式(10)所示:

Weighted-P=i=1CTPiTPi+FPi×TPi+FNij=1CTPj+FNj

式(9)和式(10)中,C代表数据集的种类数;TP代表真正类,即实际为正类且预测也为正的样本数;FN代表假负类,即实际为正类且预测为负类的样本数;FP为假正类,即实际为负类且预测为正类的样本数.

3.4 实验结果与分析

为了验证ZC3NC的通用性和有效性,分别在DermaMNIST和EyePacs数据集上使用四类卷积神经网络ResNet18,ResNet5028,ResNeXt5029和GoogLeNet30进行测试,将本文方法与原模型结果进行比较.

在DermaMNIST数据集上的对比实验结果如表2所示,表中黑体字表示最优的性能.由表可见,ZC3NC的两个指标比未应用本方法的原模型都有提升,其中Balanced ACC平均提升11.15%,Weighted⁃P平均提升2.33%.

表2   在DermaMNIST数据集上的实验结果

Table 2  Experimental results of different algorithms on the DermaMNIST dataset

模型原模型原模型+ZC3NC
Balanced ACCWeighted⁃PBalanced ACCWeighted⁃P
Avg54.32%73.91%60.56%75.63%
ResNet1856.51%74.64%64.46%76.46%
ResNet5045.62%70.46%53.10%72.39%
ResNeXt5053.18%72.84%57.30%75.77%
GoogLeNet61.98%77.71%67.36%77.90%

新窗口打开| 下载CSV


图9展示了在DermaMNIST数据集上训练的ResNet18模型倒数第二层提取的训练集和部分测试集特征的二维表示,其中圆点代表训练集特征图,三角代表测试集中原模型未成功分类而ZC3NC成功分类的特征图.由图可见,部分三角距离其他类的绝对距离更近但仍被ZC3NC方法成功分类.

图9

图9   训练集和部分测试集特征的二维表示

Fig 9   Two⁃dimensional representation of training set and partial test set features


在EyePacs数据集上的对比实验结果如表3所示,表中黑体字表示最优的性能.应用本文方法的Balanced ACC均大于原模型,只在GoogLeNet模型上Weighted⁃P稍低,但差距很小.平均来说,和原模型相比,应用ZC3NC的Balanced ACC提升7.02%,Weighted⁃P提升0.16%.

表3   在EyePacs数据集上的实验结果

Table 3  Experimental results of different algorithms on the EyePacs dataset

模型原模型原模型+ZC3NC
Balanced ACCWeighted⁃PBalanced ACCWeighted⁃P
Avg47.89%73.16%51.25%73.27%
ResNet1847.19%72.48%51.11%72.54%
ResNet5047.70%73.65%51.92%73.94%
ResNeXt5048.19%73.93%52.34%74.39%
GoogLeNet48.46%72.57%49.63%72.22%

新窗口打开| 下载CSV


在DermaMNIST和EyePacs数据集上,分别与经典处理高度不平衡数据集的方法SMOTE (Synthetic Minority Oversampling Technique)31,K⁃Means SMOTE (KMSMOTE)32和目前最先进的处理高度不平衡数据集的集成学习方法Under⁃Bagging KNN (UbKNN)33进行对比实验.UbKNN利用Bagging结合欠采样技术生成平衡数据集,并使用KNN算法进行分类,从理论和实验两方面验证了ZC3NC的Balanced ACC的优势.对比实验结果如表4表5所示,表中黑体字表示最优的性能.由表可见,ZC3NC的Balanced ACC和Weighted⁃P两个指标在所有卷积神经网络模型上都稍优于上述三种方法.

表4   各算法在DermaMNIST数据集上的对比实验结果

Table 4  Experimental results of different algorithms on the DermaMNIST dataset

模型SMOTEKMSMOTEUbKNNZC3NC
Balanced ACCWeighted⁃PBalanced ACCWeighted⁃PBalanced ACCWeighted⁃PBalanced ACCWeighted⁃P
Avg57.66%74.35%56.33%73.89%60.24%74.69%60.56%75.63%
ResNet1860.65%73.25%59.00%74.92%64.07%76.12%64.46%76.46%
ResNet5049.87%71.89%47.15%70.71%52.94%72.16%53.10%72.39%
ResNeXt5055.34%73.35%52.60%72.35%57.05%73.84%57.30%75.77%
GoogLeNet64.75%76.92%66.57%77.59%66.91%76.62%67.36%77.90%

新窗口打开| 下载CSV


表5   各算法在EyePacs数据集上的对比实验结果

Table 5  Experimental results of different algorithms on the EyePacs dataset

模型SMOTEKMSMOTEUbKNNZC3NC
Balanced ACCWeighted⁃PBalanced ACCWeighted⁃PBalanced ACCWeighted⁃PBalanced ACCWeighted⁃P
Avg46.85%72.24%47.89%72.49%48.71%71.94%51.25%73.27%
ResNet1846.54%70.77%48.09%72.26%48.77%71.05%51.11%72.54%
ResNet5046.02%73.91%46.66%73.01%48.83%72.52%51.92%73.94%
ResNeXt5047.46%74.28%49.72%74.35%48.19%72.78%52.34%74.39%
GoogLeNet47.38%70.00%46.89%70.34%49.05%71.41%49.63%72.22%

新窗口打开| 下载CSV


图10图11展示了DermaMNIST和Eye⁃Pacs数据集上,上述各种方法在四类卷积神经网络中的平均表现,图中黑体字表示最优的性能.

图10

图10   各算法在DermaMNIST数据集上对比实验的平均结果

Fig.10   Average experimental results of different algorithms on the DermaMNIST dataset


图11

图11   各算法在EyePacs数据集上对比实验的平均结果

Fig.11   Average experimental results of different algorithms on the EyePacs dataset


综上,ZC3NC方法有效提升了各类卷积神经网络在不平衡医学图像数据集上的分类性能,与经典不平衡分类方法以及最先进的方法相比,均表现相近或有一定优势,证明本文方法是一种有效的改进算法,适用于多种卷积神经网络.

4 结论

本文针对卷积神经网络面对不平衡医学图像数据集的分类困难,提出一种基于特征类内紧凑性的不平衡医学图像分类方法ZC3NC,通过比较测试集特征图和不同类训练集特征图的实际偏离程度进行分类,达到了较好的分类效果,并在多个卷积神经网络和数据集中进行了验证.

未来将在比较特征类内紧凑性的同时,结合类间松散度进一步提升方法性能,并进一步探索特征空间信息,使其能适应平衡样本分类任务.

参考文献

Chen X XWang X MZhang Ket al.

Recent advances and clinical applications of deep learning in medical image analysis

Medical Image Analysis,2022(79):102444.

[本文引用: 1]

郑光远刘峡壁韩光辉.

医学影像计算机辅助检测与诊断系统综述

软件学报,201829(5):1471-1514.

[本文引用: 1]

Zheng G YLiu X BHan G H.

Survey on medical image computer aided detection and diagnosis systems

Journal of Software,201829(5):1471-1514.

[本文引用: 1]

Cai LGao J YZhao D.

A review of the application of deep learning in medical image classification and segmentation

Annals of Translational Medicine,20208(11):713.

[本文引用: 1]

Singh RBharti VPurohit Vet al.

MetaMed:Few⁃shot medical image classification using gradient⁃based meta⁃learning

Pattern Recognition,2021(120):108111.

[本文引用: 1]

Yang J CShi RWei D Let al.

MedMNIST v2:A large⁃scale lightweight benchmark for 2D and 3D biomedical image classification

Scientific Data,202310(1):41.

[本文引用: 1]

Quellec GLamard MConze P Het al.

Automatic detection of rare pathologies in fundus photographs using few⁃shot learning

Medical Image Analysis,2020(1):101660.

[本文引用: 1]

Batista G E A P APrati R CMonard M C.

A study of the behavior of several methods for balancing machine learning training data

ACM SIGKDD Explorations Newsletter,20046(1):20-29.

[本文引用: 1]

Hassan A RHaque M A.

An expert system for automated identification of obstructive sleep apnea from single⁃lead ECG using random under sampling boosting

Neurocomputing,2017(235):122-130.

[本文引用: 1]

Xu Z ZShen D RNie T Zet al.

A hybrid sampling algorithm combining M⁃SMOTE and ENN based on random forest for medical imbalanced data

Journal of Biomedical Informatics,2020(107):103465.

[本文引用: 1]

Ghorbani MKazi ABaghshah M Set al.

RA⁃GCN:Graph convolutional network for disease prediction problems with imbalanced data

Medical Image Analysis,2022(75):102272.

[本文引用: 1]

Frid⁃Adar MDiamant IKlang Eet al.

GAN⁃based synthetic medical image augmentation for increased CNN performance in liver lesion classification

Neurocomputing,2018(321):321-331.

[本文引用: 1]

Li Z WLiu FYang W Jet al.

A survey of convolutional neural networks:Analysis,appli⁃cations,and prospects

IEEE Transactions on Neural Networks and Learning Systems,202233(12):6999-7019.

[本文引用: 1]

Curtis A ESmith T AZiganshin B Aet al.

The mystery of the Z⁃score

Aorta,20164(4):124-130.

[本文引用: 1]

Kirkwood B RSterne J A C. Essential medical statistics. New YorkJohn Wiley & Sons2010126-128.

[本文引用: 1]

Wen Y DZhang K PLi Z Fet al.

A discriminative feature learning approach for deep face recognition

The 14th European Conference on Computer Vision. Springer Berlin Heidelberg,2016499-515.

[本文引用: 1]

Ali Amirshahi SPedersen MYu S X.

Image quality assessment by comparing CNN features between images

Journal of Imaging Science and Technology,201660(1):060410.

[本文引用: 1]

Abdelzad VCzarnecki KSalay Ret al.

Detecting out⁃of⁃distribution inputs in deep neural networks using an early⁃layer output

2019,arXiv:.

[本文引用: 1]

Narayan ABerger BCho H.

Assessing single⁃cell transcriptomic variability through density⁃preserving data visualization

Nature Biotechnology,202139(6):765-774.

[本文引用: 1]

McInnes LHealy JMelville J.

Umap:Uniform manifold approximation and projection for dimension reduction

2018,arXiv:.

[本文引用: 1]

Pang T YXu KDong Y Pet al.

Rethinking softmax cross⁃entropy loss for adversarial robustness

The 8th International Conference on Learning Representations. Addis Ababa,EthiopiaOpenReview.net2020,arXiv:.

[本文引用: 1]

Galdran ACarneiro GBallester M A G.

Balanced⁃mixup for highly imbalanced medical image classification

The 24th International Conference on Medical Image Computing and Computer:Assisted Intervention. Springer Berlin Heidelberg,2021323-333.

[本文引用: 1]

Zhu RGuo Y WXue J H.

Adjusting the imbalance ratio by the dimensionality of imbalanced data

Pattern Recognition Letters,2020(133):217-223.

[本文引用: 1]

Tschandl PRosendahl CKittler H.

The HAM10000 dataset,a large collection of multi⁃source dermatoscopic images of common pigmented skin lesions

Scientific Data,20185(1):180161.

[本文引用: 1]

Marcel SRodriguez Y.

Torchvision the machine⁃vision package of torch

Proceedings of the 18th ACM International Conference on Multimedia. Firenze,ItalyACM20101485-1488.

[本文引用: 1]

Grandini MBagli EVisani G.

Metrics for multi⁃class classification:An overview

2020,arXiv:2008. 05756.

[本文引用: 1]

Flach P A.

Performance evaluation in machine learning:The good,the bad,the ugly,and the way forward

Proceedings of the AAAI Conference on Artificial Intelligence. Honolulu,HI,USAAAAI Press20199808-9814.

[本文引用: 1]

Xu H YZhang HHan Ket al.

Learning alignment for multimodal emotion recognition from speech

∥Interspeech 2019,the 20th Annual Conference of the International Speech Communication Association. Graz,AustriaISCA20193569-3573.

[本文引用: 1]

He K MZhang X YRen S Qet al.

Deep residual learning for image recognition

Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas,NV,USAIEEE2016770-778.

[本文引用: 1]

Xie S NGirshick RDollár Pet al.

Aggregated residual transformations for deep neural networks

Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu,HI,USAIEEE20175987-5995.

[本文引用: 1]

Szegedy CLiu WJia Y Qet al.

Going deeper with convolutions

Proceedings of 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston,MA,USAIEEE20151-9.

[本文引用: 1]

刘娜.

面向非平衡数据的医疗智能诊断与决策支持研究

博士学位论文. 天津天津大学2021.

[本文引用: 1]

Liu N. Research on medical intelligent diagnosis and decision support based on imbalanced data. Ph.D. Dissertation. TianjinTianjin University2021.

[本文引用: 1]

Douzas GBacao FLast F.

Improving imbalanced learning through a heuristic oversampling method based on k⁃means and SMOTE

Information Sciences,2018(465):1-20.

[本文引用: 1]

Hang H YCai Y CYang H Fet al.

Under⁃bagging nearest neighbors for imbalanced classification

The Journal of Machine Learning Research,202223(1):118.

[本文引用: 1]

/