南京大学学报(自然科学), 2023, 59(5): 752-758 doi: 10.13232/j.cnki.jnju.2023.05.003

基于cGAN的下采样LG谱图像优化重建

叶皓1,*, 王麓懿2,*, 吴雪炜,1, 张勇2

1.固体微结构物理国家重点实验室,南京大学物理学院,南京,210093

2.南京大学现代工程与应用科学学院,南京,210023

Optimal image reconstruction from down⁃sampled LG spectrum based on cGAN

Ye Hao1,*, Wang Luyi2,*, Wu Xuewei,1, Zhang Yong2

1.National Laboratory of Solid State Microstructures,School of Physics,Nanjing University,Nanjing,210093,China

2.College of Engineering and Applied Sciences,Nanjing University,Nanjing,210023,China

通讯作者: E⁃mail:wuxuewei@nju.edu.cn

第一联系人: 共同第一作者,

收稿日期: 2023-07-20  

基金资助: 中央高校基本业务费.  021314380220
南京大学技术创新基金.  020414913416

Received: 2023-07-20  

摘要

对于复杂图像的拉盖尔高斯(Laguerre⁃Gaussian,LG)谱成像,因为满足奈奎斯特采样率的高阶LG模式系数无法测得,重建图像的失真不可避免,而神经网络算法通过先验学习,可以对失真图像实现较为清晰的复原.提出基于条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)的图像优化重建方法,在处理下采样的LG谱单像素成像和旋转运动模糊图像中均取得了较好的效果.在1.87%的LG谱采样率下,该方法能将Kaggle数据集人像二值图像的结构相似性(Structural Similarity,SSIM)指数提升至0.8以上,和经典图像去噪算法相比有显著提升.

关键词: 频谱下采样 ; 拉盖尔高斯模式 ; cGAN ; 图像优化重建 ; 单像素成像 ; 旋转运动模糊图像复原

Abstract

For Laguerre⁃Gaussian (LG) spectral imaging under Nyquist sampling rate,the reconstructed images are generally distorted because it is difficult to measure the higher⁃order LG mode coefficients. The neural network algorithm can be used to restore these images through prior learning. In this paper,we propose an optimal image reconstruction method based on Conditional Generative Adversarial Nets (cGAN),which works well in down⁃sampled LG spectral single⁃pixel imaging and rotational motion blur recovery in LG spectral domain. We use the portrait binary images from Kaggle dataset as an example. At a sampling rate of 1.87%,the structural similarity (SSIM) index by using our method reaches 0.8 and above,which is significantly improved comparing with classical image denoising algorithms.

Keywords: spectrum down sampling ; Laguerre⁃Gaussian mode ; cGAN ; optimal image reconstruction ; single⁃pixel imaging ; rotational motion blurred images restoration

PDF (1241KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

叶皓, 王麓懿, 吴雪炜, 张勇. 基于cGAN的下采样LG谱图像优化重建. 南京大学学报(自然科学)[J], 2023, 59(5): 752-758 doi:10.13232/j.cnki.jnju.2023.05.003

Ye Hao, Wang Luyi, Wu Xuewei, Zhang Yong. Optimal image reconstruction from down⁃sampled LG spectrum based on cGAN. Journal of nanjing University[J], 2023, 59(5): 752-758 doi:10.13232/j.cnki.jnju.2023.05.003

图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等1.频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法2-3虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势4,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量5.

拉盖尔高斯(Laguerre⁃Gaussian,LG)模式是激光谐振器腔内的一种本征模式,在柱坐标下对亥姆赫兹方程做傍轴近似6,其解析解可以表示如下

LGl,pr,φ=2p!πp+l!1ω02rω0lLpl2r2ω02exp-r2ω02expilφ=LGl,prexpilφ        

式(1)为LG光束在传播距离为0处的横向分布,其中l为角向指数,取任意整数;p为径向指数,取大于0的整数;Lpl为拉盖尔多项式;ω0为束腰半径.可将LG光束描述为径向分布LGl,pr与角向分布expilφ之积,其中角向指数l与径向指数p的任意组合形成不同的LG模式,所有LG模式构成一组完备正交基底.傅里叶基底构成的变换域为图像频谱,而相应LG基底构成的变换域为图像LG谱7.LG谱采样是一种频谱采样手段,具有较高的采样效率.此外,由于LG模式具有的圆对称横向空间分布,在空间上具有旋转不变的特性8,其在角向探测方面具有独特优势,广泛应用于小角度测量、对称性物体识别、动态旋转物体成像等领域9.

在单像素成像过程,通过投影一定数量的LG模式,可得到图像的下采样LG谱10.如图1a所示,入射光经过一台数字微镜(DMD),其具有像素级编码与高帧率刷新功能,用于加载并切换产生LG模式的全息图.产生的LG模式经过透镜成像系统投影至目标物体,目标物体的反射光经聚焦透镜汇聚并由一台单点探测器采集.单点探测器采集到的信号强度可以表示为:

I=lpUr,φLGl,prcosφl+θ

图1

图1   LG谱采样的单像素成像系统(a);不同的LG模式截止阶数及其对应的重建图像:(b~c) l25 p25,(d~e) l50 p50和(f~g) l75 p75

Fig.1   Single⁃pixel imaging system of LG spectrum sampling (a),different ranges of LG spectrum and the reconstructed images:(b~c) l25 p25,(d~e) l50 p50 and (f~g) l75 p75


其中,Ur,φ为目标物光场分布,θ为LG模式的附加相移.当相移θ分别取值0,π/2,π,3π/2时,构成图像的某一阶次LG谱模式系数Al,p

I0-Iπ+iI3π/2-Iπ/2=lpUr,φLGl,prcoslφ+isinlφ=lpUr,φLGl,prexpilφ=Al,p

通过数字微镜器件(Digital Micromirror Devices,DMD)切换大量不同的LG模式,即可计算得到物像的LG谱.图1b,1d和1f是截止阶数分别为25,50和75的下采样LG谱,其中横坐标为角向指数l,纵坐标为径向指数p,图1c,1e和1g分别为对应的重建图像.由图可见,当采样率较低、LG模式截止阶数较小时,重建图像的视场较小,清晰度较差,随着截止阶数的增大,重建图像的细节恢复变好,图像噪声也变弱.并且,由于LG模式具有独特的径向参量,截止阶数较小,重建图像在径向具有明显的噪声.因此,在低采样率下提升单像素LG谱下采样的成像质量具有实际的研究价值.

此外,当相机拍摄高速旋转的物体时,由于相机的响应速度有限,拍摄的图像会有一定的旋转运动模糊.把高速旋转物体在某一时刻t的光场表示为

Utr,φ,t=lpAl,pLGl,prexpilφexpil0tΩτdτ

其中,Ωτ为物体在任意时刻的转速.相机快门控制的曝光时间为T,则最终拍摄得到的图像为物体的光场分布在曝光时间内的积分,即

Ubr,φ=0TUtr,φ,tdT=lp0Texpil0tΩτdτdtAl,pLGl,prexpilφ

可见,相机拍摄得到的旋转模糊图像由物体的转速和相机的曝光时间决定.在匀转速时,曝光时间与物体旋转角频率之积为物体在相机曝光时间内的旋转模糊角度.图2a为静止原图像,图2b~d分别为5°,15°和25°时的旋转模糊角度图像.由图可见,随着旋转模糊角度的增大,图像的不同空间位置混叠导致的失真越来越明显,在远离中心位置处的图像信息尤甚.

图2

图2   静止原图(a)和旋转运动模糊图像,模糊角分别为5° (b),15° (c)和25° (d)

Fig.2   The original image (a) and the rotational motion blurred images with blurred angles of 5° (b),15° (c) and 25° (d)


针对上述LG模式下采样单像素成像与旋转模糊成像过程中的问题,应用条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)模型来重建失真图像.对Kaggle人像数据集11在1.87%的LG谱采样率下,下采样单像素成像的结构相似性(Structural Similarity,SSIM)指数的平均值由约0.55提升至约0.88,旋转模糊成像的SSIM指数的平均值由约0.30提升至约0.84,和中值滤波(Median Filtering,MF)12、非局部均值滤波(Non⁃Local Means,NLM)13与降噪自编码器(Denoising Autoencoder,DAE)14算法相比,重建图像质量得到了显著优化.

1 研究方法

利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位15-16,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布17,但经典GAN常出现结果无法收敛的问题,训练时不稳定18.cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强19,让生成的模型更容易受控20-21.

cGAN模型是原始GAN的拓展模型,原始GAN的目标函数可以表示为15

minGmaxDVD,G=Ex~PdataxlgDx+Ez~Pzzlg1-DGz

其中,G代表生成器,D代表判别器,z代表分布为Pz的随机噪声,x代表分布为Pdata的目标数据.cGAN的目标函数可以表示为20minGmaxDVD,G=Ex~PdataxlgDxy+Ez~Pzzlg1-DGzy

式(6)不同的是,式(7)多了一项y,代表条件信息.其中,G试图最小化VD,G,而D则试图最大化VD,G,最后两者在相互博弈中达到纳什均衡,此时认为生成器生成的图像就是需要的目标图像.

cGAN的生成器基于U⁃Net结构,由编码器和解码器组成,结构如图3所示.编码器用一系列卷积动作连续下采样来提取特征,在此过程中信息被压缩了.解码器进行的是反卷积动作,需要对原本较少的信息进行扩充,在此过程中空间信息丢失,难免出现类似求解欠定方程的情形,不能得到精确解.因此U⁃Net网络通过跳跃连接将编码器相同结构的层作为输入连接到解码器,补偿下采样过程中的信息损失.cGAN的判别器为卷积神经网络(Convolutional Neural Networks,CNN),将生成图像和真实图像拼接成的图像对作为判别器的输入,判别器不断对图像进行卷积和池化操作,最终得到判别器认为生成图像是真实图像的概率.若判别器认为生成图像为真实图像则输出1,虚假图像则输出0.

图3

图3   cGAN模型的结构图

Fig.3   The structure of cGAN model


利用Kaggle平台的公开人像数据集来进行实验.为了减少LG模式的分解和逆变换的计算量,预先对其进行二值化处理,使用插值算法将图像尺寸调整至256×256并对这些图像进行LG模式的分解和逆变换重建.随机抽取1200张逆变换的图像作为训练集,剩余的图像为测试集.在神经网络的训练过程中,将选取的图像尺寸扩大至286×286并随机裁剪,以提高算法的鲁棒性.在TensorFlow平台上进行网络训练,训练过程单次传递用来训练的样本数为1,利用Adam算法22计算梯度,学习率设为0.002,动量值设为0.5,最终得到训练好的网络.

2 实验与结果

分别将LG变换的下采样单像素成像图像和旋转运动模糊图像的LG变换的下采样图像输入已训练好的网络进行测试,使用的LG模式范围为l0p0~l34p34,共1225个模式,图像大小为256×256,则此时采样率仅为1.87%.重建图像与原图真值对比,以SSIM作为评价标准,从亮度、对比度和结构三个方面判断两张图片的相似性,范围为0~1,数值越大,重建效果越好.

对于测试的失真图像,使用较有代表性的图像去噪声算法处理进行对比,包括MF,NLM和DAE.MF是一种局部滤波方法,选取图像数字矩阵中相邻的奇数个像素点数值的中间值替代原来的像素值,以此来消除噪声点.NLM理论上可以在整个图像中计算像素的相似度,考虑效率问题,也可以设置一个相对较大的搜索窗口和一个相对较小的邻域窗口,根据邻域间的相似度确定具体的像素值.DAE是一种无监督的学习方法,可通过训练数据的自编码器来学习信号的特征23-24,然后再使用这些特征去除噪声.

图4为测试集部分人像图像的LG谱下采样的MF,NLM,DAE,cGAN方法重建效果的对比图.从LG变换后的下采样图像可以看出,因截止阶数较小,欠采样率较大,LG模式重建图像的径向噪声较明显.虽然以往的工作证明MF算法在对抗椒盐噪声的场景下有较好的效果,但对全局都存在的背景噪声几乎不起作用;NLM算法虽然能对整个图像进行滤波,但对全图大范围存在的背景噪声缺乏识别能力,只能将背景噪声平均分配到整张图像中;DAE算法的表现优于滤波算法,但整体降噪效果逊色于cGAN.图5还展示了对15°旋转模糊角度的LG谱下采样的人像图像重建效果对比.

图4

图4   人像图像LG谱下采样条件下使用MF,NLM,DAE和cGAN算法的重建效果

Fig.4   Images reconstructed by MF,NLM,DAE and cGAN with LG spectrum down⁃sampling


图5

图5   15°旋转模糊人像图像在LG谱下采样条件下使用MF,NLM,DAE,cGAN算法的重建效果

Fig.5   Images reconstructed by MF,NLM,DAE and cGAN with LG spectrum down⁃sampling of 15° rotational motion blurred images


表1表2分别列出了不同处理方法处理常规和15°旋转模糊的人像图像对应的SSIM.由表可见,和其他三种算法相比,cGAN生成的图像与真实图像之间的SSIM较高.和常规人像图像相比,15°旋转模糊的人像图像经过LG变换后的下采样图像的SSIM更低,仅为0.3左右,但由cGAN重建后的图像的SSIM均达到0.8以上.

表1   人像图像LG谱下采样的MF,NLM,DAE,cGAN方法重建图像的SSIM

Table 1  SSIM of images reconstructed by MF,NLM,DAE and cGAN with LG spectrum down⁃sampling

图号LG变换MFNLMDAEcGAN
4a0.4340.4540.5480.6540.841
4b0.6360.6530.7650.8500.932
4c0.6130.6310.7670.7260.886
4d0.5360.5540.6740.7380.868
4e0.5440.5610.6730.7590.884

新窗口打开| 下载CSV


表2   15°旋转模糊人像图像LG谱下采样的MF,NLM,DAE,cGAN方法重建图像的SSIM

Table 2  SSIM of images reconstructed by MF,NLM,DAE and cGAN methods with LG spectrum down⁃sampling of 15° rotational motion blurred images

图号LG变换MFNLMDAEcGAN
5a0.3010.3070.3710.5110.825
5b0.2630.2690.3370.4790.858
5c0.3070.3130.3660.5080.822
5d0.2720.2790.3490.5300.834
5e0.3310.3380.4100.5850.866

新窗口打开| 下载CSV


MF与NLM算法,重建每张图片的运算时间短于0.02 s;DAE算法以及本文提出的基于cGAN的图像重建算法,将网络模型训练好之后,重建每张图像的运算时间短于0.1 s.

综上,基于cGAN的图像重建方法,在LG谱的低采样率情形下表现出较强的图像恢复能力,并且对旋转模糊图像有较好的重建效果,鲁棒性也较强.

3 结论

本文提出一种基于条件生成对抗网络的LG谱图像重建方法,通过生成器与鉴别器的相互对抗学习,将输入的失真图像拟合为与原图相似度较高的图像.研究证明,在LG谱的低采样率情形下,本文提出的算法实现了与原图结构相似度较高的图像重建,优于经典的图像去噪声算法.此外,在相同采样率下,该方法对旋转模糊图像同样具有较好的重建效果,鲁棒性较强.该方法在下采样LG谱成像过程中明显提升了图像重建精度,为单像素成像、模糊图像复原提供了一个可行的方案.

参考文献

Gonzalez R CWoods R E. 数字图像处理. 阮秋琦,阮宇智译. 北京电子工业出版社2017169-186.

[本文引用: 1]

Donoho D L.

Compressed sensing

IEEE Transactions on Information Theory,200652(4):1289-1306.

[本文引用: 1]

井花花晏涛刘渊.

融合全局和局部特征的光场图像空间超分辨率算法

南京大学学报(自然科学),202258(2):298-308.

[本文引用: 1]

Jing H HYan TLiu Y.

A spatial super⁃resolution method for light filed images by fusing global and local features

Journal of Nanjing University (Natural Science),202258(2):298-308.

[本文引用: 1]

Dong CLoy C CHe K Met al.

Image super⁃resolution using deep convolutional networks

IEEE Transactions on Pattern Analysis and Machine Intelligence,201638(2):295-307.

[本文引用: 1]

Lyu MWang WWang Het al.

Deep⁃learning⁃based ghost imaging

Scientific Reports,2017(7):17865.

[本文引用: 1]

Molina⁃Terriza GTorres J PTorner L.

Manage⁃ment of the angular momentum of light:Preparation of photons in multidimensional vector states of angular momentum

Physical Review Letters,200188(1):013601.

[本文引用: 1]

Torner LTorres J PCarrasco S.

Digital spiral imaging

Optics Express200513(3):873-881.

[本文引用: 1]

Li F SXu T ZZhang W Het al.

Optical images rotation and reflection with engineered orbital angular momentum spectrum

Applied Physics Letters,2018113(16):161109.

[本文引用: 1]

Wang L YMa J TXiao Met al.

Application of optical orbital angular momentum to rotation measurements

Results in Optics,2021(5):100158.

[本文引用: 1]

Du JZhang R ZZhao Zet al.

Single⁃pixel identification of 2⁃dimensional objects by using complex Laguerre⁃Gaussian spectrum containing both azimuthal and radial modal indices

Optics Communications,2021(481):126557.

[本文引用: 1]

Vu H Q.

105_classes_pins_dataset

https:∥www.kaggle.com/datasets/quangv/105⁃classes⁃pins⁃dataset,2022.

[本文引用: 1]

Ko S JLee Y H.

Center weighted median filters and their applications to image enhancement

IEEE Transactions on Circuits and Systems,199138(9):984-993.

[本文引用: 1]

Buades AColl BMorel J M.

A non⁃local algorithm for image denoising

2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego,CA,USAIEEE200560-65DOI:10.1109/CVPR.2005.38 .

[本文引用: 1]

Vincent PLarochelle HBengio Y.

Extracting and composing robust features with denoising autoencoders

Proceedings of the 25th International Conference on Machine Learning. Helsinki,FinlandACM20081096-1103.

[本文引用: 1]

Goodfellow I JPouget⁃Abadie JMirza Met al.

Generative adversarial nets

Proceedings of the 27th International Conference on Neural Information Processing Systems. Montreal,CanadaMIT Press20142672-2680.

[本文引用: 2]

王坤峰苟超段艳杰.

生成式对抗网络GAN的研究进展与展望

自动化学报,201743(3):321-332.

[本文引用: 1]

Wang K FGou CDuan Y Jet al.

Generative adversarial networks:The state of the art and beyond

Acta Automatica Sinica,201743(3):321-332.

[本文引用: 1]

Goodfellow IPouget⁃Abadie JMirza Met al.

Generative adversarial networks

Communications of the ACM,202063(11):139-144.

[本文引用: 1]

Arjovsky MChintala SBottou L.

Wasserstein generative adversarial networks

Proceedings of the 34th International Conference on Machine Learning. Sydney,AustraliaJMLR.org2017214-223.

[本文引用: 1]

陈文兵管正雄陈允杰.

基于条件生成式对抗网络的数据增强方法

计算机应用,201838(11):3305-3311.

[本文引用: 1]

Chen W BGuan Z XChen Y J.

Data augmentation method based on conditional generative adversarial net model

Journal of Computer Applications,201838(11):3305-3311.

[本文引用: 1]

Mirza MOsindero S.

Conditional generative adversarial nets

2014,arXiv:.

[本文引用: 2]

Zhang HSindagi VPatel V M.

Image de⁃raining using a conditional generative adversarial network

IEEE Transactions on Circuits and Systems for Video Technology202030(11):3943-3956.

[本文引用: 1]

Kingma D PBa J.

Adam:A method for stochastic optimization

2014,arXiv:.

[本文引用: 1]

曹志威樊志杰王青杨.

一种降噪自编码器的复杂网络链路预测算法

小型微型计算机系统,202344(3):665-672.

[本文引用: 1]

Cao Z WFan Z JWang Q Yet al.

Link prediction algorithm based on denoising autoencoder in complex networks

Journal of Chinese Computer Systems,202344(3):665-672.

[本文引用: 1]

敦瑞静鲁淑霞张琦.

基于行列式点过程的变分拉普拉斯自编码器

南京大学学报(自然科学),202258(4):629-639.

[本文引用: 1]

Dun R JLu S XZhang Qet al.

Variational Laplace autoencoders based on determinantal point process

Journal of Nanjing University (Natural Science),202258(4):629-639.

[本文引用: 1]

/