图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] .
拉盖尔高斯(Laguerre⁃Gaussian,LG)模式是激光谐振器腔内的一种本征模式,在柱坐标下对亥姆赫兹方程做傍轴近似[6 ] ,其解析解可以表示如下
L G l , p r , φ = 2 p ! π p + l ! 1 ω 0 2 r ω 0 l L p l 2 r 2 ω 0 2 e x p - r 2 ω 0 2 e x p i l φ = L G l , p r e x p i l φ (1)
式(1)为LG光束在传播距离为0处的横向分布,其中l 为角向指数,取任意整数;p 为径向指数,取大于0的整数;L p l 为拉盖尔多项式;ω 0 为束腰半径.可将LG光束描述为径向分布L G l , p r 与角向分布e x p i l φ 之积,其中角向指数l 与径向指数p 的任意组合形成不同的LG模式,所有LG模式构成一组完备正交基底.傅里叶基底构成的变换域为图像频谱,而相应LG基底构成的变换域为图像LG谱[7 ] .LG谱采样是一种频谱采样手段,具有较高的采样效率.此外,由于LG模式具有的圆对称横向空间分布,在空间上具有旋转不变的特性[8 ] ,其在角向探测方面具有独特优势,广泛应用于小角度测量、对称性物体识别、动态旋转物体成像等领域[9 ] .
在单像素成像过程,通过投影一定数量的LG模式,可得到图像的下采样LG谱[10 ] .如图1 a所示,入射光经过一台数字微镜(DMD),其具有像素级编码与高帧率刷新功能,用于加载并切换产生LG模式的全息图.产生的LG模式经过透镜成像系统投影至目标物体,目标物体的反射光经聚焦透镜汇聚并由一台单点探测器采集.单点探测器采集到的信号强度可以表示为:
I = ∑ l ∑ p U r , φ L G l , p r c o s φ l + θ (2)
图1
图1
LG谱采样的单像素成像系统(a);不同的LG模式截止阶数及其对应的重建图像:(b~c) l 25 p 25 ,(d~e) l 50 p 50 和(f~g) l 75 p 75
Fig.1
Single⁃pixel imaging system of LG spectrum sampling (a),different ranges of LG spectrum and the reconstructed images:(b~c) l 25 p 25 ,(d~e) l 50 p 50 and (f~g) l 75 p 75
其中,U r , φ 为目标物光场分布,θ 为LG模式的附加相移.当相移θ 分别取值0 , π / 2 , π , 3 π / 2 时,构成图像的某一阶次LG谱模式系数A l , p
I 0 - I π + i I 3 π / 2 - I π / 2 = ∑ l ∑ p U r , φ L G l , p r c o s l φ + i s i n l φ = ∑ l ∑ p U r , φ L G l , p r e x p i l φ = A l , p (3)
通过数字微镜器件(Digital Micromirror Devices,DMD)切换大量不同的LG模式,即可计算得到物像的LG谱.图1 b,1 d和1 f是截止阶数分别为25,50和75的下采样LG谱,其中横坐标为角向指数l ,纵坐标为径向指数p ,图1 c,1 e和1 g分别为对应的重建图像.由图可见,当采样率较低、LG模式截止阶数较小时,重建图像的视场较小,清晰度较差,随着截止阶数的增大,重建图像的细节恢复变好,图像噪声也变弱.并且,由于LG模式具有独特的径向参量,截止阶数较小,重建图像在径向具有明显的噪声.因此,在低采样率下提升单像素LG谱下采样的成像质量具有实际的研究价值.
此外,当相机拍摄高速旋转的物体时,由于相机的响应速度有限,拍摄的图像会有一定的旋转运动模糊.把高速旋转物体在某一时刻t 的光场表示为
U t r , φ , t = ∑ l ∑ p A l , p L G l , p r e x p i l φ e x p i l ∫ 0 t Ω τ d τ (4)
其中,Ω τ 为物体在任意时刻的转速.相机快门控制的曝光时间为T ,则最终拍摄得到的图像为物体的光场分布在曝光时间内的积分,即
U b r , φ = ∫ 0 T U t r , φ , t d T = ∑ l ∑ p ∫ 0 T e x p i l ∫ 0 t Ω τ d τ d t ⋅ A l , p L G l , p r e x p i l φ (5)
可见,相机拍摄得到的旋转模糊图像由物体的转速和相机的曝光时间决定.在匀转速时,曝光时间与物体旋转角频率之积为物体在相机曝光时间内的旋转模糊角度.图2 a为静止原图像,图2 b~d分别为5°,15°和25°时的旋转模糊角度图像.由图可见,随着旋转模糊角度的增大,图像的不同空间位置混叠导致的失真越来越明显,在远离中心位置处的图像信息尤甚.
图2
图2
静止原图(a)和旋转运动模糊图像,模糊角分别为5° (b),15° (c)和25° (d)
Fig.2
The original image (a) and the rotational motion blurred images with blurred angles of 5° (b),15° (c) and 25° (d)
针对上述LG模式下采样单像素成像与旋转模糊成像过程中的问题,应用条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)模型来重建失真图像.对Kaggle人像数据集[11 ] 在1.87%的LG谱采样率下,下采样单像素成像的结构相似性(Structural Similarity,SSIM )指数的平均值由约0.55提升至约0.88,旋转模糊成像的SSIM 指数的平均值由约0.30提升至约0.84,和中值滤波(Median Filtering,MF)[12 ] 、非局部均值滤波(Non⁃Local Means,NLM)[13 ] 与降噪自编码器(Denoising Autoencoder,DAE)[14 ] 算法相比,重建图像质量得到了显著优化.
1 研究方法
利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] .
cGAN模型是原始GAN的拓展模型,原始GAN的目标函数可以表示为[15 ] :
m i n G m a x D V D , G = E x ~ P d a t a x l g D x + E z ~ P z z l g 1 - D G z (6)
其中,G 代表生成器,D 代表判别器,z 代表分布为P z 的随机噪声,x 代表分布为P d a t a 的目标数据.cGAN的目标函数可以表示为[20 ] m i n G m a x D V D , G = E x ~ P d a t a x l g D x y + E z ~ P z z l g 1 - D G z y (7)
与式(6)不同的是,式(7)多了一项y ,代表条件信息.其中,G 试图最小化V D , G ,而D 则试图最大化V D , G ,最后两者在相互博弈中达到纳什均衡,此时认为生成器生成的图像就是需要的目标图像.
cGAN的生成器基于U⁃Net结构,由编码器和解码器组成,结构如图3 所示.编码器用一系列卷积动作连续下采样来提取特征,在此过程中信息被压缩了.解码器进行的是反卷积动作,需要对原本较少的信息进行扩充,在此过程中空间信息丢失,难免出现类似求解欠定方程的情形,不能得到精确解.因此U⁃Net网络通过跳跃连接将编码器相同结构的层作为输入连接到解码器,补偿下采样过程中的信息损失.cGAN的判别器为卷积神经网络(Convolutional Neural Networks,CNN),将生成图像和真实图像拼接成的图像对作为判别器的输入,判别器不断对图像进行卷积和池化操作,最终得到判别器认为生成图像是真实图像的概率.若判别器认为生成图像为真实图像则输出1,虚假图像则输出0.
图3
图3
cGAN模型的结构图
Fig.3
The structure of cGAN model
利用Kaggle平台的公开人像数据集来进行实验.为了减少LG模式的分解和逆变换的计算量,预先对其进行二值化处理,使用插值算法将图像尺寸调整至256×256并对这些图像进行LG模式的分解和逆变换重建.随机抽取1200张逆变换的图像作为训练集,剩余的图像为测试集.在神经网络的训练过程中,将选取的图像尺寸扩大至286×286并随机裁剪,以提高算法的鲁棒性.在TensorFlow平台上进行网络训练,训练过程单次传递用来训练的样本数为1,利用Adam算法[22 ] 计算梯度,学习率设为0.002,动量值设为0.5,最终得到训练好的网络.
2 实验与结果
分别将LG变换的下采样单像素成像图像和旋转运动模糊图像的LG变换的下采样图像输入已训练好的网络进行测试,使用的LG模式范围为l 0 p 0 ~ l 34 p 34 ,共1225个模式,图像大小为256×256,则此时采样率仅为1.87%.重建图像与原图真值对比,以SSIM 作为评价标准,从亮度、对比度和结构三个方面判断两张图片的相似性,范围为0~1,数值越大,重建效果越好.
对于测试的失真图像,使用较有代表性的图像去噪声算法处理进行对比,包括MF,NLM和DAE.MF是一种局部滤波方法,选取图像数字矩阵中相邻的奇数个像素点数值的中间值替代原来的像素值,以此来消除噪声点.NLM理论上可以在整个图像中计算像素的相似度,考虑效率问题,也可以设置一个相对较大的搜索窗口和一个相对较小的邻域窗口,根据邻域间的相似度确定具体的像素值.DAE是一种无监督的学习方法,可通过训练数据的自编码器来学习信号的特征[23 -24 ] ,然后再使用这些特征去除噪声.
图4 为测试集部分人像图像的LG谱下采样的MF,NLM,DAE,cGAN方法重建效果的对比图.从LG变换后的下采样图像可以看出,因截止阶数较小,欠采样率较大,LG模式重建图像的径向噪声较明显.虽然以往的工作证明MF算法在对抗椒盐噪声的场景下有较好的效果,但对全局都存在的背景噪声几乎不起作用;NLM算法虽然能对整个图像进行滤波,但对全图大范围存在的背景噪声缺乏识别能力,只能将背景噪声平均分配到整张图像中;DAE算法的表现优于滤波算法,但整体降噪效果逊色于cGAN.图5 还展示了对15°旋转模糊角度的LG谱下采样的人像图像重建效果对比.
图4
图4
人像图像LG谱下采样条件下使用MF,NLM,DAE和cGAN算法的重建效果
Fig.4
Images reconstructed by MF,NLM,DAE and cGAN with LG spectrum down⁃sampling
图5
图5
15°旋转模糊人像图像在LG谱下采样条件下使用MF,NLM,DAE,cGAN算法的重建效果
Fig.5
Images reconstructed by MF,NLM,DAE and cGAN with LG spectrum down⁃sampling of 15° rotational motion blurred images
表1 与表2 分别列出了不同处理方法处理常规和15°旋转模糊的人像图像对应的SSIM .由表可见,和其他三种算法相比,cGAN生成的图像与真实图像之间的SSIM 较高.和常规人像图像相比,15°旋转模糊的人像图像经过LG变换后的下采样图像的SSIM 更低,仅为0.3左右,但由cGAN重建后的图像的SSIM 均达到0.8以上.
MF与NLM算法,重建每张图片的运算时间短于0.02 s;DAE算法以及本文提出的基于cGAN的图像重建算法,将网络模型训练好之后,重建每张图像的运算时间短于0.1 s.
综上,基于cGAN的图像重建方法,在LG谱的低采样率情形下表现出较强的图像恢复能力,并且对旋转模糊图像有较好的重建效果,鲁棒性也较强.
3 结论
本文提出一种基于条件生成对抗网络的LG谱图像重建方法,通过生成器与鉴别器的相互对抗学习,将输入的失真图像拟合为与原图相似度较高的图像.研究证明,在LG谱的低采样率情形下,本文提出的算法实现了与原图结构相似度较高的图像重建,优于经典的图像去噪声算法.此外,在相同采样率下,该方法对旋转模糊图像同样具有较好的重建效果,鲁棒性较强.该方法在下采样LG谱成像过程中明显提升了图像重建精度,为单像素成像、模糊图像复原提供了一个可行的方案.
参考文献
View Option
[1]
Gonzalez R C , Woods R E . 数字图像处理 . 阮秋琦,阮宇智译. 北京 :电子工业出版社 ,2017 :169 -186 .
[本文引用: 1]
[2]
Donoho D L . Compressed sensing
IEEE Transactions on Information Theory ,2006 ,52 (4 ):1289 -1306 .
[本文引用: 1]
[3]
井花花 ,晏涛 ,刘渊 . 融合全局和局部特征的光场图像空间超分辨率算法
南京大学学报(自然科学) ,2022 ,58 (2 ):298 -308 .
[本文引用: 1]
Jing H H , Yan T , Liu Y . A spatial super⁃resolution method for light filed images by fusing global and local features
Journal of Nanjing University (Natural Science) ,2022 ,58 (2 ):298 -308 .
[本文引用: 1]
[4]
Dong C , Loy C C , He K M ,et al . Image super⁃resolution using deep convolutional networks
IEEE Transactions on Pattern Analysis and Machine Intelligence ,2016 ,38 (2 ):295 -307 .
[本文引用: 1]
[5]
Lyu M , Wang W , Wang H ,et al . Deep⁃learning⁃based ghost imaging
Scientific Reports ,2017 (7 ):17865 .
[本文引用: 1]
[6]
Molina⁃Terriza G , Torres J P , Torner L . Manage⁃ment of the angular momentum of light:Preparation of photons in multidimensional vector states of angular momentum
Physical Review Letters ,2001 ,88 (1 ):013601 .
[本文引用: 1]
[7]
Torner L , Torres J P , Carrasco S . Digital spiral imaging
Optics Express ,2005 ,13 (3 ):873 -881 .
[本文引用: 1]
[8]
Li F S , Xu T Z , Zhang W H ,et al . Optical images rotation and reflection with engineered orbital angular momentum spectrum
Applied Physics Letters ,2018 ,113 (16 ):161109 .
[本文引用: 1]
[9]
Wang L Y , Ma J T , Xiao M ,et al . Application of optical orbital angular momentum to rotation measurements
Results in Optics ,2021 (5 ):100158 .
[本文引用: 1]
[10]
Du J , Zhang R Z , Zhao Z ,et al . Single⁃pixel identification of 2⁃dimensional objects by using complex Laguerre⁃Gaussian spectrum containing both azimuthal and radial modal indices
Optics Communications ,2021 (481 ):126557 .
[本文引用: 1]
[11]
Vu H Q . 105_classes_pins_dataset
https:∥www.kaggle.com/datasets/quangv/105⁃classes⁃pins⁃dataset ,2022 .
[本文引用: 1]
[12]
Ko S J , Lee Y H . Center weighted median filters and their applications to image enhancement
IEEE Transactions on Circuits and Systems ,1991 ,38 (9 ):984 -993 .
[本文引用: 1]
[13]
Buades A , Coll B , Morel J M . A non⁃local algorithm for image denoising
∥2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition . San Diego,CA,USA :IEEE ,2005 :60 -65 ,DOI:10.1109/CVPR.2005.38 .
[本文引用: 1]
[14]
Vincent P , Larochelle H , Bengio Y . Extracting and composing robust features with denoising autoencoders
∥Proceedings of the 25th International Conference on Machine Learning . Helsinki,Finland :ACM ,2008 :1096 -1103 .
[本文引用: 1]
[15]
Goodfellow I J , Pouget⁃Abadie J , Mirza M ,et al . Generative adversarial nets
∥Proceedings of the 27th International Conference on Neural Information Processing Systems . Montreal,Canada :MIT Press ,2014 :2672 -2680 .
[本文引用: 2]
[16]
王坤峰 ,苟超 ,段艳杰 ,等 . 生成式对抗网络GAN的研究进展与展望
自动化学报 ,2017 ,43 (3 ):321 -332 .
[本文引用: 1]
Wang K F , Gou C , Duan Y J ,et al . Generative adversarial networks:The state of the art and beyond
Acta Automatica Sinica ,2017 ,43 (3 ):321 -332 .
[本文引用: 1]
[17]
Goodfellow I , Pouget⁃Abadie J , Mirza M ,et al . Generative adversarial networks
Communications of the ACM ,2020 ,63 (11 ):139 -144 .
[本文引用: 1]
[18]
Arjovsky M , Chintala S , Bottou L . Wasserstein generative adversarial networks
∥Proceedings of the 34th International Conference on Machine Learning . Sydney,Australia :JMLR.org ,2017 :214 -223 .
[本文引用: 1]
[19]
陈文兵 ,管正雄 ,陈允杰 . 基于条件生成式对抗网络的数据增强方法
计算机应用 ,2018 ,38 (11 ):3305 -3311 .
[本文引用: 1]
Chen W B , Guan Z X , Chen Y J . Data augmentation method based on conditional generative adversarial net model
Journal of Computer Applications ,2018 ,38 (11 ):3305 -3311 .
[本文引用: 1]
[20]
Mirza M , Osindero S . Conditional generative adversarial nets
2014 ,arXiv:.
[本文引用: 2]
[21]
Zhang H , Sindagi V , Patel V M . Image de⁃raining using a conditional generative adversarial network
IEEE Transactions on Circuits and Systems for Video Technology ,2020 ,30 (11 ):3943 -3956 .
[本文引用: 1]
[22]
Kingma D P , Ba J . Adam:A method for stochastic optimization
2014 ,arXiv:.
[本文引用: 1]
[23]
曹志威 ,樊志杰 ,王青杨 ,等 . 一种降噪自编码器的复杂网络链路预测算法
小型微型计算机系统 ,2023 ,44 (3 ):665 -672 .
[本文引用: 1]
Cao Z W , Fan Z J , Wang Q Y ,et al . Link prediction algorithm based on denoising autoencoder in complex networks
Journal of Chinese Computer Systems ,2023 ,44 (3 ):665 -672 .
[本文引用: 1]
[24]
敦瑞静 ,鲁淑霞 ,张琦 ,等 . 基于行列式点过程的变分拉普拉斯自编码器
南京大学学报(自然科学) ,2022 ,58 (4 ):629 -639 .
[本文引用: 1]
Dun R J , Lu S X , Zhang Q ,et al . Variational Laplace autoencoders based on determinantal point process
Journal of Nanjing University (Natural Science) ,2022 ,58 (4 ):629 -639 .
[本文引用: 1]
1
2017
... 图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] . ...
Compressed sensing
1
2006
... 图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] . ...
融合全局和局部特征的光场图像空间超分辨率算法
1
2022
... 图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] . ...
A spatial super?resolution method for light filed images by fusing global and local features
1
2022
... 图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] . ...
Image super?resolution using deep convolutional networks
1
2016
... 图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] . ...
Deep?learning?based ghost imaging
1
2017
... 图像重建在图像处理领域是一项具有挑战性的热门课题,对图像频率域采样是常见的方法之一,通过频谱滤波得到频率域的每个阶次分量,由此实现对图像全局信息的操控,例如平滑、锐化、去模糊等[1 ] .频谱采样率决定图像像素的高低,对高像素数图像或复杂图像的重建,实现频谱完全采样通常较困难,其对探测器要求较高且极其耗时.考虑到低频信息分量占频谱的主要成分,采用牺牲采样率的低通频谱滤波与压缩感知等方法[2 -3 ] 虽然可以重建下采样的图像,但不可避免会造成图像信息较大损失.近年来,深度学习算法因其强大的学习能力和适应性,在图像恢复任务中表现出独特的优势[4 ] ,与传统模型和算法相比,能从海量数据中通过先验学习到特征训练网络模型,图像处理能力更优异,甚至可以在低采样条件下大幅提高图像重建质量[5 ] . ...
Manage?ment of the angular momentum of light:Preparation of photons in multidimensional vector states of angular momentum
1
2001
... 拉盖尔高斯(Laguerre⁃Gaussian,LG)模式是激光谐振器腔内的一种本征模式,在柱坐标下对亥姆赫兹方程做傍轴近似[6 ] ,其解析解可以表示如下 ...
Digital spiral imaging
1
2005
... 式(1)为LG光束在传播距离为0处的横向分布,其中l 为角向指数,取任意整数;p 为径向指数,取大于0的整数;L p l 为拉盖尔多项式;ω 0 为束腰半径.可将LG光束描述为径向分布L G l , p r 与角向分布e x p i l φ 之积,其中角向指数l 与径向指数p 的任意组合形成不同的LG模式,所有LG模式构成一组完备正交基底.傅里叶基底构成的变换域为图像频谱,而相应LG基底构成的变换域为图像LG谱[7 ] .LG谱采样是一种频谱采样手段,具有较高的采样效率.此外,由于LG模式具有的圆对称横向空间分布,在空间上具有旋转不变的特性[8 ] ,其在角向探测方面具有独特优势,广泛应用于小角度测量、对称性物体识别、动态旋转物体成像等领域[9 ] . ...
Optical images rotation and reflection with engineered orbital angular momentum spectrum
1
2018
... 式(1)为LG光束在传播距离为0处的横向分布,其中l 为角向指数,取任意整数;p 为径向指数,取大于0的整数;L p l 为拉盖尔多项式;ω 0 为束腰半径.可将LG光束描述为径向分布L G l , p r 与角向分布e x p i l φ 之积,其中角向指数l 与径向指数p 的任意组合形成不同的LG模式,所有LG模式构成一组完备正交基底.傅里叶基底构成的变换域为图像频谱,而相应LG基底构成的变换域为图像LG谱[7 ] .LG谱采样是一种频谱采样手段,具有较高的采样效率.此外,由于LG模式具有的圆对称横向空间分布,在空间上具有旋转不变的特性[8 ] ,其在角向探测方面具有独特优势,广泛应用于小角度测量、对称性物体识别、动态旋转物体成像等领域[9 ] . ...
Application of optical orbital angular momentum to rotation measurements
1
2021
... 式(1)为LG光束在传播距离为0处的横向分布,其中l 为角向指数,取任意整数;p 为径向指数,取大于0的整数;L p l 为拉盖尔多项式;ω 0 为束腰半径.可将LG光束描述为径向分布L G l , p r 与角向分布e x p i l φ 之积,其中角向指数l 与径向指数p 的任意组合形成不同的LG模式,所有LG模式构成一组完备正交基底.傅里叶基底构成的变换域为图像频谱,而相应LG基底构成的变换域为图像LG谱[7 ] .LG谱采样是一种频谱采样手段,具有较高的采样效率.此外,由于LG模式具有的圆对称横向空间分布,在空间上具有旋转不变的特性[8 ] ,其在角向探测方面具有独特优势,广泛应用于小角度测量、对称性物体识别、动态旋转物体成像等领域[9 ] . ...
Single?pixel identification of 2?dimensional objects by using complex Laguerre?Gaussian spectrum containing both azimuthal and radial modal indices
1
2021
... 在单像素成像过程,通过投影一定数量的LG模式,可得到图像的下采样LG谱[10 ] .如图1 a所示,入射光经过一台数字微镜(DMD),其具有像素级编码与高帧率刷新功能,用于加载并切换产生LG模式的全息图.产生的LG模式经过透镜成像系统投影至目标物体,目标物体的反射光经聚焦透镜汇聚并由一台单点探测器采集.单点探测器采集到的信号强度可以表示为: ...
105_classes_pins_dataset
1
2022
... 针对上述LG模式下采样单像素成像与旋转模糊成像过程中的问题,应用条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)模型来重建失真图像.对Kaggle人像数据集[11 ] 在1.87%的LG谱采样率下,下采样单像素成像的结构相似性(Structural Similarity,SSIM )指数的平均值由约0.55提升至约0.88,旋转模糊成像的SSIM 指数的平均值由约0.30提升至约0.84,和中值滤波(Median Filtering,MF)[12 ] 、非局部均值滤波(Non⁃Local Means,NLM)[13 ] 与降噪自编码器(Denoising Autoencoder,DAE)[14 ] 算法相比,重建图像质量得到了显著优化. ...
Center weighted median filters and their applications to image enhancement
1
1991
... 针对上述LG模式下采样单像素成像与旋转模糊成像过程中的问题,应用条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)模型来重建失真图像.对Kaggle人像数据集[11 ] 在1.87%的LG谱采样率下,下采样单像素成像的结构相似性(Structural Similarity,SSIM )指数的平均值由约0.55提升至约0.88,旋转模糊成像的SSIM 指数的平均值由约0.30提升至约0.84,和中值滤波(Median Filtering,MF)[12 ] 、非局部均值滤波(Non⁃Local Means,NLM)[13 ] 与降噪自编码器(Denoising Autoencoder,DAE)[14 ] 算法相比,重建图像质量得到了显著优化. ...
A non?local algorithm for image denoising
1
... 针对上述LG模式下采样单像素成像与旋转模糊成像过程中的问题,应用条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)模型来重建失真图像.对Kaggle人像数据集[11 ] 在1.87%的LG谱采样率下,下采样单像素成像的结构相似性(Structural Similarity,SSIM )指数的平均值由约0.55提升至约0.88,旋转模糊成像的SSIM 指数的平均值由约0.30提升至约0.84,和中值滤波(Median Filtering,MF)[12 ] 、非局部均值滤波(Non⁃Local Means,NLM)[13 ] 与降噪自编码器(Denoising Autoencoder,DAE)[14 ] 算法相比,重建图像质量得到了显著优化. ...
Extracting and composing robust features with denoising autoencoders
1
2008
... 针对上述LG模式下采样单像素成像与旋转模糊成像过程中的问题,应用条件生成对抗网络(Conditional Generative Adversarial Nets,cGAN)模型来重建失真图像.对Kaggle人像数据集[11 ] 在1.87%的LG谱采样率下,下采样单像素成像的结构相似性(Structural Similarity,SSIM )指数的平均值由约0.55提升至约0.88,旋转模糊成像的SSIM 指数的平均值由约0.30提升至约0.84,和中值滤波(Median Filtering,MF)[12 ] 、非局部均值滤波(Non⁃Local Means,NLM)[13 ] 与降噪自编码器(Denoising Autoencoder,DAE)[14 ] 算法相比,重建图像质量得到了显著优化. ...
Generative adversarial nets
2
2014
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
... cGAN模型是原始GAN的拓展模型,原始GAN的目标函数可以表示为[15 ] : ...
生成式对抗网络GAN的研究进展与展望
1
2017
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
Generative adversarial networks:The state of the art and beyond
1
2017
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
Generative adversarial networks
1
2020
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
Wasserstein generative adversarial networks
1
2017
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
基于条件生成式对抗网络的数据增强方法
1
2018
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
Data augmentation method based on conditional generative adversarial net model
1
2018
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
Conditional generative adversarial nets
2
2014
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
... 其中,G 代表生成器,D 代表判别器,z 代表分布为P z 的随机噪声,x 代表分布为P d a t a 的目标数据.cGAN的目标函数可以表示为[20 ] m i n G m a x D V D , G = E x ~ P d a t a x l g D x y + E z ~ P z z l g 1 - D G z y (7) ...
Image de?raining using a conditional generative adversarial network
1
2020
... 利用cGAN对LG谱下采样恢复的图像进行优化重建.近年来,生成对抗网络(GAN)方法已占据主导地位[15 -16 ] ,其通过生成器和鉴别器的相互对抗学习,将随机噪声拟合为原始图像的分布[17 ] ,但经典GAN常出现结果无法收敛的问题,训练时不稳定[18 ] .cGAN在GAN的基础上加入条件概率分布的信息,有利于数据增强[19 ] ,让生成的模型更容易受控[20 -21 ] . ...
Adam:A method for stochastic optimization
1
2014
... 利用Kaggle平台的公开人像数据集来进行实验.为了减少LG模式的分解和逆变换的计算量,预先对其进行二值化处理,使用插值算法将图像尺寸调整至256×256并对这些图像进行LG模式的分解和逆变换重建.随机抽取1200张逆变换的图像作为训练集,剩余的图像为测试集.在神经网络的训练过程中,将选取的图像尺寸扩大至286×286并随机裁剪,以提高算法的鲁棒性.在TensorFlow平台上进行网络训练,训练过程单次传递用来训练的样本数为1,利用Adam算法[22 ] 计算梯度,学习率设为0.002,动量值设为0.5,最终得到训练好的网络. ...
一种降噪自编码器的复杂网络链路预测算法
1
2023
... 对于测试的失真图像,使用较有代表性的图像去噪声算法处理进行对比,包括MF,NLM和DAE.MF是一种局部滤波方法,选取图像数字矩阵中相邻的奇数个像素点数值的中间值替代原来的像素值,以此来消除噪声点.NLM理论上可以在整个图像中计算像素的相似度,考虑效率问题,也可以设置一个相对较大的搜索窗口和一个相对较小的邻域窗口,根据邻域间的相似度确定具体的像素值.DAE是一种无监督的学习方法,可通过训练数据的自编码器来学习信号的特征[23 -24 ] ,然后再使用这些特征去除噪声. ...
Link prediction algorithm based on denoising autoencoder in complex networks
1
2023
... 对于测试的失真图像,使用较有代表性的图像去噪声算法处理进行对比,包括MF,NLM和DAE.MF是一种局部滤波方法,选取图像数字矩阵中相邻的奇数个像素点数值的中间值替代原来的像素值,以此来消除噪声点.NLM理论上可以在整个图像中计算像素的相似度,考虑效率问题,也可以设置一个相对较大的搜索窗口和一个相对较小的邻域窗口,根据邻域间的相似度确定具体的像素值.DAE是一种无监督的学习方法,可通过训练数据的自编码器来学习信号的特征[23 -24 ] ,然后再使用这些特征去除噪声. ...
基于行列式点过程的变分拉普拉斯自编码器
1
2022
... 对于测试的失真图像,使用较有代表性的图像去噪声算法处理进行对比,包括MF,NLM和DAE.MF是一种局部滤波方法,选取图像数字矩阵中相邻的奇数个像素点数值的中间值替代原来的像素值,以此来消除噪声点.NLM理论上可以在整个图像中计算像素的相似度,考虑效率问题,也可以设置一个相对较大的搜索窗口和一个相对较小的邻域窗口,根据邻域间的相似度确定具体的像素值.DAE是一种无监督的学习方法,可通过训练数据的自编码器来学习信号的特征[23 -24 ] ,然后再使用这些特征去除噪声. ...
Variational Laplace autoencoders based on determinantal point process
1
2022
... 对于测试的失真图像,使用较有代表性的图像去噪声算法处理进行对比,包括MF,NLM和DAE.MF是一种局部滤波方法,选取图像数字矩阵中相邻的奇数个像素点数值的中间值替代原来的像素值,以此来消除噪声点.NLM理论上可以在整个图像中计算像素的相似度,考虑效率问题,也可以设置一个相对较大的搜索窗口和一个相对较小的邻域窗口,根据邻域间的相似度确定具体的像素值.DAE是一种无监督的学习方法,可通过训练数据的自编码器来学习信号的特征[23 -24 ] ,然后再使用这些特征去除噪声. ...