前言 传统的单尺度U-Net在去模糊过程中常常会导致空间信息的丢失,这影响了去模糊的准确性。此外,由于卷积方法在捕捉长距离依赖方面的局限性,恢复图像的质量下降。为了解决上述问题,提出了一种基于自注意力的非对称多尺度U-Net(AMSA-UNet)来提高去模糊方法在准确性和计算复杂度方面的性能。通过引入多尺度U形结构,网络可以在全局层面关注模糊区域,并在局部层面更好地恢复图像细节。为了克服传统卷积方法在捕捉信息长距离依赖方面的限制,在主干网络的解码器部分引入了自注意力机制,这显著增加了模型的感受野,使模型能够更多地关注图像的语义信息,从而产生更准确、视觉上更令人满意的去模糊图像。
1 Introduction
早期的去模糊方法主要关注非盲去模糊,恢复已知模糊核的图像。Pan等人[1]通过计算模糊图像中暗通道的稀疏性来准确计算模糊核,以恢复清晰图像。然而,这些传统方法在处理空间变化的模糊方面存在困难,而且通常耗时。
随着深度学习的发展,基于CNN的非盲去模糊方法越来越受到重视。包括基于CNN的模糊核估计和利用估计核的反卷积网络。Sun等人[2]使用CNN增强模糊核中的运动平滑性,而Chakrabarti等人[3]对模糊核系数进行建模以实现精确的反卷积。结合传统方法和深度学习方法改进了去模糊效果,但在处理遮挡、深度变化和模糊核估计中的噪声敏感性方面仍存在挑战,这限制了它们在复杂场景中的有效性。
为了克服非盲去模糊的局限性,已经开发出了一种端到端的卷积神经网络方法。这些方法直接将模糊图像映射到清晰图像,避免了依赖于模糊核估计。Nah等人[4]采用了一种多尺度从粗到精的方法,在动态场景中有效去模糊。Mei等人[5]提出的DeepDeblur模型以端到端的方式去除文档图像中的