AMSA-UNet | 基于自注意力的多尺度 U-Net 提升图像去模糊性能

前言传统的单尺度U-Net在去模糊过程中常常会导致空间信息的丢失，这影响了去模糊的准确性。此外，由于卷积方法在捕捉长距离依赖方面的局限性，恢复图像的质量下降。为了解决上述问题，提出了一种基于自注意力的非对称多尺度U-Net（AMSA-UNet）来提高去模糊方法在准确性和计算复杂度方面的性能。通过引入多尺度U形结构，网络可以在全局层面关注模糊区域，并在局部层面更好地恢复图像细节。为了克服传统卷积方法在捕捉信息长距离依赖方面的限制，在主干网络的解码器部分引入了自注意力机制，这显著增加了模型的感受野，使模型能够更多地关注图像的语义信息，从而产生更准确、视觉上更令人满意的去模糊图像。

1 Introduction

早期的去模糊方法主要关注非盲去模糊，恢复已知模糊核的图像。Pan等人[1]通过计算模糊图像中暗通道的稀疏性来准确计算模糊核，以恢复清晰图像。然而，这些传统方法在处理空间变化的模糊方面存在困难，而且通常耗时。

随着深度学习的发展，基于CNN的非盲去模糊方法越来越受到重视。包括基于CNN的模糊核估计和利用估计核的反卷积网络。Sun等人[2]使用CNN增强模糊核中的运动平滑性，而Chakrabarti等人[3]对模糊核系数进行建模以实现精确的反卷积。结合传统方法和深度学习方法改进了去模糊效果，但在处理遮挡、深度变化和模糊核估计中的噪声敏感性方面仍存在挑战，这限制了它们在复杂场景中的有效性。

为了克服非盲去模糊的局限性，已经开发出了一种端到端的卷积神经网络方法。这些方法直接将模糊图像映射到清晰图像，避免了依赖于模糊核估计。Nah等人[4]采用了一种多尺度从粗到精的方法，在动态场景中有效去模糊。Mei等人[5]提出的DeepDeblur模型以端到端的方式去除文档图像中的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/764857.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！