谷歌的新AI模型将低分辨率图像转化为高质量图片

导读 随着研究人员不断突破极限,开发先进的人工智能(AI) 技术,我们已经看到了多种 AI 工具和系统来改进成像技术。我们已经看到 AI ...

随着研究人员不断突破极限,开发先进的人工智能(AI) 技术,我们已经看到了多种 AI 工具和系统来改进成像技术。我们已经看到 AI 工具可以立即从图像中删除背景和去模糊照片。现在,谷歌开发了两种基于扩散模型的基于人工智能的工具,可以将低分辨率图像转换为高质量照片。

这两项新技术被称为通过重复细化 (SR3) 和级联扩散模型 (CDM) 的超分辨率,最近由 Google Research 的大脑团队开发。这家山景城巨头最近在其人工智能论坛上发表了一篇深入的博客文章,详细介绍了这两种技术。它类似于我们今年早些时候在北卡罗来纳州杜克大学的研究人员开发的之前的 AI 算法。

现在,从 SR3 模型开始,它本质上是一种超分辨率扩散模型,可以将低分辨率图像从纯噪声转换为高分辨率图像。它以低分辨率图像作为输入,并使用经过训练的图像损坏过程逐渐向图像添加噪声,直到只剩下纯噪声。然后它反转该过程并开始去除噪声以到达以低分辨率输入图像作为参考的目标图像。

该公司表示,通过对 SR3 模型的大规模训练,它能够在人脸和自然图像的超分辨率任务上取得强大的基准测试结果。该模型可以将 64 x 64 的输入图像转换为 1024 x 1024 的图像。为了演示这个过程,谷歌分享了一个展示 SR3 模型的短视频,你可以在下面查看。

现在,来到第二个 AI 模型,级联扩散模型 (CDM) 是一种基于 ImageNet 数据训练的类条件扩散模型。这使模型能够通过在多个空间分辨率上链接多个生成模型来生成高分辨率的自然图像。

在这个过程中,CDM 模型使用一个扩散模型来生成低分辨率数据,然后是一系列 SR3 超分辨率扩散模型。这会逐渐将低分辨率图像的分辨率提高到最高分辨率。您可以查看下面附带的 GIF,以更好地了解图像生成过程。

除了上述两个模型,谷歌人工智能的研究人员还开发了一种新的数据增强技术,称为条件增强。它通过使用高斯噪声和高斯模糊进一步提高了 CDM 的样本质量结果。此外,它可以防止每个超分辨率模型过度拟合其较低分辨率的调节输入。它为 CDM 带来了更好的高分辨率样本质量。

因此,通过上述基于 AI 的图像改进模型,谷歌表示它已经将扩散模型的极限推到了超分辨率和类条件 ImageNet 生成基准的最先进水平。研究人员将进一步测试这些模型的局限性,以解决未来更多的生成建模问题。

免责声明:本文由用户上传,如有侵权请联系删除!