Microsoft Bing 宣布了一项新的 AI 技术,将通过 Microsoft Edge 为网站带来 4K 图像体验,自动增强网站图像。 这项称为图灵图像超分辨率的技术可以使图像以高分辨率显示,无论原始图像有多差。
这项新技术是由微软公司开发的 图灵计划人工智能开发团队.
已在 Bing 地图中使用
这项新技术已经在 Bing Maps 中使用,以提高其卫星航拍图像的质量。
下面是 Google 位于加利福尼亚州山景城的总部的航拍图像对比。
左侧是必应地图的截图,右侧是谷歌地图的相应图片:
必应地图与谷歌地图
微软如何构建技术
有四个重要的见解导致了该模型的成功。
- 人类评估者
- 噪声建模
- 感知和 GAN 损失
- 视觉变形金刚:增强和缩放
人类评估者
微软意识到用于衡量图像相关模型成功与否的指标与人类视觉感知不一致。 因此,他们创建了一个并排的视觉比较工具,该工具使用人工评估者来帮助评估模型的成功与否。
噪声建模
微软采用的方法是从高质量图像开始,然后通过向它们添加噪声来降低它们的质量,然后教模型让图像恢复到图像的原始高质量状态。
感知和 GAN 损失
这是使结果与人类视觉相一致的努力的一部分。
微软公告称:
“……我们发现仅使用输出图像和地面实况图像之间的像素损失来优化我们的模型不足以产生与人眼感知一致的最佳输出。
作为回应,我们还引入了感知损失和 GAN 损失,并调整了三种损失的最佳加权组合作为目标函数。”
视觉变形金刚
微软利用了语言模型中使用的变形金刚的力量,专注于增强和缩放。
这意味着增强图像并专注于放大图像,这是一件很难做到的事情。
通常,缩小图像很容易。 但是要拍摄一张小图像并将其放大,通常最终会放大原始图像的低分辨率伪影。
因此,研究人员所做的就是创建一个系统,该系统可以计算并“恢复”低分辨率图像中丢失的图像数据,并将其提高到更高的分辨率。
微软将放大图像的过程称为 DeepZoom。
边缘:网络浏览器的 4K 电视
微软将这一新的 AI 功能设想为一种为网上冲浪带来 4K 视觉体验的方式,并增强上传到网络的视频会议和家庭照片。
该技术已经在 Edge 的实验版本中可用,称为 边缘金丝雀.
新功能将在未来几个月内推广到 Edge 浏览器的主流版本。