微软的新AI从您的单词中创建了假照片

在我看来，鸟看起来完全是真实的。一种特色是羽毛的蓬松黄色腹部。另一个是森林绿色的尾巴，带有长长的喙，看起来非常适合从树皮上钩住虫子。但是我正在查看的这些照片是完整的小说。它们是直接来自微软最新AI的想象力的图像attngan。它们是通过在系统中键入句子来创建的，例如：“这只鸟是红色和白色，喙很短。”然后，Attngan生成了这些高度逼真的256 x 256像素照片，这些照片是虚构的。

“四年前，没有人相信可以做这件事，”该项目的主要研究员Xiaodong说。

[图片：微软研究]

确实，在过去的五年中，他一直在研究图像和单词的关系，训练AIS完成各种令人信服的任务。首先，他创建了一个名为Captionbot这可以使用单词来描述照片，这是一项研究，现在是一项可访问性功能，可以帮助使用Microsoft产品的视力受损。然后，他进一步推动了这项研究，创建了一个AI，可以回答您可能会问的有关照片的特定问题。

现在，与Attngan一起，他“关闭了循环”。换句话说，微软的AIS可以从单纯的单词中创建图像，然后另一个AI可以标题。

“ attngan”这个名称来自它的构建方式，这在一般层面上很容易理解。微软研究人员彼此之间进行了两个AIS（这是“ GAN”部分或生成对抗网络）。两者都接受了语言和庞大图像集的培训，但一个试图创建图像，而另一个则批评它们。从非常模糊的初始草图到完整的Fidelity最终模型，这种批评发生在三个阶段。正在进行的竞争改进了ATTNGAN，足以制作您今天看到的图像。

这些照片通常是现实的，尽管分辨率相对较低，而且在现实主义之外，它们的定制细节也很有特殊性。这是“ attngan”的“注意力”部分，因为每个图像的AI微调非常小的区域到口头规格。例如，这意味着鸟可以具有极为具体的特征，例如蓝喙，黄色的喙，长喙或短喙。从分辨率到即兴创作，再到包含有限细节，都比Google的广义素描AI。甚至Adobe的怪异图像创建工具所有都是从实际照片开始的，而不是空白的画布。

attngan是观鸟者的梦想，能够以可信的方式产生无数定制的鸟类。但是，鸟类的照片相对可预测：大多数是将鸟类栖息在树上的树枝上的鸟类，当您要求它绘制鸟时，它很容易被Attngan即兴。但是请问attngan将这些物体从它们的上下文中脱颖而出，并将其与其他一些物体混合在一起，而事情变得不那么糟糕。他说：“如果系统中对象存在复杂的属性或关系，那么机器会感到困惑，并绘制一些不如我们希望的东西。”

当研究人员要求它绘制超现实的“红色双层公共汽车漂浮在湖泊上”时，发现了Attngan的局限性的一个很好的例子。由此产生的照片看起来更像是一条模糊的红色和白色船。背景似乎影响了这个主题，将两者当作一个。公共汽车不会开车！所以阿特甘拔船。

在另一种案例中，研究人员要求“一个女孩吃一大片披萨的图像”。女孩的形状实际上很棒。但是，这张发明的肖像中几乎所有其他一切都脱颖而出。它看起来很奇怪。

他总结说：“机器仍然需要学习很多常识，以画出复杂物体的良好图片。”的确，在这两种失败的情况下，Attngan似乎都了解了要的要求，但是它缺乏根本的世界对观察关系，无法令人信服地吸引它们。这种逻辑对于地面的想象力是必不可少的。即便如此，他也没有受到威胁。在短短几年内，他坚持认为这些AI模型将大大改善，并且随着计算机加载更多的记忆力，研究人员也将能够使最终图像更大，更详细。鉴于他的进步了最后十年，很难不同意。

最终，他认为Attngan风格的技术将完全改变创意工具。他想象Bing图像搜索根据需要发明照片 - 例如，如果您要求停车牌在天空中飞来飞去，而Istockphoto上没有这样的东西。但是快进一点，他看到该系统为艺术家或为设计师的房间布局生成图像，这些系统只需要进行一些调整即可令人信服。他甚至认为，在可预见的未来有一天，这样的AIS将能够将脚本翻译成交钥匙动画电影。

但是，目前，该研究旨在模糊人类思维与机器思维之间的界限。“这很有趣。这是一个基本的人工智能问题，‘什么是智力？是什么使我们与动物分开？''他沉思。“我们知道如何表达自己，并且知道如何阅读图像。[重复]对我而言，这类事情是一种[重现]人类一般智力的方法。”

主页

www.vwinchina.com

技术

德赢国际娱乐平台

消息

创新节360

订阅

AWS

嗯

波士顿科学

德勤

部门

提升奖

IBM

Genpact

克拉纳

签证

快速政府

大多数创新的公司

大多数有创造力的人

改变世界的想法

设计创新

创新节

大多数创新的公司峰会

视频

www.vw011.com

“最长的转变”凸显了让洛杉矶奔跑的重要工人

其他总统已经尝试并且未能扩大加班费。拜登可以成功吗？

免费的学校餐如何导致在家中降低杂货账单和更健康的食物购买

消息

欧洲电视网歌曲大赛2022：如何观看美国的总决赛现场

这并不是所有的坏消息：这5个科技股在惩罚周结束时集会

妇女健康微邻居在第五大道上浮出水面

www.vwinchina.com

型号：一位建筑师从熔岩建造建筑物的狂野想法

这些设计师将旧的河豚夹克变成舒适的椅子

在Metaverse中工作：虚拟办公室生活可能是什么样子

德赢国际娱乐平台

根除排他性和过时的工作场所语言

没有自我破坏的事情。心理治疗师揭穿了使我们卡住的最常见概念

防止员工倦怠的一种关键方法？针对有毒客户