dall-e 2使用描述来制作图像，但这是艺术吗？

图片可能值一千字，但要归功于人工智能程序称为dall-e 2，您可以拥有一个看起来更少的专业图像。

dall-e 2是新的神经网络从您提供的简短短语或句子中创建图片的算法。该程序由人工智能研究实验室OpenAI于2022年4月宣布的，尚未向公众发布。但是，包括少数人（包括在内的人）可以使用实验。

作为研究人员研究技术和艺术的联系，我渴望看到该程序的效果。经过数小时的实验，很明显，在现有的图像生成技术之前，达尔-E（并非没有缺点）的飞跃和界限。它立即提出了有关这些技术将如何改变艺术制造和消费方式的问题。当Dall-e 2似乎自动化大量创作过程本身时，它还提出了有关创造性的含义的疑问。

惊人的风格和主题

Openai研究人员建造了DALL-E 2从大量图像集中带有标题。他们收集了一些在线图像并获得了其他图像。

使用dall-e 2看起来很像在网上搜索图像：您在文本框中输入一个简短的短语，并且会退还六个图像。

但是该程序没有从网络上剔除，而是创建了六个全新图像，每个图像都反映了某些版本的输入短语。（直到最近，该程序每提示都制作了10张图像。它产生了10张图像这是不同的风格。

几乎所有人都可以合理地通过专业照片或图纸。虽然该算法并没有完全掌握“ Devo Hat”，但奇怪的头盔由新的Wave Band Devo佩戴 - 它制作的图像中的头饰即将接近。

在过去的几年中，一个小的艺术家社区一直在使用神经网络算法来生产艺术。这些艺术品中的许多具有独特的品质，几乎看起来像真实的图像，但是有奇怪的空间扭曲- 一种网络朋克立体主义。最新的文本到图像系统经常产生梦幻，梦幻的图像那可能很愉快，但很少看起来真实。

DALL-E 2在图像的质量和现实主义方面取得了重大飞跃。它还可以以显着的精度模仿特定样式。如果您想要看起来像实际照片的图像，它将产生六个类似寿命的图像。如果您想要史瑞克的史前洞穴绘画，它将产生六张史莱克的照片，就像是由史前艺术家绘制的一样。

令人惊讶的是，算法可以做到这一点。每组图像需要不到一分钟的时间才能生成。并非所有的图像看起来都会令人愉悦，也不一定反映您的想法。但是，即使需要筛选许多输出或尝试不同的文本提示，也没有其他现有方法如此快速地抽出这么多出色的结果，即使是雇用艺术家也是如此。而且，有时候，意外的结果是最好的。

原则上，任何拥有足够资源和专业知识的人都可以建立这样的系统。Google研究最近宣布了一个令人印象深刻的类似的文本形象系统，一位独立开发人员正在公开开发自己的版本任何人都可以立即在网上尝试，尽管它还不如DALL-E或Google的系统好。

很容易想象这些工具可以改变人们制作图像和交流方式，无论是通过模因，贺卡，广告 - 和是的，是艺术。

艺术在哪里？

我在使用dall-e 2来生成不同种类的各种样式的时刻（例如”Odilon Redon西雅图的绘画” - 当我打动我的时候，这比我开发的任何绘画算法要好。然后，我意识到这比我更好。

实际上，没有人能做DALL-E 2所做的事情：仅在几秒钟内创建如此高质量的各种图像。如果有人告诉您一个人制作了所有这些图像，那么您当然会说他们很有创造力。

但这不会使dall-e 2成为艺术家。即使有时感觉像魔术一样，在引擎盖下，它仍然是一种计算机算法，遵循OpenAI算法作者的指示。

如果这些图像作为艺术成功，它们就是算法如何设计，对其进行训练的图像，最重要的是艺术家如何使用它的产物。

您可能倾向于说，几个击键制作的图像中几乎没有艺术价值。但是我认为，这种思维方式回荡经典的看法该摄影不能是艺术，因为一台机器完成了所有工作。如今，人们认可了参与艺术摄影的人类作者和手工艺品，批评家了解到，最好的摄影不仅仅涉及按下按钮。

即便如此，我们还是经常讨论艺术品，就好像它们直接来自艺术家的意图一样。这位艺术家打算展示某事或表达情感，因此他们制作了这一形象。dall-e 2似乎确实完全可以捷径：您有一个想法并输入它，然后就完成了。

但是，当我绘制老式的方式时，我发现我的绘画来自探索过程，而不仅仅是执行我的最初目标。对于许多艺术家来说，事实是如此。

以保罗·麦卡特尼（Paul McCartney）的身份提出了曲目”回来在果酱会议上。他没有从这首歌的计划开始。他刚开始摆弄和实验乐队从那里开发了它。

毕加索同样描述了他的过程：“我不知道我要在帆布上放什么，而不是我事先决定要使用的颜色。。。每次我承诺画一张图片时，我都会有一种跳入太空的感觉。”

在我自己在dall-e 2的探索，一个想法会导致另一个想法导致另一个想法，最终我发现自己处于一个完全出乎意料的，神奇的新地形，距离我开始的地方很远。

提示作为艺术

我认为，在使用诸如DALL-E 2之类的系统时，艺术不仅来自最终文本提示，还来自导致该提示的整个创作过程。不同的艺术家将遵循不同的过程，并最终取得不同的结果，反映出自己的方法，技能和痴迷。

我开始将我的实验视为一组系列，每个实验都一致地潜入一个主题，而不是一组独立的古怪图像。

这些图像和系列的想法来自四周，通常与一组垫脚石。在某一时刻，在基于当代艺术家的作品制作图像时，我想以当代日本艺术家的风格来制作特定地点安装艺术的图像Yayoi Kusama。在尝试了一些不满意的位置之后，我想到了将其放入的想法La Mezquita是西班牙科尔多巴的前清真寺和教堂。我发了图片对于来自Córdoba的建筑师同事Manuel Ladron de Guevara，我们开始一起研究其他建筑思想。

这成为了不同建筑师风格中假想的新建筑的系列。

因此，我已经开始考虑与Dall-E 2做什么，既是一种探索形式，也是一种艺术形式，即使它经常像我在iPad上制作的图纸一样，它通常是业余艺术。

确实有些艺术家，喜欢瑞安·默多克（Ryan Murdoch），提倡基于迅速的图像制作被认为是艺术。他指着经验丰富的AI艺术家Helena Sarin举个例子。

“当我看大多数东西时Midjourney默多克在接受采访时告诉我：“ - 另一个流行的文本到图像系统 - 其中很多都会很有趣或有趣。”“但是有了[Sarin]的工作，就有一条贯穿线。很容易看出她已经对它进行了很多思考，并且已经在手工艺品上工作了，因为输出更具视觉吸引力和有趣，并且以连续的方式遵循她的风格。”

使用DALL-E 2或任何新的文本到图像系统的工作，意味着学习其怪癖并制定避免常见陷阱的策略。也很重要它的潜在危害，例如依赖刻板印象和虚假信息的潜在用途。使用DALL-E 2，您还会发现令人惊讶的相关性，例如，当您使用旧画家，电影制片人或摄影师的风格时，一切都变得老时。

当我有非常具体的事情时，Dall-E 2通常无法做到。结果之后需要大量困难的手动编辑。当我的目标含糊不清时，这一过程最令人愉悦，这给人带来了惊喜，这会导致新的想法，从而带来更多的想法，等等。

制作新现实

这些文本对图像系统也可以帮助用户想象新的可能性。

艺术家激进主义者丹妮尔·巴斯金（Danielle Baskin）告诉我，她总是努力“通过'真实'示例来展示替代现实：要么通过在物理世界中设置场景或在Photoshop中进行细致的工作。”但是，达尔-e 2（Dall-e 2）“是一个了不起的捷径，因为它擅长现实主义。这是帮助他人将可能的未来栩栩如生的关键 - 无论是讽刺，梦想还是美丽。”

她用它想象替代运输系统和运输面条而不是水的管道，两者都反映了她的艺术家提供的敏感性。

同样，艺术家马里奥·克林曼（Mario Klingemann）与无家可归者帐篷的建筑渲染可以作为重新加入我的幻想梦想房屋的建筑效果图。

判断这种艺术形式的重要性还为时过早。我一直在想这本书中的一句话“后文化中的艺术“ - ”主要的AI美学是新颖的。”

对于任何用于艺术的新技术，这肯定是正确的。第一部电影Lumière兄弟1890年代是新颖性，而不是电影杰作。看到图像完全移动的人们感到惊讶。

AI艺术软件的发展如此之快，以至于有着不断的技术和艺术新颖性。似乎每年都有机会探索一项令人兴奋的新技术 - 比最后一项更强大，而且每个人似乎都准备改变艺术和社会。

亚伦·赫兹曼是华盛顿大学计算机科学的会员学院。

本文从谈话在创意共享许可下。阅读来源文章。

主页

www.vwinchina.com

技术

德赢国际娱乐平台

消息

创新节

IF360

订阅

AWS

德勤

部门

提升奖

嗯

IBM

克拉纳

签证

快速政府

大多数创新的公司

大多数有创造力的人

改变世界的想法

设计创新

创新节

惊人的风格和主题

艺术在哪里？

提示作为艺术

制作新现实

视频

技术

数字人寿保险在Covid-19期间起飞。梯子想保持势头继续前进

Supercell首席执行官Ilkka Paananen在“ Clash of Clash of Clash”，NFTS的秘密酱汁中，以及为什么Supercell杀死了这么多游戏

FCC击落了SpaceX的竞标，以8.66亿美元的竞标补贴，以在美国农村推出Starlink

消息

众议院通过《减少通货膨胀法》：这是对企业的意义

Z世代的购买力比婴儿潮一代少86％

技术贴种的品牌有更多裁员：Peloton，Caln，Sweetgreen等

www.vwinchina.com

空调的UI在地上是地狱

Cinnabon如何将其主演的角色扮演在“更好的致电扫罗”上

这些传感器知道您的办公室何时未被充分利用 - 何时您的祖母跌倒了

德赢国际娱乐平台

4迹象表明您的组织过于依赖其领导者

在面试中打动某人的5种策略

在工作中诅咒已经成为可以接受的 - 对于某些人来说