广告
广告

Adobe正在研究“ Photoshop for Voices”,这是非常不错的

第一个Adobe让我们更改图像。现在,它正在努力改变我们所说的实际话。

Adobe正在研究“ Photoshop for Voices”,这是非常不错的

记住您第一次意识到你有过?您正在查看的照片不是真实的,而是Photoshop创建的操作?好吧,你又来了。

广告
广告

在年度最大会议上,Adobe演示了一项由普林斯顿大学开发的新技术,称为Project voco。Adobe还将技术描述为“ Photoshopping Voiceovers”,因为它本质上是人类语音的Photoshop,如果Photoshop像单词一样易于使用。您会导入语音示例,并像您知道的任何音频软件一样看到其波浪形式。该系统将剪辑中的单词标识并将其拼写成文本编辑器。如果您想更改所说的任何内容,那么您要做的就是键入新词。当您再次播放剪辑时,您听到的声音说了实际录制的东西?现在说的是完全不同的事情。真是令人毛骨悚然。

“你们一直在通过照片编辑在网上制作怪异的事情,” Adob​​e的Zeyu Jin在Voco的第一个公开演示中说。“我们今天将做下一件事。让我们对人的演讲做点什么。喜欢改变您在婚礼中所说的话。”

舞台上的示威是不可思议的。一个男人说:“我吻了我的狗和妻子,”被换成“我吻了我的妻子和狗。”没关系(在音频中有简短的声音,但可以解决),但是对于传统的音频软件,您无能为力。但是,金改变了声音,说:“我亲吻了乔丹和我的狗。”“约旦”一词最初尚未记录。听起来完全是真实的。

广告
广告

这里有一个真正的商机。好莱坞电影在电影中重新录制和DUB大量对话,因为它在位置上的捕获不佳,这是一个耗时的过程,需要使星星重新回到音频摊位,以再次阅读他们的台词。从理论上讲,VOCO可以消除很多需求。也很容易想象所有这些我们正在与聊天机器人交谈能够采用我们认识和爱的人的声音。因此,当您的配偶发短信时,您会听到他们以自己的声音欺骗您关于干洗的信息。

当然,这一切都假设Voco的语音生成算法非常好。坦率地说,我们看到的太少了,以至于无法以为他们已经达到了质量点,而且他们说话的时间越长,错误就越可能显示出来。

但是我对voco的兴趣是它的不可思议的一面。听到有人说他们没有说的话感到内在的错误。Maybe it’s because I’m a journalist, who is constantly referring to audio recordings to get quotes straight, that I immediately imagine a “leaked” recording of Hillary or Trump that isn’t real at all, with an endless wave of political show hosts debating it out with audio experts.

广告

Photoshop是否提供了相同的滥用潜力?在某种程度上,当然。但是,Adobe为Project Voco展示的UX的学习曲线比Photoshop少。因为Photoshop Master可以使用该软件做任何事情,但是我们大多数人都不知道如何使用层面膜和颜色燃烧以及数字艺术家所需的所有微妙工具来充分利用软件的潜力。因此,尽管我们可以使用Photoshop来锻造朝鲜境内的核武库,但我们更有可能在健美运动员上盖上一个朋友的头部,以供一些办公室插科打no。

但是,Project Voco的技巧不需要复杂的工具栏或多年的研究来挥舞。它的用户界面实际上只是单词,您可以删除并重新使用它。所有技能已从方程式中删除,而算法在幕后工作以使您的最疯狂的梦想成真。

考虑一下,当媒体操纵既有能力又全令人简单时会发生什么 - 当我们可以令人信服地渲染我们认识的人或说我们喜欢的任何事情时,会发生什么?也许那个时候仍然有一个世纪的时间,但是如果voco展示任何东西,那就是我们可能需要一个世纪才能习惯这个想法,并为后果做准备。

广告
广告
广告
广告

关于作者

马克·威尔逊(Mark Wilson)是Fast Company的一德赢提款位高级作家,他撰写了近15年的设计,技术和文化。他的作品出现在Gizmodo,Kotaku,Popmech,Popsci,Esquire,American Photo和Lucky Peach

更多的