广告
广告

谷歌推出助理一个女声的真正原因:偏差数据

合成的声音扭曲女性有着悠久的历史,并成为一个自我实现的预言。但新技术正在帮助谷歌克服旧的偏见。

谷歌推出助理一个女声的真正原因:偏差数据
【动画:Videvo;AntonioMari / iStock]

语音助手历来是女性。Siri和Alexa Cortana和谷歌助理,大多数电脑版本的行政助理发起了一个女声,在大多数情况下,一个女性的名字。

广告
广告

多年来,这些声音背后的公司助理被批评使用女性的名字和声音,部分原因是他们的助手行为类似于家庭仆人决定扮演成历史的性别角色。最过分的是,微软的Cortana名叫勉强穿着个性的视频游戏。(也许是公司的工程师认为颐指气使Cortana将用户的想法一段美好的时光。)虽然男性声音现在通常可以作为一个选项,女性的保持默认。

还有一个经常被提及的原因,这些语音助手,连同他们的前辈在语音信箱等记录语音系统菜单,主要是女性。研究发现更多的人倾向于倾听女性的声音时,可能是因为经验可以追溯到我们都在子宫内。然而,这一想法也一直有争议一些真实的经历:女人有时收到抱怨他们的直言不讳的蜱虫或不认真对待(即使是男人的声音具有相同的怪癖)。

但根据谷歌,这些不是最重要的原因,当它推出了谷歌助理早在2016年,它选择了一个女性,以及,并非巧合的是,一个中性的名字。这是因为谷歌实际上想推出旗舰语音助理与男性的声音和女性的声音。但有一个技术原因无法:有一个历史偏见的语音合成系统,已培训主要在女性的声音。

广告
广告

“因为(系统)被训练对女性数据,他们通常执行更好的女性声音,“黑雁沃德说,谷歌的全球语音工程经理。

虽然谷歌助理的人格上的团队合作是推动女性和男性的声音,公司最终决定不创建一个男一个。

“我们只是没有自信我们可以得到质量,”沃德说。”花了超过一年,一年后,你不想说,“这只是不够好。谷歌真的需要提供伟大的质量。”

广告

谷歌的助理现在可以选择不同的声音。(动画:谷歌)
他解释说,谷歌的年长的语音合成系统的一部分,该缝合的音频从录音,使用语音识别算法,将标记在不同的地方在声音和单词的句子教系统开始和结束。

“如果我没记错的话,这些标记没有精确地放置(男性的声音),”沃德说。“我在许多系统,它总是难以得到男性的声音质量,可能因为这些系统,不管他们的起源,被训练更多的女性比男性的数据(数据)。”

很难动摇的范式

为什么谷歌的系统主要是女声训练数据呢?沃德称音调高往往更容易理解,另一种观点经常被用来解释为什么这么多语音助理是女性。不过,有没有证据表明更高的音调更容易听到——事实上,人们往往失去听到尖锐的声音随着年龄的能力。然而,一个从1996年确实显示有影响力的研究人们往往比男人更了解女人,而是因为女人趋向于更清楚地阐明元音,不是因为他们的声音的音高。

广告

对于女性的声音更理解已经嵌入到文本-语音训练了几十年,甚至病房引用它的原因,早期的电话运营商主要是女性(另一个原因是,女性廉价劳工因为一些职业是开放的在20世纪早期)。病房电话普遍使用的女性声音在文本-语音建立“范式”——深深地编码到谷歌的系统,该公司决定不试图创建一个男性的声音。语音合成系统的原因与偏置数据最终似乎是一个融合的研究,普遍的看法,可能惯性。

其他语音专家说,没有任何工程技术区别男性和女性的声音。“就我个人而言,作为一名开发人员,我想这可能是一个有偏见的声明,”约翰·伍特斯说,Cerence语音合成技术主管,公司构建对企业最近失去声音的细微差别,长期声音技术的领导者。“我还没有看到任何科学证据。我们可以为两性构建高质量的声音,在我看来,易于开发不是这里的主要因素。”

(截图:谷歌)
德赢提款快公司的请求,武泰分析合并后图书馆Cerence和细微差别,其中包括超过140个现成的声音和50多个自定义声音。他没有找到任何在统计上有显著差异的质量之间的男性和女性的声音,包括使用方法构建的声音一起缝声乐录音,类似于病房描述创建谷歌助理的原始声音。(当被问及武泰的意见,在Nuance-said Ward-who用来工作,他的评论只适用于谷歌的系统)。

广告

对众多的声音

随着新的机器学习技术,谷歌的年长的语音合成系统很快就过时了。后几个月推出Google女声助理在2016年5月,谷歌语音研究人员与字母的AI实验室DeepMind创建一种新的算法,不仅减少了所需的语音录音,也可以生成更现实的声音。在一年左右的时间里,研究人员能够使用该算法,称为WaveNet,推出一个新的、更自然的女声谷歌助理,紧接着一个男2017年10月。WaveNet现在权力的所有谷歌助理的声音。它是如此真实,谷歌甚至用它来创建一个熟悉的声音:,约翰的传说。是一回事,创建一个声音听起来似人类的,但这是另一件事完全逼真地模仿声音,很多人会承认。

用户可以选择听约翰传奇的悦耳的音调的谷歌助理。(截图:谷歌)
谷歌与WaveNet刚刚开始。今天,谷歌宣布将男性声音七个新国家,以前只有女性的。此外,谷歌将女性声音韩国和意大利,最初启动默认使用的男性声音WaveNet技术。(默认的性别声音因国家的不同而有所不同。)

该公司还制定了其他试图更加包容。美国版本的谷歌助理目前提供共有11的声音,其中包括英国口音和轻微的南方口音。但是有一个好的机会,大多数用户没有开关的声音加载Android手机,谷歌发言人,或其他谷歌Assistant-enabled默认设备。为了弥补这一点,谷歌现在随机排列的两种基本的声音,一男一女,分配给新用户,给用户一个50 - 50的机会获得每一个。

广告

展望未来,病房里希望有一天能够提供更加个性化。想象中挑选一个声音,你可以混合和匹配不同的属性或元素的谷歌助理,如设置更加专业在工作时间和更多的休闲时间。病房里想象的计算机系统星际马修·麦康纳的性格要求降低其幽默设置经过一些not-so-entertaining笑话。

尽管谷歌语音的技术已经有了很大改善,为什么谷歌助理是女性的故事具有重要的借鉴意义的性别偏见的方式其他偏见会渗入技术。在这种情况下,人们倾向于女性的声音导致系统训练更多的女性数据,积极创造男性声音更糟,创建一个反馈回路。

“回顾过去,可能更容易说这是为什么,”谷歌的沃德说。”当时,你只是想推进工作,这是一个数据驱动的努力。你只有你的数据。”

广告
广告

关于作者

凯瑟琳•施瓦布是快速公司的副主编的技术部分。德赢提款电子邮件:kschwab@fastcompany.com,跟着她在Twitter上@kschwabable

更多的