广告
广告

AI什么时候准备真正理解对话?

人工智能可以通过一个人说的话来抄录可通过的工作。添加多种声音和切线,事情变得更加愚蠢。

AI什么时候准备真正理解对话?
[图像:blacklight_trace/istock,slim3d/istock]

想象一下举行有关新产品发布的会议,然后AI分析讨论并为每个参与者创建个性化的动作项目列表。或与您的医生谈论诊断,然后使用算法根据对话提供您的治疗计划的摘要。鉴于人们通常是这样的工具,这可能是一个很大的推动力召回不到20%仅仅五分钟后,在谈话中提出的想法。例如,在医疗保健中,研究表明患者忘记了医生告诉他们的40%至80%访问后不久。

广告
广告

您可能会认为AI准备介入下一次重要会议的秘书的角色。毕竟,Alexa,Siri和其他语音助手已经可以安排会议,回应请求并设置提醒。令人印象深刻的是,由于今天的语音助手和语音识别软件可能是开发AI,可以跟踪多人之间的讨论并了解他们的内容和含义带来了全新的挑战。

涉及多个人的自由流动对话比直接与语音助手说话的单个人的命令更加混乱。在与Alexa的对话中,通常只有一位扬声器供AI跟踪,并且在解释错误时会立即收到反馈。在自然的人类对话中,不同的口音,中断,演讲重叠,错误的开始以及诸如“ umm”和“好的”之类的填充词都使算法更难正确跟踪讨论。这些人类的言语习惯以及我们从主题之间反弹的倾向也使AI理解对话并适当地总结了对话变得更加困难。

假设会议从讨论产品发布会到辩论项目角色,并进行了插曲,并讲述了最近在附近开业的餐厅提供的会议小吃。AI必须遵循广泛的对话,将其准确地将其分为不同的主题,挑选与每个主题相关的演讲,并理解它的含义。否则,“访问隔壁的餐厅”可能是您会议后的待办事项清单中的第一项。

广告
广告

另一个挑战是,即使我们目前拥有的最好的AI也不是特别擅长处理行话,行业说话或特定于上下文的术语。在Abridge,我共同创建的一家公司使用AI来帮助患者进行与医生的交谈,我们已经看到开箱即用的语音到文本算法使转录错误例如将“ Tastemaker”一词代替“ Pacemaker”或“亚洲种群”作为“心房颤动”。我们发现,向AI提供有关对话主题和上下文的信息可以有所帮助。例如,在与心脏病专家进行对话时,假定“起搏器”之类的医学术语是首选。

对话的结构也受参与者之间关系的影响。在医生互动中,讨论通常遵循特定模板:医生提出问题,患者分享症状,然后医生发布诊断和治疗计划。同样,客户服务聊天或工作面试遵循共同的结构,并涉及演讲者在对话中的角色截然不同。我们发现,提供一项算法,并提供有关该算法的信息演讲者的角色对话的典型轨迹可以帮助它从讨论中提取信息。

最后,至关重要的是,任何旨在理解人类对话的AI公平代表说话者的AI,尤其是考虑到参与者可能会有自己的隐性偏见。例如,在工作场所中,AI必须说明以下事实:在对话中,演讲者之间经常存在力量失衡,而这属于性别和种族的界限。在Abridge,我们评估了我们的AI系统之一在不同的社会人口统计学组中,发现系统的性能在很大程度上取决于对话中使用的语言,而对话中的语言各不相同。

广告

虽然今天的AI仍在学习了解人类对话,但仍有几家公司致力于这个问题。在Abridge,我们目前正在建立AI,可以转录,分析和总结医​​生和患者之间的讨论,以帮助患者更好地管理健康并最终改善健康状况。微软最近通过获取细微差别,一家使用AI帮助医生抄录医疗笔记的公司,以160亿美元的价格转录医疗笔记。谷歌亚马逊还一直在建立用于医疗对话转录和分析的工具,这表明该市场将在不久的将来看到更多的活动。

在会议和客户互动中让AI坐在桌子上可以大大提高全球公司的生产率。Otter.ai正在使用AI的语言能力来抄录和注释会议,随着远程工作的不断增长,这将变得越来越有价值。合唱正在构建算法,可以分析与客户和客户的对话如何推动公司的绩效,并提出改善与客户互动的建议。

展望未来,可以理解人类对话的AI可以为具有巨大社会利益的应用奠定基础。实时,准确的转录和想法的摘要可能会使全球公司更具生产力。在个人层面上,拥有可以作为您自己的私人秘书的人工智能可以帮助我们每个人都专注于在不担心笔记或在裂缝中脱颖而出的事情而出现的对话。在线,AI不仅可以记录人类的对话,而且可以参与他们的对话,可以彻底改变教育,老年护理,零售以及许多其他服务。

广告

充分理解人类对话的能力就超出了当今AI的范围,即使大多数人都能够或多或少地在中学之前掌握它。但是,该技术正在迅速发展,算法越来越能够转录,分析甚至总结我们的讨论。不久之后,您会在下次商务会议或医生的约会中找到一位语音助手,准备分享所讨论的内容和下一步的列表。


Sandeep Konam是一名机器学习专家,在卡内基·梅隆大学(Carnegie Mellon University)接受了机器人技术培训,并在AI和医疗保健的交叉路口进行了许多项目。他是联合创始人和CTO删节,一家使用AI来帮助患者保持健康状况的公司。

广告
广告