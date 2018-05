语音助手能像真人打预约电话,谷歌是如何做到的?

科技传媒网讯 网易科技新闻 5月9日消息,据国外媒体报道,在2018年度谷歌开发者大会Google I/O上,谷歌发布了升级版的数字助理Google Assistant。谷歌介绍称,Assistant的“持续性对话”功能让对话更自然,而“多重行动”功能让用户在一次对话中可以提出多个问题。此外Pretty Please功能能够让用户的措辞更加礼貌规范。在发布会之前,CNET造访了山景城,探究了谷歌Assistant背后的Duplex技术以及其他人工智能。

起初谈话看起来并无二样。

加利福尼亚州山景城的谷歌园区中,作者被邀请收听一段预订晚餐的电话录音,只有短短的51秒。

第一个人:晚上好。

第二个人:你好?

第一个人:你好。

第二个人:嗨,呃,我想为三号星期五预订一个位子。

第一个人:好的,坚持一会儿。

第二个人:嗯。

第一个人:好的......请稍等。

第二个人:嗯。

第一个人:所以时间是星期五,十一月三号。多少人?

第二个人:对...两个人。

第一个人:两个人?

第二个人:是的。

当我听到一个男人和一个女人在对话的时候,谷歌负责数字助理业务的高管正密切关注我的反应。谷歌于当地时间周二2018年度开发者大会Google I/O,现在他们正在演示谷歌助理的新功能。

结果证明这个特别的演示非常疯狂。

那是因为听起来像一个男人的第二个人根本不是一个人。这是谷歌数字助理Assistant。而发音听起来完全不像通常从谷歌家庭智能扬声器听到的那种半机器人的声音。当其中的数字助理向你提供天气的最新信息或告诉你到达工作地点需要多长时间时,通常是一种毫无生气的电子拟人声。

作为亚马逊Alexa,苹果Siri和微软Cortana的竞争对手,这可能是谷歌数字助理Assistant的下一个演变。这听起来很明显——甚至是怪异的——只有人类自己会在回答问题前停顿一下,使用诸如“嗯”和“呃”等口头禅。它说“嗯嗯”,好似在点头同意;它拉长了某些词的发音,好像它正在花时间去思考一个问题的答案,当然它的反应是由编程算法即时实现的。

(图示:在2016年度谷歌开发者大会上,谷歌首席执行官皮查伊在介绍谷歌数字助理Assistant之前表示,“把它看作开发你自己的谷歌。”)

其背后是谷歌称之为“Duplex”的技术,由纽约、特拉维夫和山景城的谷歌工程师和产品设计师联合开发 ,听起来好像语音助手的未来已经到来。

嗯,差不多已经到来。

这个演示是谷歌计划在今年夏天发布的“实验”计划的一部分。通过Duplex技术,一小部分人可以完成预订餐厅、查看假日时间等通常通过电话进行的活动。所有这些交互都发生在后端——谷歌数字助理Assistant和餐厅之间。你甚至不会听到发生的对话。它将来自一个未指定的电话号码,而不需要使用用户自己的号码。

谷歌对部署Duplex技术的规模很小心,但表示它会受到限制。公司强调,并不是目前所有使用谷歌数字助理Assistant的用户都能够体验Duplex技术。负责谷歌助理和搜索产品设计的副总裁尼克·福克斯(Nick Fox)以及谷歌工程副总裁尤西·马蒂亚斯(Yossi Matias)均表示,由于Duplex是一项新技术,因此搜索巨头希望“谨慎行事”。

谷歌也不会说,它的目标是在以后将这个自然发声的助理带进更多的产品——比如从智能扬声器Google Home中听到它的发音。

(图示:谷歌一直在扩大其智能家居产品线,搭载数字助理Assistant的家用高端音响Home Max售价400美元)

以下是预订功能的工作原理:假设您想预约理发。只需通过Google Home询问谷歌助理Assistant,或从Android手机或iPhone应用程序中发信息告诉它什么时候去哪里。如果您在星期天中午想要吃点东西,那么Assistant会问你是否有备选,以防万一时间不够用——它清楚中午到下午2点之间的时间范围更合适。

如果此前用户使用过像OpenTable这样的自动在线预订服务,Assistant将默认使用该系统进行预约。但是,如果不以这种方式进行自动预订——而且许多小业务不会这样做——谷歌助理Assistant将会替你打电话。预定成功后,Assistant将会和你确认此次行程,并将其添加到日历中。

在另一段对话录音中,我听到两个女声在讨论预约理发。其中一个依旧是采用了Duplex技术的谷歌助理Assistant。 “她”听起来像是真正的人类。她甚至会回避问题,同时在句子的末尾调高语调,听起来甚至会让一些人恼火。

“我们对它的思考是,‘什么是完美的助理?’”在谷歌供职已经15年的福克斯表示, “当我想要一个助理时,它就在那里,随时准备提供帮助,我不担心‘我的助手能不能做到。’我的助手可以做任何我想做的事情。”

大部分时间福克斯都在谷歌从事搜索广告业务,目前负责谷歌这个标志性项目之一的产品。谷歌在2016年度的开发者大会Google I/O上发布了数字助理Assistant,距今已经有两年时间。当时谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)解释了他的愿景:Assistant是谷歌的精髓。

皮查伊和团队的目标是让谷歌的人工智能与用户一道完成一天的工作:如今在Assistant的帮助下,用户可以从智能扬声器Google Home中获取早间新闻,通过将手机摄像头对准花朵得知物种名称,在回家之前打开房间内的恒温器等等。

但是如果谷歌的实验成为现实,Assistant将真正成为用户的数字助理。 “把它想象成开发属于你自己的谷歌,”皮查伊在两年前如是指出。

(图示:负责谷歌助理和搜索产品设计的副总裁尼克·福克斯(Nick Fox)表示,“我们不想强迫人们接受,‘数字助理听起来本应如此’。”)

与此同时,谷歌正试图用更新后的Assistant赢得更多用户。除了一种男性发音和女性发音之外,这个助手还可以用六个新声音说话。 谷歌还使用户能够更轻松地提出后续问题,并在开车并使用谷歌地图时自动向某些人发送你的预计抵达时间。

人的感觉

如果谷歌的目标是让Assistant成为拟人化的谷歌,那么仍有很多事情要做。实事求是讲,到目前为止谷歌的竞争对手Alexa,Siri和Cortana都没有兑现他们的承诺。如果谷歌决定将Duplex技术扩展到Google Home以及其他面向消费者的产品,那么这种情况可能会发生变化。根据我听到的简短对话,可以感觉到似乎用户正在与办公室的行政助理交谈,或者可以说像是与斯派克·琼斯(Spike Jonze)科幻电影《她》(Her)中的操作系统Samantha进行对话。

当然,谷歌并不是第一个进入数字助理市场的公司。亚马逊在2014年发布了它的Echo智能扬声器,同时用Alexa软件提供语音功能,这让人震惊。就目前而言,智能扬声器仍然是与数字助理互动的最普遍方式,而亚马逊在美国市场占有69%的市场份额。根据研究公司CIRP的数据,2016年发布的Google Home占有31%的市场份额。

谷歌和亚马逊都在加强他们的产品线。去年,谷歌推出了40美元的家用迷你音响Home Mini和400美元的家用高端音响Home Max。相比之下,目前亚马逊有10款Echo产品,价格从40美元到230美元不等。 2月份苹果带着售价350美元的HomePod加入了这场战斗。

但是当数字助理与物联网设备连接时,可以控制从汽车中控、洗衣机到电灯等所有设备时,可能会赚更多的钱。根据市场研究公司Gartner的数据,到2020年人们将在物联网设备上花费1万亿美元。

这就是为什么谷歌一直在努力追赶的原因。今天,该公司宣布已经向全球发送了搭载数字助理Assistant的5亿台设备,其中包括扬声器,电话和电视机。 谷歌还表示,Assistant支持多达30种语言发言,并将在今年年底之前支持80个国家的语言,其中包括7个新国家,分别是丹麦,韩国,墨西哥,荷兰,挪威,西班牙和瑞典。同样,亚马逊的Echo能够在80多个国家使用。

(图示:谷歌工程副总裁尤西·马蒂亚斯(Yossi Matias)指出,“多年来谷歌一直在致力于自然语音技术的研究。”)

谷歌上周表示,兼容谷歌助理Assistant的家庭互联网设备数量从1月份的1500款增长到现在的5000款。这对于谷歌来说是一项巨大的进步,但不及兼容Alexa设备的一半。目前全球有12000款设备支持亚马逊Alexa。

谷歌的福克斯一直在试图淡化与亚马逊的竞争。

“我们很少用竞争的方式来看待它,”福克斯说,“更大的机会是那些还没有使用任何东西的人。”

尽管如此,两家科技巨头都没有害怕硬碰硬,并且为了智能家居设备的销售而相互出手。今年1月份,谷歌切断了亚马逊Echo和Fire TV访问YouTube的渠道。亚马逊的电商平台也不会出售谷歌以及其收购的智能家庭制造商Nest出品的一些小工具。

“我们并不知道所有的答案”

特拉维夫谷歌研发中心负责人马蒂亚斯则表示,谷歌多年来一直致力于开发新的自然语音技术。该公司表示,这不是一种适用于各种电话任务的通用人工智能技术,相反它是为特定任务(比如预约业务)而量身定制的。马蒂亚斯欣然承认,这项技术并不完美,谷歌正在谨慎行事,因为有更多人性化的人工智能会带来更多棘手的问题。

比如说如果软件开始胡言乱语该怎么办?马蒂亚斯告诉我,技术不会完全失控。他说,当这项功能真正发布时,软件可能会告诉另一端的人正在与数字助理进行对话。当然在我听到的录音中,Assistant并没有这样做。

马蒂亚斯说:“我们需要仔细考虑如何在实验中进行这种互动。我们相信用透明度做到这一点是正确的。”

如果对话确实出错,软件将会退回到他所谓的“实时监督培训”。在这种情况下,软件会将对话权转交给人来完成通话。由于对话通常不会受到人的监控,因此他们必须从头开始。 谷歌并没有明确这个人是否会记录此前通话中已经讨论过的内容。

Duplex技术有些类似于科幻。这就为我们带来了一些既有实际意义,又有哲理的问题:一个人应该如何对待像人一样的人工智能?人类于机器人之间的正确礼仪是什么?在不打断对话的情况下,人工智能在与人交谈时表明自己是机器人的最佳方式是什么?

当被问到这些问题时,福克斯承认谷歌工作人员正在思考这些事情。

“我们需要为每个人设定正确的期望,”他说,“这些都是技术实现的问题,我会虚心地说,我们并没有完全知道所有的答案,并且需要根据我们在现实世界中看到的情况来加深理解。”

现在在斯坦福大学工作的硅谷未来学家保罗·萨弗(Paul Saffo)对这种情况有自己的看法。他说,任何现实人工智能的创造者都有义务向与其交互的任何人透露他们正在与机器对话。

但是随着这种技术的应用越来越广泛,他认为人们会开始意识到与机器人谈话中的“告知”。萨弗指出:“随着我们的机器不断发展,人们希望自己一开始就知道他们是否正在与机器人交谈。”

助理无处不在

尽管目前Duplex技术仍然是一个实验,但谷歌的数字助理Assistant一直在不断发展,有些新功能会即刻上线。

其中包括更多的发音。Assistant有六个新的男性和女性美语发音,。一个女性的声音柔和舒缓。一个新的男性的声音稍微低沉。

“我的妻子讨厌那个声音,她说’把它从我的房间里拿走',”福克斯说,他播放的是一个像主持人一样兴高采烈的男性声音。名为WaveNet的技术使声音的扩展库成为可能,该技术大大缩短了录音员录制每种发音所需的时间和音频样本。

这些发音没有标明特定名称。相反,每个都用一种颜色来指定,如红色,橙色或绿色。您可以通过滑动手机设置来选择所需的一种。当你连接到Google Home时,只需选择您最喜欢的语音设置,扬声器就会识别你的声音,并用所选择的助理发音回复。

谷歌还调侃说,它也会将歌手约翰·莱金(John Legend)的声音赋予Assistan。

与大多数更新一样,这个想法是为了让助理更加个性化。 “我们不想强迫人们接受,”一个数字助理听起来本应如此,“福克斯说。

将于今年夏天发布的另一个更新是叫做Pretty Please的说话模式,其要求你在向助理下命令时要有礼貌。这个模式的目标是鼓励孩子们说“请”和“谢谢”,让孩子更有礼貌。当然对于成年人也是如此。

亚马逊上个月发布了一项类似的功能,用于为孩子们设计的新一代Echo Dot扬声器。 Alexa的儿童友好型版本提供了正面强化,对一个说“请”回应的孩子,Alexa会回应“谢谢你的问候。”

在亚马逊发布这项功能时,谷歌表示已经研究Pretty Please有一段时间。 “所有这些都是新生事物,”Assistant产品管理总监莉莲·雷蒙(Lilian Rincon)表示, “我们都在努力解决这些问题,这并不奇怪。”

还有很多其他新东西:你现在可以一次提出两个问题,Assistant将作出连续回答。 (例如:肯德里克·拉玛多大年纪,他最新专辑的名字是什么?)。你也可以在不说出“嗨谷歌”的情况下提出后续问题,或是重复你的问题。在对话结束之前,麦克风会保持8秒钟的激活状态。在此之前,麦克风在用户提出问题后就暂停拾音。

开车过程中,Assistant可以在你使用谷歌地图进行导航时向某人发送预定到达时间。当你在手机上访问Assistant时,它会显示更多视觉内容,例如关于最近航班信息和待办事项的提醒。你还可以设置一个“自定义例程”,在关闭早上闹铃后立即触发一组操作。这意味着可以自动开始早间新闻播放,交通状况更新以及最喜欢的歌曲。

这一切都很有用。但这也意味着谷歌智能助理会更深入地了解用户。

这值得讨论,因为用户隐私是科技领域讨论的主要话题。自从Facebook于3月份开始与剑桥分析公司(Cambridge Analytica)发生丑闻以来,硅谷大科技企业的数据收集方法在数周内都受到了额外的审查。一家数字咨询公司可以在完全不知情的情况下从多达8700万Facebook用户那里获取个人信息,这种丑闻引发了关于科技巨头如何保护用户数据以及如何赚钱的争论。大多数情况下,谷歌,Facebook和其他公司业务都依赖他们收集的有关用户喜欢什么,不喜欢什么,购物偏好,生活方式等个人信息,以便于营销人员可以投放特定广告。

谷歌去年的广告销售额达到954亿美元,而Facebook的广告销售额则达到了400亿美元。

“我们的原则一直是让用户控制这些信息,”福克斯说, “在过去几周时间里强调这一点非常重要,但我们一直都知道这很重要,对我们来说这种强化是有益的。”

他说,Assistant查询的处理方式与常规搜索查询完全相同,并具有相同的用户设置。这意味着用户可以清除搜索记录,但这可能会影响到所看到的广告。

所有这一切都是我们讨论Assistant的真正原因。正如皮查伊在2016年提到的那样,这是谷歌搜索的下一次发展,人们花在台式电脑上的时间更少,更多的时间都用在手机和智能扬声器以及汽车等互联网设备上。

当福克斯被问及他是否认为Assistant现在是谷歌最重要的项目时,他停顿了13秒。

“Assistant是谷歌一项重要业务,”福克斯说, “做正确的事真的很重要。”(晗冰)

