「语音交互规划」之 VUI简析| L-insights

来源:线性资本 2019年02月27日 18:52

近来,智能语音交互商场的热度可谓一路飙升。

跟着智能音箱ALEXA接入超越2万种设备,亚马逊在人工智能范畴完成了一次跨界奇观,离完成“speaking to future”的愿望又更近了一步。别的,据ComScore报导称:苹果iOS 和HomePod 设备的Siri每月具有超越4000万用户,美国家庭中更是将近1/10已具有了一位智能语音帮手,而且因为屏幕疲惫这个无法防止的问题,智能语音越来越被人们承受,语音交互技能也正变得越来越遍及。

“语音交互将改动咱们的日子。”

在Gartner总结的2017年几大趋势中,virtual assistants处于热门的最高位,在2018年也是居高不下。

source:gartner. com

source:Stephen Kenwright ’s blog

语音交互的首要特点在于开放式谈天功用和使命导向型功用。

假如说方便高效、轻松天然是语音交互的共同优势,那么使命导向型功用就是这些优势的完美落点。一个杰出的语音交互产品,天然是技多不压身,能掩盖的规模越多越好,供给的功用越强壮越好。

下面小线菌将从语音交互中的VUI开端,为咱们扒一扒语音交互那些事儿。

VUI简史

谈VUi前,咱们得先提到GUI。图画用户界面GUI(Graphical User Interface)是60年代「人机交互」奇才道格·恩格尔巴特提出的概念,自从80年代苹果推出第一款运用GUI的电脑后,GUI一向是人机交互的典型代表。后来,跟着越来越多的语音操控设备,如苹果HomePod和亚马逊Echo席卷商场,VUI正在协助改善各种不同的用户体会。

VUI是用户经过语音与计算机进行人机交互来发动自动化效劳或流程的东西,是直接面向用户的界面,所以是否能满意用户需求是判别其成功与否的决定性要素之一。VUI的开展进程首要能够分为以下两个时期:

诞生——纯语音交互

语音交互界面VUI (Voice User Interface) 并不是全新的概念,它的前身是交互式语音应对IVR (Interractive Voice Response) 。二十世纪九十年代,交互形式的语音应对IVR正式诞生,代表了VUI开展的第一个重要时期。用户可直接经过电话进入效劳中心,运用数字对内部体系进行指令操作。

IVR存在的首要缺陷有:

在与体系的交互进程中,假如呈现了失误,用户只能挂断重来,这使得整个交互进程极不流通,而用户也一向处于适当拘束的状态下,与现在语音交互轻松天然的空气相去甚远。

遍及——语音和屏幕结合交互

新一代的VUI更多指的是人经过天然语言与计算机进行交互,所以能够为VUI是人工智能年代下的人机交互代表。

各大公司都推出了自己的语音帮手,例如微软的cortana,谷歌的Google OK和苹果的Siri。这些语音帮手结合视觉和听觉,一起运用语音和屏幕进行人机交互。开展到这个阶段,就打破了原先IVR仅能用于单轮使命的局限性,使得语音交互有了多轮对话的可能性。

近两年,各大公司都推出了自己的智能家居音箱,例如Amazon echo和Google home这类的纯语音设备。在未来的日子和作业场景中,此种语音交互是一个新的进口,供给了更灵敏的交互办法。在未来的某一天,人们必然会抛弃屏幕和手势的操作,直接经过语音进行远距离的设备操控,而这正是各大公司抢占语音商场的原因。

VUi规划准则

VUI规划是一个以用户心思模型为中心的规划进程,意图是满意用户喜爱快餐的心思,只要创建出用户习气的,习惯的而且快捷的办法,这种规划才有可能被群众承受,赢得消费者的信任。

下面,小线菌结合各路材料总结了语音交互规划的三条基本准则:

条件:能用——切勿让用户有认知负荷

语音交互呈现给用户的首要是听和说,供给给用户的大多为瞬时不长久存在的信息,这导致用户没有可能去回忆设备的输出。声响关于人类来说更多是时间短的回忆,人们不可能一会儿记住许多新信息,所以VUI的规划准则之一就是不能让用户有认知负荷,合作人类的短时回忆功用。

要求:可用——赋予人格化,切勿好为人师

语音交互中树立人机之间的亲密联系才是捉住用户的要害,语音中包含了音量以及语调、语速、口气,这些要素能够更好地传达人的心情,使得情感的传递更为直接。一起,假如智能设备有着一个令人入神的特性,信任人们会更情愿与它进行互动并树立联系。

一起,VUI无需暗指用户需求学习怎么宣布指令,比方“假如需求XXX,请说/做XXX”此类提示。这种提示带有一些按键语音客服的痕迹,相似10086的“事务查询请按1;手机充值请按2;事务处理请按3;人工效劳请按4”。这些提示模拟了典型的按键界面(按键语音客服),以一种教师的姿势教育用户应该怎么沟通。

方针:易用——对话精确高效且相关

比方,当体系问用户,你的首要症状是什么?若用户说的是发烧和伤风,体系就要了解用户说的是两个症状,针对这个工作,体系需求进行回复两种不同的症状处理办法。

但在现在的语音交互中,却大都会呈现这样的状况:

“我想吃麻辣烫”

“为您引荐XXX,销量XXX,价格XXX,是否购买”

“有没有更廉价的”

不辨认

或是...这样的:

“这一周哪天是晴天”

不辨认

“今日合适穿什么衣服”

答不对题

要处理上述交互层面的认知问题,要害在于两点,一是语音辨认精确率,另一个则是天然语言处理水平。

我思故我在

无论是何种规划准则,都需求树立在语音交互的含义之上,而语音交互的含义,便在于距离感。

在日常日子的大大都状况中,咱们其实并没有必要运用语音交互,比方进入一家餐厅咱们能够直接运用门口的点餐机下单,履行语音下单操作并没有多大含义;再比方假如咱们一回到家灯的开关就在右手边,那么语音开灯就显得多此一举。

相反,只要咱们有了距离感,才干真实发掘出语音交互给咱们带来的便当。所以假如想让人们恰如其分地运用这些智能硬件,必定要在他们有这种距离感的条件下,比方一键唤醒,“我要打车”,“订一份凉拌面”,“看一下我快递在哪”,这样既运用了手机随身携带的优势,又发挥了语音的价值。

我思故我在,一件事物只要当具有自身的含义之后,才干被人发掘出后续存在的价值,而关于语音交互来说,而要找到这种距离感,需求对人们的每一个日子场景和日常行为进行详尽的调查和深化的考虑。

参考材料:

智能音响初体会和语音交互深考虑 -李洺宇

语音交互规划的流程及办法 -阿里TXD

Voice User Interface Insights -Prototypr

相关推荐
最新文章