VUI的现状 随着智能音箱的迅速发展,谷歌(Google Home)、亚马逊(echo)、天猫精灵、小爱音箱……智能产品的井喷式增长,人们对智能语音产品的需求也越来越多,也越来越高,智能音箱对人们生活的影响也越来越深,自然应运而生一些新的职业需求,比如VUI(语音交互设计师Voice User Interfaces Designer),语音体验设计师VUE(Voice User Experience Designer),但其实VUI和VUE的分界线是很模糊的,这里不过多叙述。国际的一些大公司已经做了很好的示范了,比如亚马逊、谷歌等等,都会设立专门的职位,做一些专门的研究,当然近期国内的相关招聘也会看到有相关的职位,且薪资不低。那么接下来会跟大家详细地分享VUI(语音交互设计师Voice User Interfaces)。 VUI起源历史 1 VUI的第一个时期 20世纪50年代,贝尔实验室建立了一个单人语音数字系统。20世纪90年代,诞生了第一个可行的非特定人的语音识别系统。交互式语音应答IVR系统的出现,代表了VUI的一个重要时期。 2 VUI的第二个时期 VUI的第二个时期,也就是我们现在所处的的时期。 我们正处于下一阶段的初期阶段,我们的手机已经可以用语音处理很多事情了,但是还有很多事情是无法通过语音完成的。 3 VUI的一些优势和局限性 优势 速度:显而易见的是速度变快了,国内的语音,语音转文字的技术已经很大程度上提高了人们的效率。 释放双手:比如在开车的时候,你可以直接对着你的手机语音助手说,嘿XX,麻烦你帮我做XXX。 直觉性:说话是每个人的天性。 同理心:语音包含了语气、音量、音调、语速,这些特征包含了大量的感知信息,能够让你感知到对方在表达些什么。 局限性 环境:对环境的要求比较高,在公共场合,人多的地方不利于语音的接收和录入。 不适应:还是有很多用户不喜欢,不适应对着语音设备说话。 喜欢打字:一些用户就是喜欢打字,打字从某个方面能够带给他愉悦。 隐私:每个人都不希望自己的隐私被别人知道。 VUI设计师是什么(是做什么的)? VUI设计师是做什么的? 从项目的开始到发布阶段都扮演着非常重要的角色。 当然很多人看到上面5条可能会有点怵,其实也并不是需要全部都会,也可以专门负责其中的一个链路,节点。比如用户研究,数据分析…… VUI的基本设计原则 1 对话式设计 定义:对话式设计,简单来说就是我问你答。 目前我们使用的智能设备基本只能支持单轮对话,但这样并不是人们习惯的对话方式。一轮以上的对话,才是符合用户心理预期的。 请大家回忆下自己使用智能音箱的一些场景体验,举个例子(天猫精灵): 用户:天猫精灵,明天我有闹钟么? 天猫精灵:您明天没有闹钟呢。 用户:那可以帮我设定一个么? 天猫精灵:…… 你会发现,智能音箱这个时候像是失忆了一般,毫无反应,显然这并不是我们想要的一个交互体验。从用户社交属性来说,人们沟通的方式一直都是一轮以上对话式的,并不是单轮式的。一般来说,我们要做到让用户决定对话要持续多久,很显然,你有亲身体验过的话,能做到多轮对话的比较少。 不过,最近天猫精灵更新了游戏语音的玩法,算是前进了一步,虽然不是很棒的体验,但起码跨进了一步,相信未来会越来越棒的。 那对话式是如何设计出来的?大致是怎么样的一个流程呢? 2 设计工具 这里说的设计工具并不是说一个具体的工具,更多是指一个方法论。 示例对话 定义:示例对话字面意思就是演示举例对话,它看起来像一个电影脚本,像两个人一起在对话。 特点:是整个设计对话过程的关键方法。成本较低,简单易操作。 用法:把要做成一件事情的场景用文字写出来,然后大声读出来,你会发现书写和口语化的还是有很多区别的,甚至是有些奇怪的,这时候你会发现有很多可以改进的地方,所以你会看到一些招聘都会有这一项对应的要求,一些甚至是要求有话剧功底,有剧本写作相关经验优先。 作用:它能够让你在投入开始研发之前,知道你的设计效果如何。 3 视觉原型 虽然是语音交互,但是还是离不开GUI的,它可以结合示例对话,将用户体验可视化。示例对话和原型组成了我们产品的故事板,GUI+VUI是用户一套完整的体验,所以,VUI和GUI在早期阶段就开始合作,这样对用户体验会更加流畅。 4 流程图 流程图,也叫做呼叫流程图,一般来说我们的流程图需要包括用户使用中所有可能存在的分支,但这样下来会有千万条复杂的情况,流程图就会很乱,也很难梳理,所以我们采用分组的方法。具体的分类方法可以根据分成多组(日历功能、搜索功能,电话等),也可以根据不同的目的进行分组。 流程图使用到的工具就非常多了,这里就不一一列举了。 我们设计完成了一组示例对话之后,就要对一些细节进行细致地研究,比如:确认。 如何进行确认 如何进行确认: 1 用户语音的确认 最重要的是用户语音的确认,分为显性确认和隐形确认。 显性确认:比较重要,强制用户确认信息。比如:天猫精灵你能帮我点一份奶茶么?查到附近XXX奶茶,使用优惠后的价格是XX元,你要来一份么? 隐形确认:即不需要用户确认消息,。比如,用户:XX你能帮我设定明天10点的闹钟么?好的,已经帮你设定好明天早上10点的闹钟。 那么如何去判定什么时候用隐性确认和显性确认呢? 下面就要介绍一下三级置信度。系统将在一定的阀值内作出明确的形式确认信息。而这个阀值我们设定为三个等级。 置信度,就是智能音箱能识别到声音的清晰度。 用易懂的话说就是人与人之间沟通的语言接受的清晰度,当然听不清对方说什么话的时候一般会发起询问,或者直接说,对不起,我没有听清,你可以再说一遍吗? 三级置信度,比如帮我再买一份外卖,当置信度大于80,使用隐性确认,好了已经帮你在订了一份外卖。当置信度为45~79,使用显性确认,您是想再多订一份外卖是吗?当置信度小于45,对不起,我没有听清您的讲话,您想买些什么? 只用隐形确认 智能语音音箱能够非常清晰的识别到你说的内容的时候,可以直接用隐形确认,这样带来的体验流畅感舒服很多。 非语言式:比如说,灯光花几秒才亮,那么只是让系统先恢复好了或者知道了来让用户知道后面发生什么。还有加一些特定的音效,来代表特定某一个意思。 有趣的通用确认 有趣的通用确认,就是说智能语音音箱不会单独的回答你是和否,会主动对您进行一些问候的对话,通过这样情感化的设计,能够让用户感到更加的温暖和舒服。 前面讲到了那么多的确认策略,那我们接下来再说一下对话式的标识。因为是让用户了解交谈进展以及进展情况的重要方式。 对话式的标识 它包括了以下三个方面: 那对话式对话作用是什么呢?是让用户了解交谈进展以及进展情况的重要方式。能够更好地追踪到用户的使用过程中的一种路径方法。 大家会发现很多时候智能语音设备并不是每次都能够快速,精准接受识别我们的信息的。出错率相对来说是比较高的,下面大概说下语音识别的出现错误异常的几种情况。 语音出现错误异常和解决方法 错误异常的几种情况: 1 未检测到语音 未检测到语音有大概两种情况,一是用户说了,系统没有接收到。二是用户没说。 主要说说用户说了的情况,系统没有接收到的情况,建议采取两种解决方式。 第一种前面我们说到的三级置信度,我们采取直接询问,「对不起,我没有听清你说的话,你能再说一遍么?」第二种是采取什么也不做。 什么情况下使用询问? 什么情况下更适合使用什么也不做? 2 检测到语音,但没有识别 处理方式和未检测到语音基本是一致的,这里就带过了。 3 检测到语音,但没有回应 出现这种情况的原因一般是两点: 解决方法,这里我们就要通过测试来发现具体是哪个环节出了问题了,通过数据的收集分析能够找到具体的答案。 4 部分识别错误 大概就是这样的场景: 用户:天猫精灵,嗯…我想。 天猫精灵:嗯,好的,为您带来一首XXX的歌曲。 解决方法:这个还是需要技术的介入,可以通过使用N-Best列表(可以通过这个列表规避二次错误)和适用固件后相应的数据分析来构建此问题的解决方法。 说完了错误异常处理以及解决方式,我们接下来说下延迟和消除歧义。 5 延迟 在交互中一般用户等待的时间是7秒(现在可能是5秒),当你询问等待回答的时间超过这个阈值,用户就会怀疑是不是系统出问题了,甚至烦躁。 解决方法:一是通过「请稍等」让用户知道你在运作和查找。二是非语言提示,比如音效等等。 6 消除歧义 很多时候用户提供的信息只有一部分,再加上中文的多层含义的特殊性,消除歧义对用户体验的提升有重要作用。 比如:问地名的天气,中国很多地区的地名都是一样的。 鼓楼:河南省开封市鼓楼区、福建省福州市鼓楼区、江苏省南京市鼓楼区、江苏省徐州市鼓楼区。 解决方法:还是可以采用置信度的方式去判别,如果很确定就直接回答,要么就多轮询问确定。 7 帮助功能 最后的模块说下帮助功能。也是至关重要的,能够在一定程度上消除用户的「恐慌」,所以,在我们VUI中设计对应的帮助是非常有必要的,比如:询问智能语音设备你能干什么呢?它会告诉你他能做些什么?比如:我的设备怎么样链接你的蓝牙。APP:好的,长按…… 语音交互的几点原则 语音交互的几点原则: 1 应该是省时、高效的 和视觉界面交互其实是差不多的,用户是非常不愿意花很多时间达到他想要完成的任务的。越高效,越短时间,用户的体验会更加愉悦。 2 简短的 只需要告诉用户主要关键信息即可,不要过于冗余。举个简单的例子购物APP 的商品表现形式,一般都是把名称和价格放在主要的位置,把详情放进下一级页面。采用尽可能简短的表现形式,让用户直接获取到他想要的,当然这对用户的了解和洞察都需要经验的积累和感知的。 3 能够被随时打断 举个例子,用户:明天的天气怎么样?APP:明天XXX地方的天气19℃,小雨,适合穿……用户可能只是想知道天气而已,这时候我们是需要做到可以被用户打断,而不是「执拗」的把话说完,如果一直说下去,不允许用户打断,用户的请求没有被回应,这时候用户会产生反感心理。
怎样做好语音交互设计?(做好语音交互设计的基本流程):浪潮系统服务器地址查询
浪潮系统服务器地址查询描述::