语音交互是一个全新的体验设计领域,目前各家机构、公司、设计组织还处于摸索设计范式的阶段,Google提供了一份非常成熟、系统的交互规范文档,其中包含了核心概念的诠释以及诸多可以指导设计的实践原则。最近正在做的项目中涉及到语音交互的部分,所以顺手将这份文档翻译出来,给需要的设计师参考。
我的译文尽量的贴合文档中原有的表意,同时基于我个人对语音交互的理解对表达文字进行润色。其中有个别概念名词比较抽象,所以我也旁边附上了英文单词,以便大家理解。
这份文档内容比较长,我分了章节,陆续发出,感兴趣的同学可以关注订阅。
以下进入正文。
我们正在进入一个有光明前景的全新计算领域,机器学习和人工智能激发着对话式界面和自然语言的进步,同时使对话式交互成为一种新的交互模式。
目前,识别语音输入的相关问题已经大部分得到解决,而现在我们面临一个新的挑战:如何构建一种继承人类自然语音会话的用户体验模式。
本站内容涵盖了关于对话的核心机制,介绍了核心的设计原则,并提供一个可实践的UI工具,帮助你为用户创建有吸引力、令人愉悦并有实际价值的对话式用户体验。
一、对话的基础概念
通过对自然对话中我们几乎无意识遵循的规则与惯例进行解构,我们总结出一些形成良好对话的关键要素,包括:
1. 轮流(Turn-taking)
在对话中我们基于互相来回传递的微妙信号进行轮流表达。如果会话中缺少这种有效的轮流互换,我们就有可能难以保持信息的同步或无法跟上对方的节奏。
2. 串联(Threading)
在自然语言中,对话的元素通常会被连贯的串联在一起,包括上下文以及随时间演进的对话方式。这种串联帮助我们跟进会话过程。
3. 利用语言的潜在效率
人们经常会用简略的口语交流,因为他们可以了解其中的含义。我们在对话中自动补全那些句子之间那些“没有被说出来的”潜台词,有些表达可以不言而喻。但是与软件系统进行对话,就需要弥补人类语言中那些似乎不合逻辑的、无法被计算的自然属性。
4. 预估用户行为的多样性
对同样的内容,人们会根据情景上下文和对话的期许,采用不同的词汇和方式来表达。所以对话式UI应该考虑支持这种多样性,以便所有用户都能够无障碍体验。
设计师不应该仅仅关注所谓的“愉悦路径”(happy path),而是要在所有场景中创造稳定的体验,即使是那些看起来像是”出错“的场景。在任何对话中,都可能出错,就像人们经常会发现和修复自己的错误一样,设计师必须也应该可以在对话的过程流中修复出现的问题。
二、理解合作式行为(cooperative behavior)
轮流表达、上下文和串联是合作式会话的组成部分,这是由哲学家保罗·格里斯(Paul Grice)普及的一个概念。格里斯把它称为合作原则(Cooperative Principle)。他还创建了“格里斯原则”,来诠释他所观察到的会话中的原则——人们的交谈应该尽可能的真诚、详实、有相关性并且清晰。
对话式UI应该尽量的遵循这些固有的合作原则,也要准备好同时支持那些有过不良对话体验的用户。
三、解锁口语的力量
好的UI体验不会被限制在一个固定的脚本中,也不应该像过去的触摸式屏幕交互那样强迫用户沿着单一路径去操作。对话式UI应该聚焦到发挥语言和表意的强大力量,采用人们日常的语言来交流,而不应该为了把用户束缚在“愉悦路径”上而去“教导”用户。另外,也要尽量避免说那些显而易见的东西,或是以高高在上的语气说话。人们不会喜欢那种听起来比他们自己要聪明的设备。
四、向用户传递信心
好的UI也意味着确认用户的输入和管理用户的预期,以便获取用户的信任、传递信息。
当用户提出请求,在UI体验可以进行确认——用类似“OK”、“Sure”、“Alright”、“Thanks”或“Got it”的短语进行反馈,来表示接收到指令和正在聆听。随机的确认语可以让体验更加流畅自然。
进行反馈后,系统可以请求显性或隐性的确认。通过显性的确认(通常在重要任务的场景中,如订购机票),UI会在进行下一步之前请求用户的口头确认。
而在隐性确认中(通常适用在低风险的场景,如播放一首歌),UI会将用户请求中的关键信息融入到自己的反馈中,来给予用户反馈,向用户传递信息,这种确认不需要用户的口头确认。