基于AI的语音与对话式交互是近年新兴的一块领域,最近工作中也逐渐开始和这一块打交道,那么究竟怎样才算是好的对话流体验?作为用户体验设计师又能在这中间做什么?笔者结合了一些网络参考资料和自己平时的一些思考,总结如下。
对于用户通常带着比较明确目的的咨询、操作等对话式场景,需要让用户尽可能简洁高效地输入问题或命令,并在尽可能少的轮次内给出令用户满意的回答或帮助用户完成操作。而如果拘泥于「对话流」的形式,给用户带来额外的操作成本,则成了本末倒置,比如以下这个需要70+次点击的反例:
怎样让对话变得更简洁高效呢?
首先,要清楚对话式交互并不是一个什么都可以往里面装的筐,你需要谨慎选择合适的用例——类似查天气、点歌、看新闻等快速、高确定性的用例,使用对话式交互体验更佳;而流程复杂、标准模糊、需要用户输入和确认大量信息的则未必合适。
而设计对话流的过程中,在信息输入端可以通过理解上下文潜台词、记忆用户信息、多模交互、智能建议等方式,进一步减少用户输入的成本。
理解上下文潜台词:在导购类应用中有一个场景,就是在用户买完一类商品后,推荐其购买更多相关商品,比如旅游产品中买完机票还会推荐返程票、酒店等。而这些被串联起来的商品背后涉及到的一些信息是相通的,比如机票的目的地和酒店的所在城市为同一个地方,理解了这一点,就不应该让AI再重复向用户确认一些可以直接从上下文中推断得出的信息。
记忆用户信息:在有些对话式交互场景中,需要向用户确认如姓名、手机号、身份证一类个人信息。不够智能的AI会一次次不厌其烦地让用户手动输入,而更聪明的AI则会关联用户在应用内的帐号信息,直接读取让用户确认一下即可,读取不到时也只会让用户手动输入一次。
多模交互:相比传统的文本输入,多模交互的引入,让我们可以通过语音、拍拍照、传图、行动卡片等方式和AI对话,大幅提高对话效率。
智能建议:在用户输入内容之前,基于问题上下文、用户个人信息等,给出最有可能的回答列表,让用户可以直接点选回答。
除此之外,也要考虑回答内容的阅读成本,,尽量使用口语化的简洁表述,提高回答内容的针对性等。比如基于用户端信息给出针对性回答,而不是一大段「放之四海而皆准」的通用答案:当用户咨询一个功能的入口时,能根据用户的设备信息进行回复,而非机械的「PC设备请……iOS设备请……Android设备请……」。而回答内容过长无可避免时,则可以考虑拆分成几段显示,或者加入图片、表情包、视频等调剂,降低用户阅读的压力,这方面新闻类应用Quartz就做得不错。
「一问一答」是我们最常见的一种对话模式,但实际上,客户主动发起咨询的远非他们遇到的问题全部,有更多的问题他们自己其实并没有意识到,或者不觉得这是可以通过咨询AI解决的。而聪明的AI则可以在用户根本没意识到问题存在或可能发生的时候,就主动向用户发起帮助或预警。要知道,解决问题的方式并不只有事后弥补,事前预防也同样甚至更加重要。
通过有预见性的通知推送触发对话,让用户提前避免问题发生或在问题发生后第一时间解决,在线下出行等场景中可以有很大的应用空间。再以机票预订场景为例,普通的AI可能在机票成功下单支付后就结束了,而更贴心一点的AI会主动跟踪后续的航班、天气、交通等,如果有航班管制、恶劣天气、交通拥堵等不良状况发生,可以第一时间通知用户风险,并给出对应的解决建议,而不是等用户主动跑来咨询「航班取消了怎么办」之后才回答。
对于一些客观上一发生就无解决方案的问题(比如有些商品一经售出就无法退货,用户咨询「我要退货」AI很难给出满意回答),能做到问题发生前就给出提醒也很重要,用户有了预防和心理准备,知道问题发生且不能解决时就不会过于沮丧。