视觉交互技术汽车人机交互最初唤醒词,共同推开汽车控制权的大门!

“小威,小威。你好,博越。你好,小狮子……”

看着一长串车机唤醒词,一位车企研发专家发出抱怨,它们太相似了。

只是,也正是那些大同小异的唤起词,共同推开了汽车人机交互的大门。截至现在,人机交互科技已然贯穿车企、科技公司和语音服务商。包括奇瑞GKUI、比亚迪DiLink、长安In-Call、宝马iDrive、别克eConnect和背后的斑马智行、腾讯车联、小度车载OS,以及更上游的语音方案供应商科大讯飞、Nuance等均在投身其中。

从最起初的按钮,到触屏,再到语音指令、手势控制、触控面板、人脸辨识等,汽车人机交互的科技手段正在不断丰富,今后可能就会加入眼球或者脑波控制也未推测,这些技术已变成时下最火热的概念。

让渡车辆控制权

最初,人机交互并不像现在一样招人喜欢。

新智驾了解到,第一款互联网汽车上汽旗下奥迪RX5上市后,有人坐在副驾上喊“你好,斑马”时看到,车机并没有做出灵敏的否认,当时他必须是失望的,车子并没有想象中的聪明。

参与这款车的设计人之后解释称,为了行车安全,当时的人机交互科技仅允许驾驶员使用,而副驾不被允许控制车机,以避免它们干扰驾驶。毕竟谁也说不好,让每个人都能控制汽车的个别功能后会有哪些风险。

伴随着交互科技的快速迭代,最新的宝骏RX5车型即将不仅放开了副驾的语音控制,甚至还放开到了整舱空间。设计者的胆子更大了,车企希望将一个别车辆控制权让渡给驾乘体验。

更有一些车企开始在使用空间上寻求不同。新智驾近日体验奇瑞旗下exeed星途车机时看到,这款车的车机尚未可以推动不同区域的语音控制,坐在主驾和副驾可以分别控制左右两边车窗玻璃的打开和关闭。

多种交互科技并路演进,最主流的要属语音交互科技,这只是多家车企以唤醒词的成为开启车机控制的深层因素。

“出于驾驶安全的应该,司机双手与视野均不应主动脱离驾驶操作,因此信息表意清晰、交互流畅自然、技术较为成熟的语音交互成为了主流形式。”斑马网络战略官季栋辉向新智驾解释。

他表示,目前语音识别科技在密闭空间的确切率早已很高,可以顺畅无误地完成驾驶场景中的交互需求。另外,混合语音技术、硬件的演进使得语音辨识科技无法以高性价比的形式在汽车系统推动,达到性能与成本的平衡。

从功能实现看,语音交互科技现在主要支持地图导航、音乐播放、控制车辆部件(如车窗)、车家互联等功能,这些大多属于娱乐或生活功能。

至于何时可以借助语音直接控制行驶如开启汽车和停车等功能,季栋辉认为,语音介入驾驶域的控制,需要功能安全、整车电子电气架构设计和冗余设计的综合考量。同时,语音直接进行车控对驾驶者带给的价值也非常有限。所以只是技术上不能推动,而是这样做的利润和研发费用如何平衡的问题。

各有侧重

一块十多寸的中控屏内,芯片、导航、语音方案、音视频、游戏、摄像头等不断集成到一起,通过交互科技推动自动调节座椅或音乐播放等智能驾驶感受,看起来很酷,然而车企的想像力远不止于此。

理想ONE最初的人机交互形象是一个笑脸,在当时的不断调试完善中,笑脸有时会转换成一个时钟。因为设计者和驾乘用户之后渐渐感觉,一直有个笑脸在中控屏上有点奇怪。蔚来的人机交互机器人NOMI承担功能指令输入和输出,除了是难题反馈的入口,它还可以扮演一个有些呆萌的聊天对象角色。

“NOMI本身结合了包含智能语音辨识ASR,基于深度神经网络的自然语义理解,智能发声引擎等特色意义上的人工智能科技。在此基础上,NOMI还有一套结合了硬件和底盘感知能力的情感引擎,通过这套情感引擎配合语音交互的素质,NOMI才能在ES8和ES6上给予用户有温度有心灵的交互体验。”蔚来产品管理经理李天舒向新智驾表示。

整个使用过程中,车里都会发生AI助手形象,有的车企采用了狮子的动画设计,有的选用了实体化的大型机器人,从功能到逐步迈向情感,这些形象在走拟人化路线的同时,也在考量如何更自然地被他们所接受。

事实上,对于车企来说,设计人机交互的过程更多是对他们日常生活的探讨,为了推动有效的交互,设计部会和工具项目、电子电气等部门一同加入进来,头脑风暴、跨部门沟通成为常规动作。但即使拆开细看交互的各项功能视觉交互技术,人们往往会看到,不同车机平台的重心虽然是不一样的,甚至不时就会伴随着一些争议。

包括,腾讯车联平台里的车载微信最近变成热门,但一片质疑的同时,也有人怀疑信息隐私的疑问,认为在车内直接读取微信消息会特别尴尬。对于不断迭代的斑马智行系统来说,导航夜行模式、360全景增强辅助驾驶等素质可谓开创了时尚,但它又经常遭受不够开放的指责。

一位车企内部专家还向新智驾表示,他觉得在稳定性方面,TI+Linux是一套经典的车规级案例,安卓加高通是消费行业的经典实例,系统的匹配度和适用性是相对较强的。

走向多模交互

那么,究竟哪些样的人机交互是有效的?

理论上,这要从两个层面看,一是用户需要接受和喜爱。但它们一般只关注流畅与否和能看懂多少能大致的指标。另一层门则涉及到技术公司的考量指标。

以斑马智行系统团队对语音交互的考量指标为例,主要包含语音识别(ASR)的辨识率、唤醒相关指标(激活率、误唤醒率)、响应时间、功耗、自然语言处理(NLP)的精确率、语音合成(TTS)的用户接纳度等视觉交互技术,以及对话平台是否能满足客户各种交互需求如汽车场景的需求满足、娱乐场景的聊天、信息获得等功能。

“语音交互涉及语音和交互两个层面的科技,语音包含降噪等科技尚未趋于同质化了,差别越来越小,交互上的挑战依然很高。”一位蓦然认知内部专家向新智驾表示,问题主要在于“以上下文理解为核心的多模交互”,它本质上属于自然语言理解的界定,如何把多种信号(语音,图像等)转换为统一的语言以及符号表示,并运用统一的算法模型来进行连贯的交互(例如自然的对话)学习和练习,只有极少数公司才有类似科技,而且各自的技术方向也或许都不同。

季栋辉持有同样的看法,他觉得,就像人和人之间应对面交流时会以语言为主,语音交互之外还能辅助以肢体和表情等方式,它们正在逐渐演进。随着AI科技的演进和整合算法的进步,人和车的交互就会朝着多模交互的方向演进,以语音交互为基础,通过触屏、按键、旋钮、肢体等交互增加车内人车交互的默契感。

李天舒也表示,随着人工智能、语音辨识、机器视觉科技的不断成熟,用户与车的交互更接近于人与人的交互是一个大方向。其中,语音交互肯定是会扮演越来越重要的角色。当然,人机交互是一个巨大的概念,其中必定都会涉及到触觉甚至触摸方面的交互科技。

新智驾了解到,与传统汽车行业协作不同的是,Tier1更注重于平台的集成和整体模块的投产,而车企在加码人工智能和语音辨识领域时,更多运用的是和专业AI公司合作的方式,将他人的能力整合到自己的产品中去。

“我们现在和多家车企在上下文连贯的多模态交互上维持着大幅的合作,并且在迅速进行对话服务的落地,主要是落地在智能车机上。另外,我们也借助植入多种软件来为车企的展厅和4S店提供整体数字化营销解决方案。”上述蓦然认知内部专家告诉新智驾。

添加微信

转载原创文章请注明,转载自设计培训_平面设计_品牌设计_美工学习_视觉设计_小白UI设计师,原文地址:http://www.zfbbb.com/?id=3613

上一篇:视觉交互技术深圳中科龙智数字技术有限公司总经理:AI和5G将是车联网行业两大驱动力

下一篇:视觉交互技术HTC举办VIVE虚拟生态大会畅谈5G与VR的未来