汽车中的人工智能能否让驾驶变得更安全、更高效、更愉悦?

目录
目录
  • 正在加载目录...
探讨车载语音助手技术面临的挑战,以及在各种驾驶条件下提升安全性和准确性对先进人工智能解决方案的需求。

人工智能在汽车行业中的作用

人工智能(AI)在2025年国际消费电子展(CES)上占据了重要地位,尤其是在汽车和交通运输领域。英伟达(NVIDIA)首席执行官黄仁勋在主题演讲中强调了人工智能的潜力,并指出人工智能与先进计算技术将重塑我们对汽车的认知和设计方式。

人工智能驱动的汽车技术如潮水般涌入,引发了一系列重要问题。这些创新能否真正提升驾驶安全、简化用户体验并优化出行效率,还是仅仅是些花哨的噱头?人工智能能否通过在背景噪音和多人交谈的情况下实现精准的语音识别,并准确定位目标语音来源,从而切实解决驾驶员和汽车制造商当前面临的挑战?还是如某些行业专家所言,这一切不过是华而不实?

一段个人轶事

我以前经常从圣克鲁兹开车去旧金山,路程76英里,需要两到三个小时。长途驾驶令人筋疲力尽,不仅导致疲劳,还常因超速被开罚单,甚至迷路。如今,科技并未改善我在这段路上的驾驶体验。

我车上的车载娱乐系统可以连接我的iPhone进行语音导航,但车载助手(已经用了七年)已经过时且效果不佳。我的iPhone语音助手Siri经常听不清我的话、误解我的意思,或者给出错误的结果,让我恨不得把手机扔出车窗。由于我离麦克风较远加上路噪干扰,Siri很难听清我的声音。 语言模型可能也存在问题,迫使我不得不手动操作车载娱乐系统,这很不安全。大多数时候,谷歌地图都能提供导航帮助——前提是Siri能听懂我的指令。

语音AI表现不佳并非个例

这不仅仅是我个人的感受。汽车语音技术存在的问题早已被广泛研究并有据可查。《The Autopian》最近的一篇文章指出,这些系统往往存在响应迟缓、指令识别错误以及功能有限等问题,导致其效率不如传统控制系统。

考虑到当前技术带来的这些困扰,我不禁好奇,CES上展示的AI创新能否解决我和许多司机所面临的一些问题。也许吧。

前景广阔的人工智能驱动技术

__wf_reserved_inherit
现代摩比斯全息挡风玻璃显示屏| 图片来源:现代摩比斯

我在CES展会上看到的一些人工智能驱动的技术似乎有些天马行空,容易分散注意力。而另一些则似乎颇具实用价值,例如博世的逆向行驶预警系统,以及Seeing Machines的驾驶员监测技术——该技术通过监测驾驶员注意力来减少因疲劳引发的事故。此外,宝马的Panoramic iDrive系统和现代摩比斯的全息挡风玻璃显示系统,旨在以清晰且安全的方式向驾驶员提供信息。

美国公路安全保险协会的研究人员表示,保障驾驶安全的关键在于减少视觉显示带来的分心。不过,高级研究科学家伊恩·里根(Ian Reagan)告诉美联社,他认为将关键信息保持在视线范围内确实有其优势;例如,无需低头或侧头查看信息娱乐屏幕上的导航指引。宝马用户界面/用户体验开发负责人斯特凡·杜拉赫(Stephan Durach)也向美联社表达了这一观点。 该公司“全景iDrive” 系统的目标,是将 最重要的信息投射到车辆挡风玻璃下部,从而最大限度地减少分心。

人工智能与语音助手面临的挑战

然而,一个悬而未决的问题是:无论人工智能被用于导航、娱乐、挡风玻璃或仪表盘上的信息显示,还是用于保持我的警觉性,它能否让我的语音助手(无论是手机上的,还是集成在车内的)准确地听到、理解并回应我的请求。

这项技术应该能让我做到这一点,而无需重复说话、大声喊叫、看手机或操作车载界面——这些行为在驾驶时都会造成危险的分心。

根据我和同事们在CES上的亲身体验,答案是否定的。

我们的一位工程师曾参加某豪华汽车品牌举办的一款热门语音助手的演示。演示过程中,该助手在安静的车厢内回答了问题并给出了个性化回复。然而,它却无法听清后排乘客的说话内容。我不禁怀疑,如果当时存在背景噪音和交谈干扰,它是否还能听清前排乘客的说话。这种情况并非个例。

解决问题

汽车制造商和一级供应商必须优先整合能够在各种环境下理解语音的先进人工智能技术,以解决车载语音助手语音识别效果不佳及结果不准确的问题。这包括提升语音识别系统的清晰度和精准度,使其即使在存在背景噪音和多人说话的情况下,也能准确解读指令。

与Kardome等领先的人工智能公司合作,可帮助原始设备制造商(OEM)开发出强大的解决方案,从而能够识别并理解来自车内不同位置的用户语音输入。

此外,应建立持续的用户测试和反馈机制,以不断优化这些系统,确保它们能随着实际驾驶条件的演变而同步升级。汽车制造商若能专注于可靠性及以用户为中心的设计,便能显著提升消费者的整体驾驶体验和安全性。

解决方案:空间听觉人工智能技术

__wf_reserved_inherit
Kardome Mobility 采用空间听觉人工智能技术,能够定位、分离并识别多达六种独立的人声。

幸运的是,有一种方法可以解决上述问题——Kardome的“空间听觉”AI技术。这一创新的语音AI解决方案能够定位、分离并理解说话者的内容,无论对方坐在前排还是后排第三排。正如我们在今年CES展会上车内演示所展示的那样,即使在音乐声和交谈声重叠的情况下,它也能做到这一点。

事实胜于雄辩:今年,亚洲某家大型汽车制造商将把Kardome的解决方案集成到数百万辆汽车中,同时还将结合另一家声誉卓著但缺乏Kardome技术能力的公司的现有ASR技术。

最后的话

尽管汽车行业正因人工智能驱动的创新而热议不断,但这些技术的成功关键在于能否解决驾驶员日常面临的挑战。虽然某些技术在提升安全性和改善驾驶体验方面展现出巨大潜力,但语音识别系统长期存在的缺陷凸显了开发更成熟解决方案的必要性。

Kardome 的空间听觉人工智能技术实现了重大突破,证明这不仅仅是添加一些花哨的功能,而是从根本上改变了我们与车辆的交互方式。随着人工智能的不断发展,我们期待未来技术能够真正提升驾驶体验,使其更加安全、高效,甚至能带来一丝愉悦。


 

喜欢这篇文章吗?

订阅我们的邮件,第一时间获取最新的视频行业资讯、策略和洞察!

了解更多

语音AI的变现差距