
文/土木
ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面。而在大模型进展如火如荼之下,其产业化也被越来越多地提及,在此背景下,关于AI大模型在汽车领域的应用,也开始热度飙升。
7月吉利预告了大模型技术;8月广汽推出“广汽AI大模型平台”;奇瑞也在跟进……在此之前,小鹏、理想、特斯拉都宣称自己拥有“自动化数据闭环系统”(大模型的一种应用方向)。李想公开宣称:“大模型的研发和训练,是智能电动车企业的必要能力。”
什么是AI大模型?简单来理解,AI大模型就像是一个庞大且复杂的神经网络,在这张网络的细枝末节中,储存着各类的数据,存储的数据越多,AI大模型就越智能。

而被誉为人工智能驾驶皇冠的自动驾驶,自然也可以利用大模型技术进行重塑和升级。不仅如此,目前看来或许还是让自动驾驶走向无人的关键助力。
自动驾驶是一个复杂的行动系统,包含了AI所需要的感知、认知推理、决策和控制执行的所有环节,技术难度极高,因为涉及物理世界的风险,要求容错率极低,甚至要做到百分百的安全,那么对技术的能力边界要求会非常高。
要想真正实现无人驾驶,就要让AI拥有识别及判断路况环境的能力,同时还必须在最短的时间内作出正确的决策并执行。
以深度学习小模型算法以及人工规则的方式难以突破完全自动驾驶要求的能力瓶颈,一是成本巨大,且周期长无法满足系统快速迭代的需求。二是人工标注不可能涵盖所有的驾驶场景。

大模型可以被看作是“大算力+强算法”相结合的产物,它的特点就是在大数据的基础上,具有自监督学习能力,不需要或很少需要人工标注数据进行训练。基于大模型方式对自动驾驶感知、认知算法进行训练和车端部署,将使得端到端自动驾驶的目标有可能实现。
未来可能就会逐步达到超过人类老司机水平的驾驶能力,最终实现无处不在的自动驾驶机器人,实现无处不在的机器智能移动。毫无疑问,大模型、大数据、大算力,已经成为自动驾驶公司迈入3.0时代的关键性标志。

在智能座舱方面,大模型的智能涌现带来理解、生成、推理、记忆等核心能力,让智能座舱业态都将被重构,包括交互、开发模式、架构、用户运营模式等。首先被重构的是人车交互方式,从“命令式”升级到“对话式”,交互自然度会大幅提升。
因此,尽管语音交互已经成为目前座舱内的主流交互,车里的语音更像是一个「语音遥控器」,需要下达明确的指令才能执行,也就是『命令式交互』。要让座舱系统更懂人,理解模糊的指令,给出更贴心的服务,不只需要座舱具有多模态感知的能力,更需要在多维度感知信息后的理解、推理和创造能力,这就是大模型的基础能力。

未来的智能座舱,用户直接表达需求,系统根据它的分析和理解,调动应用资源进行需求满足。这将改变人和应用,甚至是人和车之间的关系。
写在最后:
汽车变身为行走的计算终端,汽车的革命性形态,已经出现在视野,不再遥遥无期。现在就参与大模型构建和应用,而不是置身事外,就显得比较重要了。
渝公网安备50010502503425号
评论·0