「人工智能」的到来，会给「新能源车」带来哪些有趣的功能？

AI上车当然行得通。自2020年开始大火、至2023年已被用户普遍接受的两个功能，已经深度应用了人工智能技术(AI, Artificial Intelligence)，那就是智能驾驶与语音交互功能。其中，智能驾驶应用AI技术主要是在感知环节，而语音的语音识别、语义识别、真人语音合成等环节均依赖AI技术。

语音交互功能应用了AI技术

这些功能中，AI技术隐藏在背后，题主可能没意识到AI的存在。题主想问的大概是，2023年大火的、像ChatGPT这样的大模型AI上车，是否会带来产业机会和变革？

所谓大模型AI，就是通过大算力、大规模训练数据来突破AI的瓶颈，量变引起质变。我认为大模型AI必然会上车，而且会带来深刻的影响，主要体现在两个方面：

智能驾驶：当前的技术架构下，AI主要应用于感知环节，还没有涉及到规划与控制环节，其工作模式为「传感器输入感知数据 → AI解析看到了什么 → 根据规则进行规划与控制」。自2024年开始，智驾第一梯队的车企将陆续用上「端到端」的AI大模型，工作模式变成「传感器输入感知数据 → AI直接进行规划与控制」，这将促进智驾水平迈上新的台阶。
智能座舱：题主期待的可能还是ChatGPT、MindGPT这种基于自然语言处理(NLP, Natural Language Processing)的AI大模型，最多再加点绘画功能。实际上，AI大模型对智能座舱带来的影响远不止于此；就像Internet设计之初只是为了发邮件的，谁也没想到最终改变了整个社会形态。

理想汽车的MindGPT

智能驾驶技术的进化路径，全行业存在共识：先是BEV+Transformer+占用网络三件套，然后再上大模型。有了共识，路径一致，讨论起来就比较乏味。至于AI大模型下的智能座舱最终形态，当前尚无定论；展望未来，充满着神秘的色彩，一切皆有可能。

第一次亲眼看到AI大模型上车，大概是2023年7月，就在我家附近的上汽集团。零束为飞凡F7(图片|配置|询价)的三连屏开发了一些简单的功能，譬如通过语音指令在中控屏上实现AI绘图。这是一个保密活动，所以很可惜就没拍下照片。这个功能并没有打动我，原因有二：

应用场景尚不明确：通过语音指令来绘图，从功能上来说是“语音交互”+“AI绘画”的二合一，仅仅是将此功能从PC端搬到了车机上。从尝鲜的角度来说，有一定的趣味性和展示效果。但是应用场景呢？谁开车会使用这个功能呢？
AI模型算力不够强：当时确实也画出了图，但很明显没有Midjourney画得生动。我猜应该是模型算力不够、迭代次数不够多吧，而且存在比较明显的时延。

第二次是又体验了一下商汤的智能座舱，其实也是大差不差。作为供应商，商汤在应用场景开发方面的主观能动性是有限的。对了，蔚来的DMS系统是由商汤供的，它在人脸识别方面也是应用了AI技术，这也属于智能座舱的一部分。

第三次体验AI大模型的智能座舱，则是在杭州湾的吉利汽车，这次体验比较充分，还与研究院相关部门进行了深入交流，在此将所见所感分享给大家。

银河E8(图片|配置|询价)的AI大模型初体验

刚来时有点惊奇：吉利汽车作为传统车企，难道会在智能座舱的AI大模型上发力？来到杭州湾，夜色已深，寒风中我们还是兴致勃勃地让工程师帮我们展示新奇的功能。我兴致也挺高，想管中窥豹去尝试看到未来。有三个功能让我们印象深刻，也引发了三个不同方向的思考。

1.音乐律动 —— 高频场景

第一个功能，可以说是毫不起眼，甚至有点「大隐隐于市」的平平无奇感 —— 当你播放音乐时，中控屏上会通过AI大模型自动生成一张很有氛围感的图片。

听到这里，你是不是有点想骂人？ 20年前买专辑，也会给配一张封面啊(如下图)！怎么到了车机上，摇身一变就成了AI大模型了？如果这还不是噱头，什么才是噱头！

别急着下结论，咱们首先达成一个共识：氛围感搭调的图片，确实会对音乐起到锦上添花的作用。例如想到周杰伦的范特西专辑，就会想到他的红色帽衫；想到王菲，就会想到腮红较浓的这张照片（专辑名称我甚至都不记得了）。唐朝诗人王维，被苏轼评价「味摩诘之诗，诗中有画；观摩诘之画，画中有诗」。

诗与画相得益彰，缺一不可。吉利银河的音乐律动，也是想在传统的听觉之上叠加视觉，起到1+1>2的效果。

王维的诗与画

聊到这里，你可能会说：就算承认氛围感搭调的图片可以起到意想不到的用户感知，但这与AI大模型有什么关系呢？那关系可大了，我在现场一下子就给工程师提了好多建议：

多样性：我20年的那辆电车，两年时间收藏了100多首歌曲；每次开高速几个小时，就从第一首听到最后一首。不知道有没有和我一样念旧的？不仅喜欢新歌，更喜欢老歌。喜欢的老歌重复听几十遍，如果总是固定的专辑封面图，不免有些乏味。如果每次都生成不同的图片，岂不是更好？
个性化：每个人的偏好不同，可以将这些信息输入以改变图片。例如，我比较喜欢蓝色，可以把周杰伦的帽衫给换个颜色吗？当然，让AI进行这些创作的时候，需要确保合法。
车主形象与特定环境：比如车主认为周杰伦不够帅（其实还是挺帅的），就想把帽衫下面的人物换成杰森斯坦森可以吗？再比如王维的诗写的是中原/江南地区的景色，我家在东北，可以生成一个雪景吗？

由此可见，音乐律动有可能产生的用户价值，远比最初想象的大得多，当然这需要深入挖掘用户需求才可以落实。

说一千道一万，音乐律动始终是一个听起来比较简单的AI大模型应用，为什么我要把它放在第一位呢？这是因为，音乐律动具有很强的用户使用场景，不需要去引导、去教育，用户自然而然地就会去使用！

上车玩游戏、上车K歌、上车看电视，听起来内容更丰富一些、应用潜力更大一些，但一年到头也用不了几次；不像音乐，很多用户几乎每次开车都会用到 —— 音乐律动功能是一个纯粹的增量，不需要付出额外的教育成本，这是它最大的优点！

与之相对的，工程师给我们展示了一个AI壁纸功能 —— 圣诞节快到了，就可以下载圣诞主题的壁纸，AI在此处主要体现了多样性。当时我给的建议就是：入口太深了，辛苦开发的功能估计没几个人会用；不如直接在主页设计一个「左右划换壁纸」的功能，这样用的人就多了！

除音乐外，开车最常用的功能就是导航了。说到导航，其实AI大模型也有很强的应用潜力，只不过深度开发需要与导航供应商合作才行，目前没有放在第一优先级。

2.WOW壁纸 —— 模型大小与算力规模

第二个功能WOW壁纸，使用起来也是简单明了：上传一张自己的图片，生成不同风格的漫画图片，并上传到车机上。

上传到银河E8的效果如下。这块没有接缝的大长屏，视觉观感真的很爽！以前说智能车的屏幕设计要与内饰协调，而银河E8的屏幕太大了，屏幕已经成了内饰的主体，所以屏幕上的内容对于E8来说就尤为重要。

一开始，我对这个应用不以为然。因为早在十几年前，智能手机刚出来的时候，就有这种图片风格化的APP了！后来仔细看看，发现完全不一样：你看图片上的手表屏幕、电脑键盘、车内布置、衣服褶皱的细节就会发现，它并不是简单给图片套个风格化模板，而是深入理解图片上的信息并重新绘制的；只不过当前的设定约束了AI的手脚，所以看起来像是简单的套模板。

要实现如此丰富的AI图片细节，就需要AI模型足够大、算力规模足够强，普通的车企还真做不了！那也就是说，要实现WOW壁纸功能，银河E8还要向阿里等互联网公司买算力吗？

并不用！因为吉利自建了星睿智算中心，云端总算力达 81 亿亿次/秒。在第 61 届全球算力 500 强榜单中，星睿智算中心·智能仿真平台位列第 185 名，是中国上榜制造业第一，可以满足350万辆车辆的并发计算需求。考虑到乘用车并不是一直处于驾驶状态，以10%的时间使用率为例则可以支撑3500万辆智能车，绝对满足吉利集团的计算需求了！

这么高的算力，在国内全行业也属于领先水平，更不用说限定在汽车行业了。当然，这么高的算力，不只是为了算个壁纸的，而是同时服务于智能驾驶、大数据、人工智能和云计算。

3.AI数字精灵—— 用户感知的一致性

后来工程师又给我们展示了好几个AI大模型的功能，比如根据成语讲故事生成配图、将照片中的头像换成车主或车主孩子的照片等等。

此时我提出了一个建议：给我的感觉是每个APP下面对应一个AI大模型，为什么不去把这些APP的功能实现多合一，不要给人一种「这有很多AI功能」的感觉，而给人一种「车里有一个聪明的AI助手」的感觉呢？

更为具体一些，音乐律动与WOW壁纸这两个功能完全就可以二合一，听音乐生成的氛围感图片若有人物，就以我的形象来生成人物不更好吗？如此一来，就可以避免用户体验的割裂感，从而实现用户感知的一致性。

工程师回答，这些其实都有考虑，这次展示的其实都是demo版本，只是为了演示功能的。等几个月后真正给用户OTA的时候，肯定会成熟很多！至于用户感知的一致性，2024年Q2就会OTA「AI数字精灵」功能，可以实现自然语言车控、可以闲聊、可以在Web上为用户检索信息，还有独特的形象、表情与肢体动作。

关于AI数字精灵的具体形象，由于处于保密状态，所以也不能拍照，无法展示给大家。我们也给工程师分享了对行业优秀案例的看法：蔚来的Nomi、小鹏的小P、极越的Simo。

大家可以期待一下这个功能，用起来非常有亲和力，底层其实是比较硬核的技术，包括星睿语言大模型，星睿多模态大模型，星睿数字孪生大模型等等。

车企AI大模型的策略思考

后来，我们和吉利研发中心还深入探讨了一个问题：将来华为、阿里、腾讯、百度的AI大模型肯定也会进军车机，车企固然有自身的优势，但在互联网应用方面也有劣势，那么车机AI大模型应该采取什么样的策略呢？

激烈讨论的过程就不展开了，最后我们得到两个结论，大家来看看有没有道理？

长期来看，应强调与车强相关的AI应用，应追求独特性：像华为、阿里、腾讯、百度这类互联网巨头，长远来看在AI算力与AI模型上会形成优势（个人判断），而且具有各自的生态（特别是华为还有手机），它们带着自己的优势，必然会侵入车机的一部分，侵占车企的地盘。从车企角度来看，与其去和互联网巨头抢这些地盘，倒不是固守自己的一亩三分地、去打那些必胜的仗。就比如说，现在去做AI大模型的导航地图，投入资源最后血本无归；相对地，自己去做AI数字精灵，去主攻用户的情感联结，这就明智得多！
短期来看，应重点关注AI对品牌的赋能，追求销售转化：与互联网巨头不同，车企开发AI大模型并不是为了收服务费，最终还是为了卖车（可预见的将来，这一论断不会变）。吉利星睿AI大模型，短期也可以提供用户价值，但更重要的是要做好配套的传播体系，来告诉大家一个信息：吉利银河虽然是传统车企造车，但在智能化方面投入很大、硬件与算力具备优势、AI应用也率先提供了用户价值。如此一来，就给吉利银河进行了品牌赋能，让关注智能化的潜客进店甚至转化，这也就实现了销售转化的使命！

当时我还举了一个例子，有一个AI大模型的汽车虚拟贴膜改色的功能，可以异想天花地生成各种好看的图案。

我就建议：能不能在上线这个功能的同时，也与一些贴膜店合作一下，让虚拟改装也能落地到实物上？如果可以的话，成千上万辆风格各异的银河车型行驶在道路上，就是移动的广告牌啊！这些广告牌在告诉大家：银河也很智能，来店里看看银河E8吧！

当然，这个想法是否合规、是否可行、是否适合由车企主导来做，那还是需要仔细探讨的，我只是提出一个想法！

写了这么多，不知道对大家有没有启发？此次杭州湾之行让我觉得，吉利在22-23年的新能源转型战略，曾经让人担心忧虑能不能赶上末班车，最后执行得却非常成功！那么在24-25年的智能化转型浪潮中，吉利不会选择后发制人了，而是在AI大模型的算力布局、应用上车方面走在了前列，战略眼光长远！