发布作品

    「人工智能」的到来,会给「新能源车」带来哪些有趣的功能?

    AI上车当然行得通。自2020年开始大火、至2023年已被用户普遍接受的两个功能,已经深度应用了人工智能技术(AI, Artificial Intelligence),那就是智能驾驶与语音交互功能。其中,智能驾驶应用AI技术主要是在感知环节,而语音的语音识别、语义识别、真人语音合成等环节均依赖AI技术。


    语音交互功能应用了AI技术

    这些功能中,AI技术隐藏在背后,题主可能没意识到AI的存在。题主想问的大概是,2023年大火的、像ChatGPT这样的大模型AI上车,是否会带来产业机会和变革

    所谓大模型AI,就是通过大算力、大规模训练数据来突破AI的瓶颈,量变引起质变。我认为大模型AI必然会上车,而且会带来深刻的影响,主要体现在两个方面

    • 智能驾驶:当前的技术架构下,AI主要应用于感知环节,还没有涉及到规划与控制环节,其工作模式为「传感器输入感知数据 → AI解析看到了什么 → 根据规则进行规划与控制」。自2024年开始,智驾第一梯队的车企将陆续用上「端到端」的AI大模型,工作模式变成「传感器输入感知数据 → AI直接进行规划与控制」,这将促进智驾水平迈上新的台阶。
    • 智能座舱:题主期待的可能还是ChatGPT、MindGPT这种基于自然语言处理(NLP, Natural Language Processing)的AI大模型,最多再加点绘画功能。实际上,AI大模型对智能座舱带来的影响远不止于此;就像Internet设计之初只是为了发邮件的,谁也没想到最终改变了整个社会形态

    理想汽车的MindGPT

    智能驾驶技术的进化路径,全行业存在共识:先是BEV+Transformer+占用网络三件套,然后再上大模型。有了共识,路径一致,讨论起来就比较乏味。至于AI大模型下的智能座舱最终形态,当前尚无定论;展望未来,充满着神秘的色彩,一切皆有可能。

    第一次亲眼看到AI大模型上车,大概是2023年7月,就在我家附近的上汽集团。零束为飞凡F7(图片|配置|询价)的三连屏开发了一些简单的功能,譬如通过语音指令在中控屏上实现AI绘图。这是一个保密活动,所以很可惜就没拍下照片。这个功能并没有打动我,原因有二:

    • 应用场景尚不明确:通过语音指令来绘图,从功能上来说是“语音交互”+“AI绘画”的二合一,仅仅是将此功能从PC端搬到了车机上。从尝鲜的角度来说,有一定的趣味性和展示效果。但是应用场景呢?谁开车会使用这个功能呢?
    • AI模型算力不够强:当时确实也画出了图,但很明显没有Midjourney画得生动。我猜应该是模型算力不够、迭代次数不够多吧,而且存在比较明显的时延。

    第二次是又体验了一下商汤的智能座舱,其实也是大差不差。作为供应商,商汤在应用场景开发方面的主观能动性是有限的。对了,蔚来的DMS系统是由商汤供的,它在人脸识别方面也是应用了AI技术,这也属于智能座舱的一部分。

    第三次体验AI大模型的智能座舱,则是在杭州湾的吉利汽车,这次体验比较充分,还与研究院相关部门进行了深入交流,在此将所见所感分享给大家。

    银河E8(图片|配置|询价)的AI大模型初体验

    刚来时有点惊奇:吉利汽车作为传统车企,难道会在智能座舱的AI大模型上发力?来到杭州湾,夜色已深,寒风中我们还是兴致勃勃地让工程师帮我们展示新奇的功能。我兴致也挺高,想管中窥豹去尝试看到未来。有三个功能让我们印象深刻,也引发了三个不同方向的思考


    1.音乐律动 —— 高频场景

    第一个功能,可以说是毫不起眼,甚至有点「大隐隐于市」的平平无奇感 —— 当你播放音乐时,中控屏上会通过AI大模型自动生成一张很有氛围感的图片

    听到这里,你是不是有点想骂人? 20年前买专辑,也会给配一张封面啊(如下图)!怎么到了车机上,摇身一变就成了AI大模型了?如果这还不是噱头,什么才是噱头!

    别急着下结论,咱们首先达成一个共识:氛围感搭调的图片,确实会对音乐起到锦上添花的作用。例如想到周杰伦的范特西专辑,就会想到他的红色帽衫;想到王菲,就会想到腮红较浓的这张照片(专辑名称我甚至都不记得了)。唐朝诗人王维,被苏轼评价「味摩诘之诗,诗中有画;观摩诘之画,画中有诗」。

    诗与画相得益彰,缺一不可。吉利银河的音乐律动,也是想在传统的听觉之上叠加视觉,起到1+1>2的效果。

    王维的诗与画

    聊到这里,你可能会说:就算承认氛围感搭调的图片可以起到意想不到的用户感知,但这与AI大模型有什么关系呢?那关系可大了,我在现场一下子就给工程师提了好多建议

    • 多样性:我20年的那辆电车,两年时间收藏了100多首歌曲;每次开高速几个小时,就从第一首听到最后一首。不知道有没有和我一样念旧的? 不仅喜欢新歌,更喜欢老歌。喜欢的老歌重复听几十遍,如果总是固定的专辑封面图,不免有些乏味。如果每次都生成不同的图片,岂不是更好?
    • 个性化:每个人的偏好不同,可以将这些信息输入以改变图片。例如,我比较喜欢蓝色,可以把周杰伦的帽衫给换个颜色吗?当然,让AI进行这些创作的时候,需要确保合法。
    • 车主形象与特定环境:比如车主认为周杰伦不够帅(其实还是挺帅的),就想把帽衫下面的人物换成杰森斯坦森可以吗?再比如王维的诗写的是中原/江南地区的景色,我家在东北,可以生成一个雪景吗?

    由此可见,音乐律动有可能产生的用户价值,远比最初想象的大得多,当然这需要深入挖掘用户需求才可以落实。

    说一千道一万,音乐律动始终是一个听起来比较简单的AI大模型应用,为什么我要把它放在第一位呢?这是因为,音乐律动具有很强的用户使用场景,不需要去引导、去教育,用户自然而然地就会去使用

    上车玩游戏、上车K歌、上车看电视,听起来内容更丰富一些、应用潜力更大一些,但一年到头也用不了几次;不像音乐,很多用户几乎每次开车都会用到 —— 音乐律动功能是一个纯粹的增量,不需要付出额外的教育成本,这是它最大的优点

    与之相对的,工程师给我们展示了一个AI壁纸功能 —— 圣诞节快到了,就可以下载圣诞主题的壁纸,AI在此处主要体现了多样性。当时我给的建议就是:入口太深了,辛苦开发的功能估计没几个人会用;不如直接在主页设计一个「左右划换壁纸」的功能,这样用的人就多了

    除音乐外,开车最常用的功能就是导航了。说到导航,其实AI大模型也有很强的应用潜力,只不过深度开发需要与导航供应商合作才行,目前没有放在第一优先级。


    2.WOW壁纸 —— 模型大小与算力规模

    第二个功能WOW壁纸,使用起来也是简单明了:上传一张自己的图片,生成不同风格的漫画图片,并上传到车机上

    上传到银河E8的效果如下。这块没有接缝的大长屏,视觉观感真的很爽!以前说智能车的屏幕设计要与内饰协调,而银河E8的屏幕太大了,屏幕已经成了内饰的主体,所以屏幕上的内容对于E8来说就尤为重要。

    一开始,我对这个应用不以为然。因为早在十几年前,智能手机刚出来的时候,就有这种图片风格化的APP了!后来仔细看看,发现完全不一样: 你看图片上的手表屏幕、电脑键盘、车内布置、衣服褶皱的细节就会发现,它并不是简单给图片套个风格化模板,而是深入理解图片上的信息并重新绘制的;只不过当前的设定约束了AI的手脚,所以看起来像是简单的套模板

    要实现如此丰富的AI图片细节,就需要AI模型足够大、算力规模足够强,普通的车企还真做不了!那也就是说,要实现WOW壁纸功能,银河E8还要向阿里等互联网公司买算力吗?

    并不用!因为吉利自建了星睿智算中心,云端总算力达 81 亿亿次/秒。在第 61 届全球算力 500 强榜单中,星睿智算中心·智能仿真平台位列第 185 名,是中国上榜制造业第一,可以满足350万辆车辆的并发计算需求。考虑到乘用车并不是一直处于驾驶状态,以10%的时间使用率为例则可以支撑3500万辆智能车,绝对满足吉利集团的计算需求了!

    这么高的算力,在国内全行业也属于领先水平,更不用说限定在汽车行业了。当然,这么高的算力,不只是为了算个壁纸的,而是同时服务于智能驾驶、大数据、人工智能和云计算。


    3.AI数字精灵—— 用户感知的一致性

    后来工程师又给我们展示了好几个AI大模型的功能,比如根据成语讲故事生成配图、将照片中的头像换成车主或车主孩子的照片等等。

    此时我提出了一个建议:给我的感觉是每个APP下面对应一个AI大模型,为什么不去把这些APP的功能实现多合一,不要给人一种「这有很多AI功能」的感觉,而给人一种「车里有一个聪明的AI助手」的感觉呢?

    更为具体一些,音乐律动与WOW壁纸这两个功能完全就可以二合一,听音乐生成的氛围感图片若有人物,就以我的形象来生成人物不更好吗?如此一来,就可以避免用户体验的割裂感,从而实现用户感知的一致性。

    工程师回答,这些其实都有考虑,这次展示的其实都是demo版本,只是为了演示功能的。等几个月后真正给用户OTA的时候,肯定会成熟很多!至于用户感知的一致性,2024年Q2就会OTA「AI数字精灵」功能,可以实现自然语言车控、可以闲聊、可以在Web上为用户检索信息,还有独特的形象、表情与肢体动作

    关于AI数字精灵的具体形象,由于处于保密状态,所以也不能拍照,无法展示给大家。我们也给工程师分享了对行业优秀案例的看法:蔚来的Nomi、小鹏的小P、极越的Simo。

    大家可以期待一下这个功能,用起来非常有亲和力,底层其实是比较硬核的技术,包括星睿语言大模型,星睿多模态大模型,星睿数字孪生大模型等等。

    车企AI大模型的策略思考

    后来,我们和吉利研发中心还深入探讨了一个问题:将来华为、阿里、腾讯、百度的AI大模型肯定也会进军车机,车企固然有自身的优势,但在互联网应用方面也有劣势,那么车机AI大模型应该采取什么样的策略呢

    激烈讨论的过程就不展开了,最后我们得到两个结论,大家来看看有没有道理?

    • 长期来看,应强调与车强相关的AI应用,应追求独特性:像华为、阿里、腾讯、百度这类互联网巨头,长远来看在AI算力与AI模型上会形成优势(个人判断),而且具有各自的生态(特别是华为还有手机),它们带着自己的优势,必然会侵入车机的一部分,侵占车企的地盘。从车企角度来看,与其去和互联网巨头抢这些地盘,倒不是固守自己的一亩三分地、去打那些必胜的仗。就比如说,现在去做AI大模型的导航地图,投入资源最后血本无归; 相对地,自己去做AI数字精灵,去主攻用户的情感联结,这就明智得多!
    • 短期来看,应重点关注AI对品牌的赋能,追求销售转化:与互联网巨头不同,车企开发AI大模型并不是为了收服务费,最终还是为了卖车(可预见的将来,这一论断不会变)。吉利星睿AI大模型,短期也可以提供用户价值,但更重要的是要做好配套的传播体系,来告诉大家一个信息:吉利银河虽然是传统车企造车,但在智能化方面投入很大、硬件与算力具备优势、AI应用也率先提供了用户价值。如此一来,就给吉利银河进行了品牌赋能,让关注智能化的潜客进店甚至 转化,这也就实现了销售转化的使命!

    当时我还举了一个例子,有一个AI大模型的汽车虚拟贴膜改色的功能,可以异想天花地生成各种好看的图案。

    我就建议:能不能在上线这个功能的同时,也与一些贴膜店合作一下,让虚拟改装也能落地到实物上? 如果可以的话,成千上万辆风格各异的银河车型行驶在道路上,就是移动的广告牌啊!这些广告牌在告诉大家:银河也很智能,来店里看看银河E8吧!

    当然,这个想法是否合规、是否可行、是否适合由车企主导来做,那还是需要仔细探讨的,我只是提出一个想法!

    写了这么多,不知道对大家有没有启发? 此次杭州湾之行让我觉得,吉利在22-23年的新能源转型战略,曾经让人担心忧虑能不能赶上末班车,最后执行得却非常成功!那么在24-25年的智能化转型浪潮中,吉利不会选择后发制人了,而是在AI大模型的算力布局、应用上车方面走在了前列,战略眼光长远!

    次阅读
    评论
    1赞同
    收藏
    分享
    评论
    1赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯