特斯拉推出人形机器人(Optimus)时,有一个美好愿景,希望机器人能代替人类做一些脏活累活,作为人类生产力的延伸。这让人们产生一个固有联想,因为那个经典IP里的Optimus(擎天柱),四轮车跟机器人是一个东西。(不知道马斯克是不是也是这样想的。)
原来人们一直都在幻想这个未来,有一天,开一台机器人上路,会是什么样?

未来机器人上路丨图虫创意
未来,
开一台汽车机器人上路什么样?
大李开它上路的第一天。他开惯了传统燃油车,所以无实体键位操作后,他有点慌。智能助手感受出了他的窘迫,引导他说:“不如直接对我说,导航到某某目的地试试。”
路开到一半,大李擦了擦汗,自言自语了一句“好热”。智能助手主动跳了出来,询问需不需要为他调低空调?大李心想,这助手还挺“有眼力见儿”,连他想什么都知道。
半个月后,大李第一次开它载着家人自驾游。助手识别出副驾驶的身份,并生成了一份她可能爱听的一份歌单,在她“点歌”后播给她听。看着老婆欣慰的表情,大李心里很美......
很快,大李和智能助手成为“老朋友”。
智能助手把他的习惯“牢记于心”。它会在大李喜欢的电影上映前,问要不要为大李订票。
大李一三五要去接小李放学。平常的一天,大李一上车,语音助手就对他说:“除了要接小李放学,你的日历中还有一项,那就是去机场接爸妈。别忘了。但是我查到,现在去幼儿园的路上有车祸发生,路段十分拥堵。建议你先去机场。”
类似“抢答”的例子不胜枚举。
在大李眼里,这台车不仅能自由移动,自然交流,更为惊喜的是,它能自己变得越来越“聪明”,就像一个逐渐长大的孩子。大李和它交互得越多,开得越多,它越能“理解”需求,越开越顺手。
车:好痒,要长脑子了
相信不少人满怀期待:“这样的智能助手哪里找?”
事实上,我们已经在内容创作,游戏等很多领域看到了类似例子。比如通过分析网上数据,形成自己的逻辑大纲,AI生成一份符合主题要求的PPT,顺带把美工也做了;碰到与外籍同事开会别怕,AI同步翻译之时,还能把一二三重点圈出来。
甚至不依赖人类指导,斯坦福和谷歌一起做了个“西部小镇”。这里生活着25个AI,它们会生成自我导向的指令,比如一个AI想办party了,其他AI就会发邀请,然后相约协调时间,共同赴约。
这些看起来让AI有了思考、理解、逻辑、记忆等能力的背后,是因为什么呢?

现在AI已经深入了各个行业丨图虫创意
AI工程师们发现一个现象,随着模型的参数量越来越大,超过某个“临界值”的时候,模型会出现一些让人意想不到的能力,比如像人一样思考和推理。
比如Google大模型测试基准里有一项任务,给出4个emoji问模型这是电影吗?只有参数超过100亿的大模型说,这是“海底总动员”,而其他更为简单的模型都回答错了。
因此这种随着参数量、训练数据规模增加,让模型性能出现骤然可见的提升的现象,被称之为“涌现”。
大模型是一个“处理器”,传统处理器是人工去编排电路,那么大模型是用神经网络去编排电路。神经网络是旨在模仿人脑结构及功能的计算和信息处理模型。人类大脑有近860亿个神经元,它们不是“孤岛”,大脑靠着神经元之间连接,形成一个庞大的互联网络,构成了支撑人类智能和认知行为的基础。
大模型的“大”,通常指参数。通过不断的训练,就如我们今天看到的那样,大模型掌握了一些底层的规律和结构,比如在语言,生物结构等方面,并且形成了独有的解读方式。
大模型借助“预训练+微调”的方式,预训练是为了让模型有基础的认知和逻辑,通过微调引导,让它知道如何“调用”已有的知识,更好地处理每一项任务。
如今大模型具备了通用性和泛化能力,对比以前一个训练好的模型,就只能来做一个任务。大模型突破了对自然语言的理解——这是基础,因为人类用语言描述世界,从而建立了对世界的认知,这样AI得以执行各种各样的自然语言处理任务。
基于大模型的对话机器人能当“情感治疗师”;用AI大模型画画,差点儿抢了人类画师的饭碗;AI写的网文,情感丰沛,比人更新得还快;把会做数学题的大模型放进平板里,它直接来辅导孩子作业,顺便“挽救”了一个家庭。
所以就有了上面的那一幕,我们正在期待大模型上车之后,能带来一个多么智能驾驶和智能乘坐的未来。

更具未来感的智能座舱
许多车企都在为此努力了,10月17日,“百度世界大会”上,百度董事长李彦宏放了一段“极越01”的体验视频,并且也在畅想“大模型上车”后的美好未来—智能座舱将拥有逻辑推理、策略规划和内容生成等更多能力,这些能力将率先落地在全球首台AI汽车机器人极越01上,极越01将成为目前最聪明、最懂你的汽车机器人。
车里的语音助手,
终于不智障了
极越01目前能实现,人在车外,就可以对它发号施令了。“Hi SIMO,把后备箱打开。”“Hi SIMO,把车门打开。”

人在主驾位置可以免唤醒使用语音,其他座位也能唤醒后的一段时间内发出更多指令。试问一下,谁没有被车外堵车的喇叭声吵得心烦意乱的时候,叫了语音助手几遍也没反应。现在好了,不需要重复唤醒 ,你可以一连串给它多个指令,多快它都接得住。
如果同行四个人,各有各的需求,分别想要查导航、调座位、听歌、开空调。这些要求一股脑抛给SIMO,它有区分四个音区的能力,可以挨个执行指令,应对自如,而不是像有些“人工智障”一样直接被“气到”。“我不理解,对不起,再见。”


渝公网安备50010502503425号
评论·0