发布作品

    几乎就是真人对话!这款智能汽车太懂年轻人了,我能玩一整天

    有车以后头像有车以后头像
    有车以后2021-07-27

    【有车以后 实测】近日,小鹏汽车正式推送了Xmart OS 2.6.1公测版。本次OTA升级的重头戏便是全新AI语音的发布。简单总结,相比起之前相对机械的语音,新声音变得更加温柔,更加舒服。


    全新AI语音更加自然

    市面上语音合成的方式有很多种,目前主流方法有单元拼接、合成器、基于深度神经网络合成。小P的新声音则是采用了「全新一代超大规模在线神经网络引擎+小型离线拼接引擎」的技术组合。

    根据小鹏汽车实验室数据,全新AI声音可以实现在线率97%以上。体验层面,用户几乎感受不到离线声音的存在,通过小鹏汽车自研的「端云融合多级缓存」技术,车辆可预测当下的网络情况,智能选择在线神经网络引擎或离线引擎进行声音合成,在弱网或无网络环境下,依然带来高音质语音播报,最大程度上保证弱网下的时延和音质。

    现场还透露到,其实去年小P新声音的在线率就达到了80%,但是组内对这个结果不满,本着对用户体验绝对负责的原则,直到达到97%以上才被认为达到了上线标准。

    小鹏活动现场还公布了一项数据,全新AI声音的MOS语音质量评测得分4.49。语音质量评测指标MOS(Mean Opinion Score)是一项被国际普遍认可的语音质量评测方法,它可以判断一个机器声音多大程度像真实人声,满分为5分,分数越高证明声音越完美,越令人舒适。值得一提的是,小P是目前微软MOS得分最高的车载语音助手。

    此外,小P全新AI声音采用了24K采样技术,现有声音为16k,因此听到的每句话都细腻生动、充满活力。新旧声音对比来听,会明显感受到音质的差距。

    发布全新AI语音的同时,还保留了之前的声音选项,可以通过点击小P头像手动切换,也可以语音唤醒小P下达「切换音色」的指令来切换新旧声音。

    按照小鹏汽车的规划,未来新声音还有更多的玩法。小P会拥有更多的情绪,像人类一样会欢喜、会忧愁、会羡慕、会热爱,能和人类产生更多情感共鸣,还有很多其它的情绪彩蛋。


    各项标准评价第一

    小鹏汽车现场还发布了业内首个用户视角的车载智能语音系统评价标准,具体分为四个维度,【多】可语音操作功能数量、【快】语音操作完成效率、【好】语音播报舒适程度和【爽】语音交互自由度。

    活动现场将小鹏P7(图片|配置|询价)与目前市面上主流的新能源车型和燃油车型进行了直观的横向对比。

    在提供的包括音频类、导航类、车控、信息查询、应用控制一共40条用户经常使用的高频指令中,小鹏P7平均可实现33条功能,在评测的8款车型中排名第一。其实我实测时,小鹏P7可以实现37条功能。

    在1分钟连续、快速发出语音指令,测试车辆最多能执行多少个的任务中,小鹏P7平均1分钟内可实现12条指令。而在我实测时,最多1分钟小鹏P7实现了15条指令,这要归功于小鹏P7的连续对话功能,不需要连续唤醒。

    盲测语音播报的舒适度方面也是排名第一,具体的评测维度为声音与真人的相似程度、声音音质的清晰细腻程度、喜欢该声音的程度。小鹏P7此次全新发布的AI语音获得了7.42分的平均得分,高于真人录音的6.76分。

    语音交互自由度方面,小鹏P7获得了8.47分的平均得分,排名第一。这个数据反映了目前小鹏全场景语音功能在行业中语音交互的地位,在连续对话、可见即可说、语义打断、无效语句过滤、双音区锁定等维度与其它车型相比存在比较明显的优势。


    写在最后

    根据小鹏汽车后台数据,智能语音是小鹏汽车用户最常用的智能功能,已连续21个月月使用率超过99%,连续25个月日使用率超过90%。依托全栈自研,小鹏汽车的终极目标是要实现整车功能的全语音控制。

    次阅读
    2评论
    1赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯