业务合作发布作品

    小鹏汽车申请语音识别专利,能够将端到端输出的语音识别文本实现与发音的强关联

    金融界头像金融界头像
    金融界2024-02-12

    金融界2024年2月8日消息,据国家知识产权局公告,广州小鹏汽车科技有限公司申请一项名为“语音识别方法、装置及车辆“,公开号CN117524198A,申请日期为2023年12月。

    专利摘要显示,本申请涉及一种语音识别方法、装置及车辆。该方法包括:接收车辆座舱内用户发出的语音请求;对待识别的语音请求进行特征提取,生成特征向量;根据输入的特征向量,通过端到端的预设语音识别模型输出对应的语音识别文本,并以子词的形式在车载系统的图形用户界面逐一显示;其中,语音识别模型的建模单元包括子词单元,语音识别文本中的单个单词拆分的子词数量与对应的IPA音节数量相同且强制对齐,以根据IPA音节逐一输出对应的子词。本申请提供的方案,能够将端到端输出的语音识别文本实现与发音的强关联,识别效率高,且用数据量少。

    本文源自金融界

    次阅读
    评论
    赞同
    收藏
    分享
    评论
    赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯