业务合作发布作品

    长安汽车申请数据语义标注专利,提高异常样本缓存列表的准确性和效率

    金融界头像金融界头像
    金融界2024-02-12

    金融界2024年2月9日消息,据国家知识产权局公告,重庆长安汽车股份有限公司申请一项名为“一种数据语义标注方法、设备及介质“,公开号CN117540749A,申请日期为2023年11月。

    专利摘要显示,本发明涉及自然语言处理技术领域,公开了一种数据语义标注方法、设备及介质,该方法包括利用训练集的数据样本训练一个分类模型预测测试集数据样本的标签;计算测试集中数据样本的标签的置信度;根据数据样本的标签的置信度通过异常样本缓存列表更新机制,让预训练好的语义标注器在线学习人对异常样本的标注偏好知识,可以根据分类模型对数据样本预测标签的不确定性来判断数据样本是否为异常样本,并将异常样本加入或删除至预设的异常样本缓存列表中,可以有效地筛选出分类模型难以处理或错误处理的数据样本,且使用大语言模型对数据样本进行语义标注,在给定的上下文生成文本,输出语义标签,可以提高异常样本缓存列表的准确性和效率。

    本文源自金融界

    次阅读
    评论
    赞同
    收藏
    分享
    评论
    赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯