金融界2024年3月16日消息,据国家知识产权局公告,广州小鹏汽车科技有限公司申请一项名为“训练数据的构建方法、服务器及计算机可读存储介质“,公开号CN117708593A,申请日期为2023年12月。
专利摘要显示,本申请公开一种训练数据的构建方法,方法包括:服务器可获取满足第一预设条件的第一语句样本,对第一语句样本进行分词处理,以得到第一语句样本中词语及词语对应的词性,基于第一语句样本的词语和词性,根据第一语句样本确定第二语句样本,根据第一语句样本和第二语句样本,构建用于训练模型的训练数据。如此,在本申请中,服务器可根据满足第一预设条件的第一语句样本,确定满足第二预设条件的第二语句样本,使得语句不通顺的第二语句样本可借助语句通顺的第一语句样本生成,在一定程度上减少第二语句样本的获取过程所包括的人工参与环节,第二语句样本的获取难度得以降低,第二语句样本的获取效率在一定程度上得以提升。
本文源自金融界
渝公网安备50010502503425号
评论·0