买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州卓印智能科技有限公司
摘要:本发明提供了一种基于自学习标注的标注模型训练方法及标注方法,旨在解决人力成本较高的问题。标注模型训练方法:S100、从原始数据集中抽取数据进行人工标注获得初始训练数据集,并训练标注模型;S200、将剩余数据采用标注模型标注,输出识别结果和置信度;S300、划分出低置信度数据集和其他数据集,对低置信度数据集进行审查;S400、若审查结果不满足预设条件,执行步骤S500;若审查结果满足预设条件,执行步骤S600;S500、对低置信度数据进行人工标注,并训练标注模型;对其他数据集中的数据进行模型标注,输出识别结果和置信度;按照置信度将其他数据集划分为低置信度数据集和其他数据集,低置信度数据集进行审查,并执行步骤S400;S600、获得达标标注模型。
主权项:1.一种基于自学习标注的标注模型训练方法,其特征在于,包括以下步骤:S100、从原始数据集中的m个数据中抽取m1个数据进行人工标注获得初始训练数据集,并采用初始训练数据集对标注模型进行训练,获得训练后的标注模型;S200、将未进行人工标注的剩余数据采用训练后的标注模型进行标注,并输出识别结果和置信度;S300、将识别结果按照置信度排序,按照置信度将剩余数据划分为低置信度数据集和其他数据集,并对低置信度数据集进行人工审查;S400、判断人工审查结果是否满足预设条件;若人工审查结果不满足预设条件,则执行步骤S500;若人工审查结果满足预设条件,则执行步骤S600;S500、对低置信度数据集中的数据进行人工重新标注,并采用人工标注后的数据对训练后的标注模型进行再次训练获得再次训练后的标注模型;采用再次训练后的标注模型对其他数据集中的数据进行重新标注,并输出识别结果和置信度;将识别结果按照置信度排序;按照置信度将其他数据集中的数据进一步划分为低置信度数据集和其他数据集,对进一步划分出的低置信度数据集进行人工审查,并按照人工审查结果再次执行步骤S400;S600、则标注模型达标,获得达标标注模型。
全文数据:
权利要求:
百度查询: 杭州卓印智能科技有限公司 一种基于自学习标注的标注模型训练方法及标注方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。