买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国平安人寿保险股份有限公司
摘要:本申请适用于自然语言处理技术领域,提供了一种辅助语料标注方法、装置、设备及计算机存储介质,所述方法包括:获取第一标签,所述第一标签为对于预设的第一语料数据的预测标签具有异议时,对所述第一语料数据标注的异议标签;从预设的语料数据库中确定第一集合中出现次数最多的第二标签,所述第一集合包括与所述第一语料数据的相似度满足第一预设条件的多个第二语料数据和所述多个第二语料数据分别对应的标签;根据所述第二标签和所述第一标签的比较结果,从所述第一标签和所述多个第二语料数据分别对应的标签中确定所述第一语料数据的标签。通过上述辅助语料标注方法不仅可以提高语料数据标注的准确性,还可以节约大量的人力成本。
主权项:1.一种辅助语料标注方法,其特征在于,所述方法包括:获取第一标签,所述第一标签为对于预设的第一语料数据的预测标签具有异议时,对所述第一语料数据标注的异议标签;从预设的语料数据库中确定第一集合中出现次数最多的第二标签,所述第一集合包括与所述第一语料数据的相似度满足第一预设条件的多个第二语料数据和所述多个第二语料数据分别对应的标签;根据所述第二标签和所述第一标签的比较结果,从所述第一标签和所述多个第二语料数据分别对应的标签中确定所述第一语料数据的标签;所述根据所述第二标签和所述第一标签的比较结果,从所述第一标签和所述多个第二语料数据分别对应的标签中确定所述第一语料数据的标签,包括:若所述第一标签与所述第二标签一致,则将所述预测标签更新为所述第一标签;若所述第一标签与所述第二标签不一致,则确定标注人员从所述多个第二语料数据分别对应的标签中选择的第三标签,将所述预测标签更新为所述第三标签;所述确定所述标注人员从所述多个第二语料数据分别对应的标签中选择的第三标签,包括:从所述多个第二语料数据分别对应的标签中确定出现次数排在前N的标签,N≥1;确定所述标注人员从所述出现次数排在前N的标签中选择的所述第三标签。
全文数据:
权利要求:
百度查询: 中国平安人寿保险股份有限公司 一种辅助语料标注方法、装置、设备及计算机存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。