首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

针对基于文本的AI应用的数据增强 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国际商业机器公司

摘要:本公开的实施例涉及针对基于文本的AI应用的数据增强。认知系统人工智能通过以下方式被优化:评估用于增强训练数据的不同数据增强方法,然后使用由最佳标识方法增强的训练集对系统进行训练。通过将增强方法应用于相同的训练数据集以生成不同的增强训练数据集,增强方法被评估。认知系统的相应实例利用增强集进行训练,并且每个实例经受验证测试来评估其优良度。验证测试可以包括导致分量得分的多个验证测试,并且使用每个验证测试的相应权重将组合验证得分计算为分量得分的加权平均。与具有最高组合验证得分的实例相对应的增强方法被选择,作为针对当前特定认知系统的最佳增强方法。

主权项:1.一种优化对认知系统的训练的方法,包括:接收适用于训练所述认知系统的训练数据集;将多个数据增强方法应用于所述训练数据集,以生成多个增强训练数据集;针对每个给定的增强训练数据集,训练所述认知系统的相应实例,经训练的实例与被用于生成所述增强训练数据集的对应的数据增强方法相关联,其中所述实例在所述增强训练数据集上被训练;验证每个经训练的实例以获得验证得分集合,其中对每个经训练的实例的验证包括:通过机器学习模块确定与所述验证得分集合中的每个验证得分相对应的权重集合,其中所述验证得分集合中的每个验证得分与对应于被验证的所述经训练的实例的所述数据增强方法相关联,并且所述验证得分集合至少部分地基于多个验证测试,以及使用对应于所述验证得分集合中的每个验证得分的所述权重集合来确定所述多个验证测试的加权平均验证得分;根据所述认知系统的相应实例的所述验证得分,对所述多个数据增强方法进行排名;基于所述排名来选择所述多个数据增强方法中的最佳数据增强方法;以及使用所述最佳数据增强方法来训练所述认知系统的最终实例。

全文数据:

权利要求:

百度查询: 国际商业机器公司 针对基于文本的AI应用的数据增强

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。