首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

模型训练方法、模型训练装置及终端设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国平安人寿保险股份有限公司

摘要:本申请适用于人工智能技术领域,提供了模型训练方法、模型训练装置、终端设备及存储介质,其中,一种模型训练方法,包括:对第一待训练语句进行掩码处理;根据进行掩码处理后的第一待训练语句对文本分类模型进行第一训练,获得第一训练完成的文本分类模型;根据第二待训练语句对所述第一训练完成的文本分类模型进行第二训练,获得第二训练完成的文本分类模型;基于待预测语句,对所述第二训练完成的文本分类模型进行第三训练,获得第三训练完成的文本分类模型。通过上述方法,可以获得准确性较高的文本分类模型。

主权项:1.一种模型训练方法,其特征在于,包括:对第一待训练语句进行掩码处理,其中,所述掩码处理指将第一待训练语句中的指定文字进行遮盖,以将所述指定文字作为待预测文字,若所述指定文字涉及第一产品名,则将涉及的每一个第一产品名作为一组待预测文字;根据进行掩码处理后的第一待训练语句对文本分类模型进行第一训练,获得第一训练完成的文本分类模型,其中,第一训练中,所述文本分类模型用于对进行掩码处理后的第一待训练语句中的待预测文字进行预测;根据第二待训练语句对所述第一训练完成的文本分类模型进行第二训练,获得第二训练完成的文本分类模型,其中,各个所述第二待训练语句中分别包括至少一个第一产品名,并且,每个所述第二待训练语句对应有业务标签,第二训练中,所述文本分类模型用于确定所述第二待训练语句所对应的业务类别;各个所述第一产品名和所述业务标签为根据产品图谱而得到,所述产品图谱中的每一个节点包括至少一个第一产品名,一个所述节点中的第一产品名对应同一个产品,并且,每一个节点所对应的属性信息包含所述节点所对应的产品的业务信息;基于待预测语句,对所述第二训练完成的文本分类模型进行第三训练,获得第三训练完成的文本分类模型,其中,所述待预测语句与所述第一待训练语句以及所述第二待训练语句不同,第三训练中,基于所述文本分类模型中的至少两个指定层的输出确定所述第三训练是否完成;所述基于待预测语句,对所述第二训练完成的文本分类模型进行第三训练,获得第三训练完成的文本分类模型,包括:在所述第三训练的每一次迭代过程中,针对一个待预测语句,将所述待预测语句输入第二训练完成的预设模型,获得第二训练完成的预设模型的至少两个指定层针对所述待预测语句所分别输出的第一词向量;针对第二训练完成的预设模型所输出的关于所述待预测语句的输出向量,获取与所述输出向量相关联的第二词向量,其中,所述输出向量所指示的业务类别与所述第二词向量所指示的业务类别相同;根据所述待预测语句中除所述第一词向量相关联的文字以外的其他部分,获得第三词向量;对至少两个所述第一词向量进行池化处理,获得第一向量;对所述第二词向量进行池化处理,获得第二向量;对所述第三词向量进行池化处理,获得第三向量;根据所述第一向量、第二向量、第三向量和预设分类网络,进行业务分类;根据业务分类结果,确定所述第三训练是否完成;在对第一待训练语句进行掩码处理之前,还包括:从预设语料中获取待识别产品名;针对每一个待识别产品名,确定所述待识别产品名分别相对于各个标准产品名的相似度信息;根据各个所述相似度信息,生成产品名关联列表,所述产品名关联列表中包括至少两个第一产品名和各个第一产品名之间的关联关系,任一所述第一产品名为标准产品名或者待识别产品名;根据预设业务信息和所述产品名关联列表,生成产品图谱;在获得第三训练完成的文本分类模型之后,还包括:通过所述第三训练完成的文本分类模型,对待检测文本进行文本分类,以确定所述待检测文本的业务类别。

全文数据:

权利要求:

百度查询: 中国平安人寿保险股份有限公司 模型训练方法、模型训练装置及终端设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。