首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】对话意图识别模型训练方法、装置、计算机设备及介质_平安科技(深圳)有限公司_202011637063.X 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-12-31

公开(公告)日:2024-06-21

公开(公告)号:CN112766319B

主分类号:G06F18/214

分类号:G06F18/214;G06N3/0455;G06N3/0442;G06N3/08;G06F16/953

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2022.05.27#实质审查的生效;2021.05.07#公开

摘要:本发明涉及语义解析技术领域,揭露了一种对话意图识别模型训练方法、装置、设备及介质。该方法通过将第一对话样本数据输入至基于ES检索构建的检索模型中确定增强样本数据;将第一对话样本数据以及增强样本数据输入至初始意图识别模型中,对第一对话样本数据以及增强样本数据进行增强意图识别,得到第一样本分布以及第二样本分布;根据第一样本分布及第二样本分布确定分布损失值,并根据各分布损失值确定初始意图识别模型的总损失值;在总损失值未达到预设的收敛条件时,更新迭代初始意图识别模型的第一初始参数,直至总损失值达到预设的收敛条件时,将收敛之后的初始意图识别模型记录为对话意图识别模型。本发明提高了意图识别模型的识别准确率。

主权项:1.一种对话意图识别模型训练方法,其特征在于,包括:获取预设对话样本数据集;所述对话样本数据集中包含至少一个不具有对话意图标签的第一对话样本数据;将所述第一对话样本数据输入至基于ES(Elasticsearch)检索构建的检索模型中,确定与所述第一对话样本数据对应的增强样本数据集;所述增强样本数据集中包括至少一个增强样本数据;将所述第一对话样本数据以及所述增强样本数据输入至包含第一初始参数的初始意图识别模型中,对所述第一对话样本数据以及所述增强样本数据进行增强意图识别,得到与所述第一对话样本数据对应的第一样本分布,以及与所述增强样本数据对应的第二样本分布;根据所述第一样本分布以及所述第二样本分布确定分布损失值,并根据各所述分布损失值确定所述初始意图识别模型的总损失值;在所述总损失值未达到预设的收敛条件时,更新迭代所述初始意图识别模型的第一初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始意图识别模型记录为对话意图识别模型;将所述第一对话样本数据输入至基于ES检索构建的检索模型中,确定与所述第一对话样本数据相似的增强样本数据集,包括:将所述第一对话样本数据输入至所述检索模型中,对所述第一对话样本数据进行向量编码处理,得到与所述第一对话样本数据对应的对话编码向量;自所述检索模型的检索数据库中获取所有检索对话向量,并确定所述对话编码向量与各所述检索对话向量之间的向量编辑距离;一个所述检索对话向量关联一个检索样本句子;将各所述向量编辑距离与预设距离阈值进行比较,并将小于或等于预设距离阈值的向量编辑距离关联的检索句子,记录为待选取样本数据;根据所有所述待选取样本数据构建所述增强样本数据集;所述根据所有所述待选取样本数据构建所述增强样本数据集之后,还包括:获取预设扩充倍数值,自所述增强样本数据集中根据所述预设扩充倍数值选取预设数值的待选取样本数据,并将选取的所述待选取样本数据记录为所述增强样本数据;所述获取预设扩充倍数值,自所述增强样本数据集中根据所述预设扩充倍数值选取预设数值的待选取样本数据,并将选取的所述待选取样本数据记录为所述增强样本数据,包括:将所述待选取样本数据按照所述向量编辑距离从小到大的顺序插入待选取序列中;将所述预设扩充倍数值与1之间的差值记录为所述预设数值;自所述待选取序列中选取序列在前的预设数值的待选取样本数据,并将选取的待选取样本数据记录为所述增强样本数据。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 对话意图识别模型训练方法、装置、计算机设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。