【发明授权】对话意图识别模型训练方法、装置、计算机设备及介质_平安科技(深圳)有限公司_202011637063.X

申请/专利权人：平安科技(深圳)有限公司

申请日：2020-12-31

公开（公告）日：2024-06-21

公开（公告）号：CN112766319B

主分类号：G06F18/214

分类号：G06F18/214;G06N3/0455;G06N3/0442;G06N3/08;G06F16/953

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2022.05.27#实质审查的生效;2021.05.07#公开

摘要：本发明涉及语义解析技术领域，揭露了一种对话意图识别模型训练方法、装置、设备及介质。该方法通过将第一对话样本数据输入至基于ES检索构建的检索模型中确定增强样本数据；将第一对话样本数据以及增强样本数据输入至初始意图识别模型中，对第一对话样本数据以及增强样本数据进行增强意图识别，得到第一样本分布以及第二样本分布；根据第一样本分布及第二样本分布确定分布损失值，并根据各分布损失值确定初始意图识别模型的总损失值；在总损失值未达到预设的收敛条件时，更新迭代初始意图识别模型的第一初始参数，直至总损失值达到预设的收敛条件时，将收敛之后的初始意图识别模型记录为对话意图识别模型。本发明提高了意图识别模型的识别准确率。

主权项：1.一种对话意图识别模型训练方法，其特征在于，包括：获取预设对话样本数据集；所述对话样本数据集中包含至少一个不具有对话意图标签的第一对话样本数据；将所述第一对话样本数据输入至基于ES（Elasticsearch）检索构建的检索模型中，确定与所述第一对话样本数据对应的增强样本数据集；所述增强样本数据集中包括至少一个增强样本数据；将所述第一对话样本数据以及所述增强样本数据输入至包含第一初始参数的初始意图识别模型中，对所述第一对话样本数据以及所述增强样本数据进行增强意图识别，得到与所述第一对话样本数据对应的第一样本分布，以及与所述增强样本数据对应的第二样本分布；根据所述第一样本分布以及所述第二样本分布确定分布损失值，并根据各所述分布损失值确定所述初始意图识别模型的总损失值；在所述总损失值未达到预设的收敛条件时，更新迭代所述初始意图识别模型的第一初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始意图识别模型记录为对话意图识别模型；将所述第一对话样本数据输入至基于ES检索构建的检索模型中，确定与所述第一对话样本数据相似的增强样本数据集，包括：将所述第一对话样本数据输入至所述检索模型中，对所述第一对话样本数据进行向量编码处理，得到与所述第一对话样本数据对应的对话编码向量；自所述检索模型的检索数据库中获取所有检索对话向量，并确定所述对话编码向量与各所述检索对话向量之间的向量编辑距离；一个所述检索对话向量关联一个检索样本句子；将各所述向量编辑距离与预设距离阈值进行比较，并将小于或等于预设距离阈值的向量编辑距离关联的检索句子，记录为待选取样本数据；根据所有所述待选取样本数据构建所述增强样本数据集；所述根据所有所述待选取样本数据构建所述增强样本数据集之后，还包括：获取预设扩充倍数值，自所述增强样本数据集中根据所述预设扩充倍数值选取预设数值的待选取样本数据，并将选取的所述待选取样本数据记录为所述增强样本数据；所述获取预设扩充倍数值，自所述增强样本数据集中根据所述预设扩充倍数值选取预设数值的待选取样本数据，并将选取的所述待选取样本数据记录为所述增强样本数据，包括：将所述待选取样本数据按照所述向量编辑距离从小到大的顺序插入待选取序列中；将所述预设扩充倍数值与1之间的差值记录为所述预设数值；自所述待选取序列中选取序列在前的预设数值的待选取样本数据，并将选取的待选取样本数据记录为所述增强样本数据。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司对话意图识别模型训练方法、装置、计算机设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

下一篇：一种智能机械抓手_陇芯微(西安)电子科技有限公司_202111591327.7

相关技术

城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

一种智能机械抓手_陇芯微(西安)电子科技有限公司_202111591327.7

一种配电网低压无功补偿电容状态检测方法及装置_广东电网有限责任公司_202210780379.7

一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

外肢体机器人作业策略半物理仿真方法及系统_山东大学_202111470212.2

一种聚丙烯复合材料及其制备方法和应用_广东聚石化学股份有限公司_202211721781.4

一种羽毛片自动翻正装置_汪锐_202111663818.8

烤烟烟叶面积的测量方法及系统_河南启迪睿视智能科技有限公司_202210505490.5

一种磁性吸附材料及其制备方法和应用_国家粮食和物资储备局科学研究院_202310376075.9

一种便于安装的制粒切刀系统_创志科技(江苏)股份有限公司_202211619873.1

一种冰醋酸中微量乙酸酐的检测方法_浙江圣兆药物科技股份有限公司_202211266952.9

方法相关技术

配置方法_意法半导体(大西部)公司_202311748134.7

设备控制方法方法和装置_珠海格力电器股份有限公司_202111537707.2

模型预训练方法、模型训练方法、对象处理方法及装置_北京百度网讯科技有限公司_202310701200.9

脱水方法_赛纳塔生物有限公司_202280073278.4

任务处理方法、法律问答方法及任务处理模型训练方法_阿里巴巴(中国)有限公司_202410660148.1

移动台、基站、发送方法及接收方法_松下电器(美国)知识产权公司_201980043653.9

模型构建方法、图像分割方法、装置、设备、介质_北京字跳网络技术有限公司_202211634709.8

测试结构及其形成方法及测试方法_中芯国际集成电路制造(北京)有限公司_202211638350.1

消息发送方法、装置和资源分配方法、装置_北京小米移动软件有限公司_201880000686.0

逗留时间统计方法、货品调整方法及相关装置_浙江大华技术股份有限公司_202110672393.0

训练相关技术

下肢辅助训练器_荆丽杰_202322232049.7

确定训练样本的方法和自动驾驶模型的训练方法、装置_阿波罗智能技术(北京)有限公司_202111035596.5

一种基于训练阶段感知策略的联邦学习训练方法_南京大学_202111013367.3

模型预训练方法、模型训练方法、对象处理方法及装置_北京百度网讯科技有限公司_202310701200.9

一种专注力强化训练方法和辅助训练装置_毛玉柱_202311139333.8

一种网球训练器_哈尔滨体育学院_202322612350.0

一种模拟爆炸训练装置_江苏警官学院_202010063907.8

用于数据训练的存储装置_三星电子株式会社_202311762581.8

一种康复用训练扶梯_山东思奥尔医疗科技有限公司_202323113960.2

一种训练弹发射装置_陕西省军工(集团)胜利机器制造有限责任公司_202322575434.1

模型相关技术

一种规划模型_新疆创青晨环保科技有限公司_202322707294.9

模型更新方法、模型更新装置以及计算机存储介质_浙江大华技术股份有限公司_202410316236.X

模型预训练方法、模型训练方法、对象处理方法及装置_北京百度网讯科技有限公司_202310701200.9

模型增量训练方法、系统以及应用于日志异常检测的模型_深圳市溪数科技有限公司_202410119055.8

模型生成装置、模型生成方法及数据估计装置_株式会社力森诺科_202280075750.8

一种倾斜摄影模型与BIM模型比对分析的方法_中铁市政环境建设有限公司_202410432814.6

插拔式中间接头缺陷模型及模型的制作方法_青岛华电高压电气有限公司_201810541343.7

基于大模型技术的模型服务提供方法、平台及电子设备_北京百度网讯科技有限公司_202410324021.2

一种陶瓷房屋模型_福建省德化县杰宝陶瓷有限公司_202322594456.2

智慧机房模型管理系统及方法_浪潮通信信息系统有限公司_202410347572.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】对话意图识别模型训练方法、装置、计算机设备及介质_平安科技(深圳)有限公司_202011637063.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务