多轮对话管理方法、装置和计算机设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：平安科技(深圳)有限公司

摘要：本申请揭示了多轮对话管理方法，包括：接收输入的第一对话，并提炼出第一对话的结构化信息；根据第一对话的结构化信息，以及对话管理组件中的神经网络模型预先学习到的最优化参量，确定与第一对话匹配的推理参数信息QS,A；θ，其中，θ为训练优化得到的最优化参量，最优化参量根据预设专家知识训练得到，专家知识包括预设对话状态下的最优对话决策动作项，S表示对话状态，A表示与所述对话状态对应的对话决策动作项的奖励分布；根据推理参数信息，选择与第一对话的结构化信息匹配的第一对话决策动作项；控制第一对话决策动作项决策出与第一对话结构化信息匹配的第二对话，并输出第二对话。提高了训练过程的收敛速度和准确率。

主权项：1.一种多轮对话管理方法，其特征在于，包括：接收输入的第一对话，并提炼出所述第一对话的结构化信息，其中，所述结构化信息包括对话所属领域、对话动作和对话参数信息；根据所述第一对话的结构化信息，以及对话管理组件中的神经网络模型预先学习到的最优化参量，确定与所述第一对话匹配的推理参数信息QS,A；θ，其中，θ为训练优化得到的最优化参量，所述最优化参量根据预设专家知识训练得到，所述专家知识包括预设对话状态下的最优对话决策动作项，S表示对话状态，A表示与所述对话状态对应的对话决策动作项的奖励分布；根据所述推理参数信息，选择与所述第一对话的结构化信息匹配的第一对话决策动作项，其中，所述第一对话决策动作项为预存的多个对话决策动作项中的任一对话决策动作项；控制所述第一对话决策动作项决策出与所述第一对话结构化信息匹配的第二对话，并输出所述第二对话；所述接收输入的第一对话，并提炼出所述第一对话的结构化信息的步骤之前，包括：获取初始参数并锁定目标神经网络；将所述初始参数输入评价神经网络，并根据最小化差量进行参数优化训练得到第一优化参数，其中，所述最小化差量为Lθ＝ES,A～ρ·[reward+gamma·{q,St+1,At+1∈{S,A}最优；，ES,A～ρ·表示平均值，reward是第t+1轮对话的奖励，gamma是折现因子常量，表示第t+1轮对话的对话状态和对话决策动作项属于专家知识中的元素，q为初始化常量；maxQtargetSt+1,At+1；θ表示目标神经网络根据专家知识拟合得到St+1,At+1∈{S,A}最优的最大Q值，QevaluateSt,At；θ表示t轮对话的平均Q值；将所述第一优化参数输入所述目标神经网络，并锁定所述评价神经网络，根据最小化差量进行参数优化训练得到第二优化参数；将所述第二优化参数输入所述评价神经网络，并在锁定所述目标神经网络的条件下，再次根据所述最小化差量进行参数优化训练得到第三优化参数；根据所述目标神经网络和所述评价神经网络的参数优化的循环过程,优化至所述评价神经网络优化收敛，得到所述最优化参量；所述对话管理组件中的神经网络模型由双向LSTM和两层网络构成，所述接收输入的第一对话，并提炼出所述第一对话的结构化信息的步骤之前，包括：获取三个连续的对话轮回，包括位于当前时刻之前的前对话、当前时刻对应的当前对话以及位于当前时刻之后的后对话；将所述当前时刻之前的前对话、当前时刻对应的当前对话以及位于当前时刻之后的后对话中的对话状态，通过LSTM层进行序列化编码；将通过LSTM层进行序列化编码后的编码数据，输入至MLP网络进行编码全连接，形成全连接编码，并通过指定函数输出所述全连接编码相对各对话决策动作项的奖励；所述将所述当前时刻之前的前对话、当前时刻对应的当前对话以及位于当前时刻之后的后对话中的对话状态，通过LSTM层进行序列化编码的步骤，包括：根据所述前对话的对话状态输出的隐变量以及所述当前对话的对话状态，分别得到对话信息的遗忘程度和对话信息的输入程度；根据所述对话信息的遗忘程度和对话信息的输入程度，通过得到当前对话的信息记忆和前对话的信息遗忘的综合结果，其中，Wc表示可学习的记忆信息参数矩阵系数，bc表示可学习的记忆信息参数矩阵的常量，表示当前对话的信息记忆程度，ht-1表示所述前对话的对话状态输出的隐变量，St表示所述当前对话的对话状态，tanh表示tanh函数；根据所述当前对话的信息记忆和前对话的信息遗忘的综合结果，通过ht＝ot·tanhCt，得到所述当前对话的信息过滤后的输出结果，其中，ot＝σWc·[ht-1,St]+bc，ht-1表示所述前对话的对话状态输出的隐变量，St表示所述当前对话的对话状态，Wc表示可学习的输出信息参数矩阵系数，bc表示可学习的输出信息参数矩阵的常量，ot表示当前对话的信息输出，ht表示当前对话的信息过滤后的输出结果。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司多轮对话管理方法、装置和计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种能自动弹出的抽屉式车载冰箱

下一篇：芯片内测试电路

相关技术

一种能自动弹出的抽屉式车载冰箱

芯片内测试电路

一种注册终端设备的方法及装置

基于数字收银机按键的力反馈控制方法及系统

镭雕装置

基于等几何的变刚度复合材料圆柱壳外压屈曲分析方法

一种汽车零部件冲压加工用夹具

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

一种PCF板的连接结构及其使用方法

性别判定模型的生成方法、装置、电子设备及介质

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种基于梯度语义属性嵌入的无监督用户对齐方法

装置相关技术

介质输送装置、记录装置、后处理装置、中继装置_精工爱普生株式会社_202410300829.7

介质输送装置、记录装置、后处理装置、中继装置_精工爱普生株式会社_202410300924.7

用户装置及基站装置_株式会社NTT都科摩_201980022638.6

振动装置和摄像装置_株式会社村田制作所_202280091042.3

开关装置及硬盘装置_罗姆股份有限公司_202410212540.X

输送装置以及记录装置_精工爱普生株式会社_202110116640.9

开关装置以及电源装置_罗姆股份有限公司_202280090632.4

电池单体、电池装置、用电装置及储能装置_宁德时代新能源科技股份有限公司_202411151297.1

凹凸辊、介质输送装置、后处理装置、中继装置_精工爱普生株式会社_202410301015.5

CBCT装置的校准方法及装置_常州博恩中鼎医疗科技有限公司_202410857764.6

管理相关技术

管理装置以及管理方法_松下知识产权经营株式会社_202410250788.5

作业管理方法、作业管理系统以及作业管理程序_洋马控股株式会社_202310247219.0

信息管理系统以及选项管理装置_株式会社东芝_202380020877.4

管理建筑物管理系统中的证书_霍尼韦尔国际公司_202110150750.7

管理装置、终端装置及管理方法_富士胶片商业创新有限公司_202010080551.9

库存管理系统和库存管理方法_群光电子股份有限公司_202310241870.7

全局网络状态管理_瞻博网络公司_202110595164.3

动态功耗管理系统_集益威半导体(上海)有限公司_202211426734.7

草管理机_株式会社牧田_202410290031.9

电池热管理_通用汽车环球科技运作有限责任公司_202010327127.X

方法相关技术

煤的评价方法和混煤的制备方法以及焦炭的制造方法_杰富意钢铁株式会社_202080019357.8

蚀刻方法_株式会社力森诺科_202280091493.7

测试结构、失效定位方法以及失效分析方法_上海华力微电子有限公司_202410692646.4

图像检测方法、模型训练方法及相关装置_马上消费金融股份有限公司_202410202420.1

资源配置方法、资源发送方法、资源测量方法及电子设备_成都爱瑞无线科技有限公司_202411141003.7

动态密钥生成方法、升级包加密方法、软件升级方法_广汽埃安新能源汽车股份有限公司_202410720762.2

界面显示方法、视频发布方法、视频编辑方法及装置_北京达佳互联信息技术有限公司_202210945497.9

搬运方法_浜松光子学株式会社_202410706496.8

检测装置、检测方法、鞋垫、训练方法和识别方法_宁波荣勃通机电科技有限公司_202110935805.5

定位测量方法、盘存方法以及相关装置_华为技术有限公司_202310301670.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

多轮对话管理方法、装置和计算机设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务