生成式大语言模型训练方法、基于模型的人机语音交互方法

导航：龙图腾网> 最新专利技术> 生成式大语言模型训练方法、基于模型的人机语音交互方法

申请/专利权人：北京百度网讯科技有限公司

申请日：2023-03-03

公开（公告）日：2024-07-05

公开（公告）号：CN116127045B

主分类号：G06F16/332

分类号：G06F16/332;G06F16/33;G06F18/214;G06N3/09;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2024.07.05#授权;2023.06.02#实质审查的生效;2023.05.16#公开

摘要：本公开提供了生成式大语言模型训练方法、基于模型的人机语音交互方法，涉及生成式模型、智能语音、人机交互等人工智能技术领域。该方法包括：基于用户输入文本与匹配的服务接口调用序列，构建第一训练集；利用第一训练集对预训练好的第一生成式大语言模型进行有监督微调训练，得到第二生成式大语言模型；基于相同用户输入文本与不同候选输出之间的用户偏好排序和预设模板集合，构建第二训练集；利用第二训练集对预训练好的第三生成式大语言模型进行有监督训练，得到奖励模型；将第二生成式大语言模型，基于奖励模型返回的得分，以强化学习方式进行训练。利用据此训练得到的生成式大语言模型可显著提升人机语音交互场景下的回复准确率和用户体验。

主权项：1.一种生成式大语言模型训练方法，包括：基于用户输入语音与匹配的服务接口调用序列，构建第一训练集；其中，构成所述服务接口调用序列的服务接口对应于由所述用户输入语音转换得到的用户输入文本表达出的功能使用意图；利用所述第一训练集对预训练好的第一生成式大语言模型进行有监督微调训练，得到第二生成式大语言模型；基于相同用户输入语音与不同候选输出之间的用户偏好排序和预设模板集合，构建第二训练集，所述候选输出为与所述用户输入语音匹配的输出，所述预设模板集合包含记录有输入文本与相应的接口调用指令之间对应关系的各预设模板；利用第二训练集对预训练好的第三生成式大语言模型进行有监督训练，得到奖励模型；将所述第二生成式大语言模型，基于所述奖励模型返回的得分，以强化学习方式进行训练，得到目标生成式大语言模型。

全文数据：

权利要求：

百度查询：北京百度网讯科技有限公司生成式大语言模型训练方法、基于模型的人机语音交互方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种低损耗粉末冶金磁芯材料及其制备方法

下一篇：一种基于行业模板的应用程序快速构建方法及系统

相关技术

一种低损耗粉末冶金磁芯材料及其制备方法

一种基于行业模板的应用程序快速构建方法及系统

一种制备富含含量的PAC絮凝剂的方法

一种便携式风险感知警告装置

一种燃气用不锈钢波纹管加工设备

一种便于固定加工件的数控立式钻床

一种采集多视角图片构建物体全息视图的方法及装置

裂缝对天然气水合物生成及CO₂置换的影响模拟方法

微生物参与的制备聚合物的方法及其应用

紫檀芪查尔酮类化合物、其制法及医药用途

一种燃料电池发动机运行工况寿命分析方法及系统

利用光压或光辐射压力效应的测量方法及测量装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

生成式大语言模型训练方法、基于模型的人机语音交互方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务