一种原生语音模态的语言模型训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浩神科技(北京)有限公司

摘要：本发明公开一种原生语音模态的语言模型训练方法，涉及语言模型训练技术领域，所述方法包括：利用传统语音模型构建训练数据集；基于训练数据集中的语音文本对构建语音语义编解码器；使用语音语义编解码器对大语言模型进行第一次微调使其具备语音理解能力；基于人类偏好对大语言模型进行第二次微调，使其具备对语音语调以及人类情感的感知；将微调后的大语言模型进行量化及流式部署。本发明以较小的训练成本，把文本大语言模型转换成具备端到端语音理解与生成的多模态大模型，能够直接处理语音输出，而无需依赖于多个分离的阶段，从而提高了交互的自然性、效率和实时性。

主权项：1.一种原生语音模态的语言模型训练方法，其特征在于，所述方法包括：Step1、利用传统语音模型构建训练数据集；Step2、基于训练数据集中的语音文本对构建语音语义编解码器；Step3、使用语音语义编解码器对大语言模型进行第一次微调使其具备语音理解能力；Step4、基于人类偏好对大语言模型进行第二次微调，使其具备对语音语调以及人类情感的感知；Step5、将微调后的大语言模型进行量化及流式部署；基于人类偏好对大语言模型进行第二次微调，具体包括以下子步骤：提取训练数据集中的真实语音对话数据；将真实语音对话数据结合第一次微调后的大语言模型构造正负样本对；根据正负样本对引入人类偏好对大语言模型进行第二次微调；为大语言模型设计基于人类偏好的损失函数，基于损失函数来优化语言模型，完成对大语言模型的第二次微调，基于人类偏好的损失函数表示为：其中，为人类偏好正样本，为人类偏好负样本，表示在给定输入x时，输出胜于的概率p，D是包含输入和正负样本对的数据集，表示给定输入x时的正样本。

全文数据：

权利要求：

百度查询：浩神科技(北京)有限公司一种原生语音模态的语言模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：火电机组中锅炉一次调频能力的状态观测方法、装置、介质及产品

下一篇：基于动态正交子空间的质量相关微小故障检测方法

相关技术

火电机组中锅炉一次调频能力的状态观测方法、装置、介质及产品

基于动态正交子空间的质量相关微小故障检测方法

一种废旧圆柱形锂电池回收设备

蓄冷材料、蓄冷材料粒子、造粒粒子、蓄冷器、冷冻机、低温泵、超导磁铁、核磁共振成像装置、核磁共振装置、磁场施加式单晶提拉装置、氦再冷凝装置及稀释冷冻机

FCRN抗体及其使用方法

一种用于风力发电机组的故障检测方法

激光泵浦光热微区荧光寿命测温系统

一种激光直写纸基多通道LIG传感器的制备方法及其应用

检测护膜的方法

对多面板有源天线系统（AAS）的波束成形配置参数的选择

一种用于提高同步IO并行访问效率的加速结构和方法

用于微弱正负电流信号读取的超导磁通量子器件及其设计方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种原生语音模态的语言模型训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务