首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于反馈的口语文本转换方法、装置及电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院自动化研究所

摘要:本发明提供一种基于反馈的口语文本转换方法、装置及电子设备,其中方法包括:基于待转化口语文本和初始纠错模型,获取初始书面文本;基于待转化口语文本和初始书面文本,确定奖励信息;将待转化口语文本输入至口语文本转换模型中,得到口语文本转换模型输出的目标书面文本;其中,口语文本转换模型是基于奖励信息的反馈信号对初始纠错模型的模型参数进行强化学习后确定的模型。本发明能够避免现有采用完全监督学习学习的口语转换模型不能提升口语文本转换为书面文本的精确性和适用性的缺陷,并且能够通过使用无标注的口语文本在无监督和强化学习条件下生成口语转换模型的方式,大幅提升口语文本转换为书面文本的精确性和适用性。

主权项:1.一种基于反馈的口语文本转换方法,其特征在于,包括:基于待转换口语文本和初始纠错模型,获取初始书面文本;所述初始书面文本为对所述待转换口语文本进行初步口语纠错后得到的书面文本;基于所述待转换口语文本和所述初始书面文本,确定奖励信息;所述奖励信息用于表征针对所述待转换口语文本经过初始纠错后所得所述初始书面文本的打分情况;将所述待转换口语文本输入至口语文本转换模型中,得到所述口语文本转换模型输出的目标书面文本;其中,所述口语文本转换模型是基于所述奖励信息的反馈信号对所述初始纠错模型的模型参数进行强化学习后确定的模型;基于所述奖励信息的反馈信号对所述初始纠错模型的模型参数进行强化学习,包括:将所述奖励信息作为强化学习的奖励,使用强化学习迭代训练所述初始纠错模型的模型参数,每次迭代训练均对所述模型参数进行微调,并针对微调后的模型参数对应的中间纠错模型,再次获取每个所述待转换口语文本对应的书面文本以及确定对应的奖励信息,然后判断重新确定的奖励信息是否达到预设的奖励信息最大值以及是否有上升空间,如果重新确定的奖励信息达到预设的奖励信息最大值且不能继续上升,则停止迭代,并确定停止迭代时对应的纠错模型为所述口语文本转换模型;反之,如果重新确定的奖励信息未达到预设的奖励信息最大值且存在上升空间,则再次使用强化学习迭代训练纠错模型的模型参数;直至确定出所述口语文本转换模型;所述基于所述待转换口语文本和所述初始书面文本,确定奖励信息,包括:对每个口语训练文本进行采样,确定每个所述口语训练文本对应的多个候选答案;获取用户终端反馈的针对每组的所述多个候选答案中一对候选答案的比较结果;基于每个所述比较结果,确定每个最优候选答案和每个最差候选答案;基于每个所述口语训练文本,以及与每个所述口语训练文本对应的所述最优候选答案和所述最差候选答案,对初始奖励模型进行训练,确定目标奖励模型;将所述待转换口语文本和所述初始书面文本输入至所述目标奖励模型中,得到所述目标奖励模型输出的所述奖励信息。

全文数据:

权利要求:

百度查询: 中国科学院自动化研究所 基于反馈的口语文本转换方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术