【发明公布】一种基于多语种采样的粤语语音识别模型训练方法及系统_广东电网有限责任公司;广东电网有限责任公司客户服务中心_202410612864.2

申请/专利权人：广东电网有限责任公司;广东电网有限责任公司客户服务中心

申请日：2024-05-17

公开（公告）日：2024-06-14

公开（公告）号：CN118197294A

主分类号：G10L15/06

分类号：G10L15/06;G10L15/01

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明公开了一种基于多语种采样的粤语语音识别模型训练方法及系统，其中方法包括：将预设的语种信息进行预处理，得到每个语种信息的嵌入表征；将每个语种信息的嵌入表征输入预设的第一语种模型，计算每个语种和粤语的相关度；根据每个语种和粤语的相关度，对预设的语种语音数据重新采样，得到重采样语种数据；将重采样语种数据输入预设的第一语种模型进行粤语学习，得到第二语种模型；根据预设的粤语标注数据，通过预设的模型检测标准对第二语种模型进行检测，得到粤语语音识别模型，本发明通过充分地利用其他语种训练多语种学习模型，得到高准确度的粤语语音识别模型。

主权项：1.一种基于多语种采样的粤语语音识别模型训练方法，其特征在于，包括：将预设的语种信息进行预处理，得到每个语种信息的嵌入表征；将每个语种信息的嵌入表征输入预设的第一语种模型，计算每个语种和粤语的相关度；根据每个语种和粤语的相关度，对预设的语种语音数据重新采样，得到重采样语种数据；将重采样语种数据输入预设的第一语种模型进行粤语学习，得到第二语种模型；根据预设的粤语标注数据，通过预设的模型检测标准对第二语种模型进行检测，得到粤语语音识别模型；其中，所述预设的模型检测标准复用了第二语种模型的参数作为粤语语音识别模型的初始化参数，然后使用预设的学习率对第二语种模型的参数进行调整，以得到粤语语音识别模型。

全文数据：

权利要求：

百度查询：广东电网有限责任公司;广东电网有限责任公司客户服务中心一种基于多语种采样的粤语语音识别模型训练方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法_青岛科技大学_202410508360.6

下一篇：一种诱导阴地蕨孢子萌发、有效培养原叶体的培养基及方法_毕节市中药研究所_202310551441.X

相关技术

基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法_青岛科技大学_202410508360.6

一种诱导阴地蕨孢子萌发、有效培养原叶体的培养基及方法_毕节市中药研究所_202310551441.X

模型轻量化方法、装置、计算机设备、存储介质及程序产品_苏州元脑智能科技有限公司_202410372700.7

轮胎磨损监测方法及系统_摩登汽车有限公司_202210397941.8

一种艾灸熏蒸废气处理工艺_成都天田医疗电器科技有限公司_202210550591.4

一种智能机械抓手_陇芯微(西安)电子科技有限公司_202111591327.7

一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

一种弯管内壁自动行走激光堆焊增材设备_广东博盈特焊技术股份有限公司_202410354772.9

一种可变任意尺寸模具的挤吹机及其挤吹工艺_晋江里弗兰新材料有限公司_202410445743.3

一种间隔条浇灌胶质的装置_河南金拇指防水工程有限公司_202210302950.4

一种羽毛片自动翻正装置_汪锐_202111663818.8

温度控制方法、装置、设备以及存储介质_深圳市汇川技术股份有限公司_202211206401.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于多语种采样的粤语语音识别模型训练方法及系统_广东电网有限责任公司;广东电网有限责任公司客户服务中心_202410612864.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务