恭喜北京声智科技有限公司李良斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京声智科技有限公司申请的专利语音识别方法、装置、设备、可读存储介质及计算机程序获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114171014B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111459909.X,技术领域涉及:G10L15/07;该发明授权语音识别方法、装置、设备、可读存储介质及计算机程序是由李良斌;陈孝良设计研发完成,并于2021-12-02向国家知识产权局提交的专利申请。
本语音识别方法、装置、设备、可读存储介质及计算机程序在说明书摘要公布了:本申请公开了一种语音识别方法、装置、设备、可读存储介质及计算机程序,属于计算机技术领域。通过本申请实施例提供的技术方案,获取语音数据;调用声纹识别模型,对该语音数据和语音特征集进行处理,以确定与该语音数据匹配的目标用户,语音特征集中存储有多个用户的历史语音特征;在对该语音数据进行解码的过程中,调用与目标用户匹配的目标语言模型对该语音数据进行处理,以得到该语音数据对应的目标文本,其中,目标语言模型基于目标用户的历史文本数据训练得到;输出该语音数据对应的目标文本。该技术方案能够提高语音识别的准确率。
本发明授权语音识别方法、装置、设备、可读存储介质及计算机程序在权利要求书中公布了:1.一种语音识别方法,其特征在于,所述方法包括:获取语音数据;调用声纹识别模型,对所述语音数据和语音特征集进行处理,以确定与所述语音数据匹配的目标用户,所述语音特征集中存储有多个用户的历史语音特征;调用声学模型,将所述语音数据输入声学模型,得到所述语音数据对应的多组音素;基于所述多组音素,在发音词典中确定与所述多组音素分别对应的多个候选字或候选词;调用目标语言模型,将所述多个候选字或候选词输入与所述目标用户匹配的目标语言模型中,得到并输出所述语音数据对应的目标文本,其中,所述目标语言模型基于所述目标用户的历史文本数据训练得到;当所述目标用户的个数为M个时,则服务器调用每个目标用户的目标语言模型,分别对所述语音数据进行处理,得到M个候选文本,每个候选文本分别对应一个识别分数,将识别分数最高的候选文本确定为所述目标文本,所述识别分数基于音素分数、字词分数和文本分数确定,所述声学模型输出的每组音素信息分别对应有所述音素分数;基于发音词典确定的多个候选字或候选词分别对应有所述字词分数;所述目标语言模型输出的文本对应有所述文本分数;输出所述语音数据对应的目标文本;所述方法还包括:若未从所述语音特征集中匹配出所述目标用户,则将所述语音数据作为新增用户的语音数据添加至历史语音数据集中;当所述历史语音数据集中所述新增用户的数量大于第一数量,且每个所述新增用户的语音数据量大于第二数量时,对每个所述新增用户的多条语音数据进行特征提取,得到每个所述新增用户的多个语音特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京声智科技有限公司,其通讯地址为:100094 北京市海淀区北清路81号院一区1号楼6层601;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。