恭喜昆明理工大学龙华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜昆明理工大学申请的专利一种基于音素对迭代融合的多语种音素识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115512689B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211106527.3,技术领域涉及:G10L15/02;该发明授权一种基于音素对迭代融合的多语种音素识别方法是由龙华;苏树盟;邵玉斌;杜庆治;黄张衡;段云设计研发完成,并于2022-09-12向国家知识产权局提交的专利申请。
本一种基于音素对迭代融合的多语种音素识别方法在说明书摘要公布了:本发明涉及一种基于音素对迭代融合的多语种音素识别方法,属于音频信号处理技术领域。获取并通过多语言国际音标转化来有效利用有差别资源度的多语种音素资源,统一映射到直接获取语言的数据集进行非映射IPA音素簇扩充之后,重建的新数据集取代传统单一通用数据集以用于融合音素集。以人体声道发声为约束,构造人体发音共振约束的音素高阶线性预测峰值频带语音学特征,将此语音学特征结合声学特征MFCC融合成新型的音素区分性特征。通过最小同现音素对迭代缩减算法或音素特征余弦相似对迭代缩减算法。最后,基于融合完备音素集构建多语言音素标签,提取标签语言训练集与测试集的新型音素区分性特征,实现可变长语音自动对齐的音素识别。
本发明授权一种基于音素对迭代融合的多语种音素识别方法在权利要求书中公布了:1.一种基于音素对迭代融合的多语种音素识别方法,其特征在于:Step1:获取多个不同资源度的异语种音素语料,以直接获取的方式获取资源度较高的语料作为训练第一语言的主体语言音素集,以非IPA音素-IPA音素字典编码方式间接获取的语料作为训练第二甚至更多语言的扩充语言音素集,以字素-IPA音素字典编码方式间接获取的语料作为训练第三甚至更多语言的扩充语言音素集;Step2:基于Step1所获取的音素集,将以非IPA音素-IPA音素字典编码方式获取的语料资源音素标签及以字素-IPA音素字典编码方式获取的语料音素标签以语言学知识统一映射到第一语言的主体音素集音素音素标签表示;Step3:以人体声道发声为约束构造新型区分音素的特征,具体为:依据语音发声系统机理,基于Step2获得的以第一语言IPA音素标签映射的多语种音素集合,将所有音素细化语音类别为清音音素、鼻音浊音音素、非鼻音浊音音素,根据不同语音类别语音发声特点,构造新型具更有音素区分特性的特征;Step4:基于Step2得到的多语种音素集,缩减语种内已映射的IPA音素符号集,分别降低映射后的主体语言、第二语言及第三语言音素集总体音素符号集的规模;Step5:基于Step4所得到的已经缩减的多语种音素集,将直接获取的主体音素集作为初始集,结合间接获取的第二语种音素集做第一次迭代一级融合,融合完成形成的新集再与间接获取的第三语种音素集音素集第二次迭代二级融合,以此类推,获得更多语种的更多级的多语种音素集融合;Step6:采用连接时间分类网络CTC构建音素识别网络,实现可变长度多语种语音自动对齐的音素序列识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650093 云南省昆明市五华区学府路253号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。