首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于AI的语音语义识别方法及TWS耳机 

申请/专利权人:深圳市盛佳丽电子有限公司

申请日:2024-05-20

公开(公告)日:2024-06-21

公开(公告)号:CN118230720A

主分类号:G10L15/065

分类号:G10L15/065;G10L15/16;H04R25/00

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本申请提供一种基于AI的语音语义识别方法及TWS耳机,通过调试得到目标特征表示网络,提取输入语音和候选语音各自的特征表示进行匹配,完成候选语音的输出,能处理长语音,将其转换为准确、简洁的语音进行输出,提高用户交流效率和质量。在网络调试环节,基于现有机器学习网络的网络架构,通过延伸分布映射表对分布向量映射表中的初始分布映射表进行延伸,初始分布映射表的语音覆盖区间为初始语音覆盖区间,令分布向量映射表的语音覆盖区间从初始语音覆盖区间延伸到目标语音覆盖区间。因为目标语音覆盖区间大于初始语音覆盖区间,则获得的目标特征表示网络可以处理语音覆盖区间大于初始语音覆盖区间的长语音序列。

主权项:1.一种基于AI的语音语义识别方法,其特征在于,所述方法包括:获取通过第一待识别源语音序列和与所述第一待识别源语音序列相匹配的目标助听语音组成的第一语音二元组样本;获取拟调试的机器学习网络,所述拟调试的机器学习网络的分布向量映射表中包括初始分布映射表和延伸分布映射表,所述初始分布映射表的语音覆盖区间为初始语音覆盖区间,所述延伸分布映射表是用于对所述初始分布映射表进行延伸的分布映射表;基于所述延伸分布映射表对所述初始分布映射表进行延伸,以令所述分布向量映射表的语音覆盖区间从所述初始语音覆盖区间延伸到目标语音覆盖区间,所述目标语音覆盖区间大于所述初始语音覆盖区间;对所述拟调试的机器学习网络的网络可学习变量进行起始赋值,获得基础机器学习网络,所述基础机器学习网络中延伸分布映射表的起始可学习变量为任意赋值获得的,所述基础机器学习网络中余下的网络可学习变量的起始可学习变量是基于前置调试完成的公共特征表示网络的网络可学习变量进行起始赋值获得的,所述余下的网络可学习变量为所述基础机器学习网络的所有网络可学习变量中除所述延伸分布映射表之外的网络可学习变量,所述余下的网络可学习变量包括所述初始分布映射表;基于所述第一语音二元组样本,对所述基础机器学习网络的延伸分布映射表进行调试,获得目标特征表示网络;获取目标待识别源语音序列和多个拟处理候选语音序列;基于所述目标特征表示网络获得所述目标待识别源语音序列的第一语音序列特征,以及基于所述目标特征表示网络获得每个所述拟处理候选语音序列的第二语音序列特征;分别获取所述第一语音序列特征与每个所述第二语音序列特征之间的第六共性度量系数;输出第六共性度量系数最大的第二语音序列特征对应的拟处理候选语音序列。

全文数据:

权利要求:

百度查询: 深圳市盛佳丽电子有限公司 一种基于AI的语音语义识别方法及TWS耳机

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。