首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种智能语音转写方法及系统_广州市艾索技术有限公司_202410405996.8 

申请/专利权人:广州市艾索技术有限公司

申请日:2024-04-07

公开(公告)日:2024-06-07

公开(公告)号:CN118016079B

主分类号:G10L19/02

分类号:G10L19/02;G10L15/26;G10L19/26

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要:本发明涉及语音转写技术领域,具体涉及一种智能语音转写方法及系统,该方法包括:采集语音数据得到离散语音序列,将离散语音序列划分为各信号区,获取各信号区的高频序列与低频序列,获取各信号区的语音低频相似度及语音低频信号纯净指数,利用经验模态分解算法获取各信号区的高频序列的各本征模态分量,获取低频序列及各本征模态分量的频谱包络线,构建各信号区的语音信号区失真系数,结合各信号区的语音信号区失真系数及滤波算法、语音转文本算法完成语音转写。本发明旨在提高语音转写的准确率,降低噪音干扰。

主权项:1.一种智能语音转写方法,其特征在于,该方法包括以下步骤:采集语音数据,将语音数据进行采样得到离散语音序列;根据离散语音序列中的元素分布特征得到离散语音序列中各元素的语音边界影响系数;根据各元素的语音边界影响系数得到离散语音序列的各信号区;根据各信号区内元素的频域特征得到各信号区的高频序列与低频序列;根据各信号区内元素与低频序列中元素的关系得到各信号区的语音低频相似度;结合各信号区的语音低频相似度及信号区内元素的语音边界影响系数得到各信号区的语音低频信号纯净指数;利用经验模态分解算法获取各信号区的高频序列的各本征模态分量;结合频域分析算法得到低频序列及各本征模态分量的频谱包络线;根据各本征模态分量的频谱包络线与低频序列的频谱包络线的关系及各信号区的语音低频信号纯净指数得到各信号区的语音信号区失真系数;结合各信号区的语音信号区失真系数及滤波算法、语音转文本算法完成语音转写;所述根据离散语音序列中的元素分布特征得到离散语音序列中各元素的语音边界影响系数,表达式为: 式中,表示离散语音序列中第i个元素的语音边界影响系数,表示以离散语音序列中第i个元素为中心的预设局部邻域内的元素数量,表示离散语音序列中的第i个元素,表示第i个元素的预设局部邻域内的第j个元素,表示第i个元素的预设局部邻域构成的数据序列,表示求均值函数,表示求方差函数,为以自然常数为底数的指数函数。

全文数据:

权利要求:

百度查询: 广州市艾索技术有限公司 一种智能语音转写方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术