【发明授权】一种AIGC模型的语音数据处理方法及系统_北京青藤科技股份有限公司_202410324909.6

导航：龙图腾网> 最新专利技术> 一种AIGC模型的语音数据处理方法及系统_北京青藤科技股份有限公司_202410324909.6

申请/专利权人：北京青藤科技股份有限公司

申请日：2024-03-21

公开（公告）日：2024-06-04

公开（公告）号：CN117935766B

主分类号：G10L13/027

分类号：G10L13/027;G10L25/03;G10L25/15;G10L25/21;G10L25/30;G10L15/02;G10L15/04;G06F18/213;G06F18/214;G06F18/23;G06F18/241

优先权：

专利状态码：有效-授权

法律状态：2024.06.04#授权;2024.05.28#著录事项变更;2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本发明公开了一种AIGC模型的语音数据处理方法及系统，方法包括：对原始语音数据进行声谱动态映射处理，以匹配预设AIGC模型；将处理后的语音数据分割成多个语音样本，并提取每个语音样本的声学特征；对提取的声学特征进行熵值计算，得到熵声纹；根据所述熵声纹对语音样本进行归类，将归类后的语音样本通过所述预设AIGC模型，生成目标语音内容。利用本发明实施例，能够更全面地分析和处理语音数据，改善声学特征提取的多维性和多样性，并且能够增强AIGC模型生成语音的自然度和准确性。

主权项：1.一种AIGC模型的语音数据处理方法，其特征在于，所述方法包括：对原始语音数据进行声谱动态映射处理，以匹配预设AIGC模型；所述对原始语音数据进行声谱动态映射处理，包括：提取原始语音数据的时频表示；对所述时频表示进行动态时间弯曲调整，以匹配预设AIGC模型；对调整后的时频表示的各频率成分的能量分布进行谱重组；将处理后的语音数据分割成多个语音样本，并提取每个语音样本的声学特征；所述提取每个语音样本的声学特征，包括：提取并编码语音样本中的关键声学属性，结合时间域和频域的信息，以获得抽象的语音特征表示；对提取的声学特征进行熵值计算，得到熵声纹；所述熵声纹的计算公式为：其中，所述EVP_i为熵声纹，所述f_k为第i个语音样本的第k个声学特征，所述pf_k为该特征的出现概率，所述K为声学特征的总数；根据所述熵声纹对语音样本进行归类，将归类后的语音样本通过所述预设AIGC模型，生成目标语音内容。

全文数据：

权利要求：

百度查询：北京青藤科技股份有限公司一种AIGC模型的语音数据处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：建筑工程管理招标装置_河南省唐元建筑装饰有限公司_202323194248.X

下一篇：一种带支架的手把及设有该手把的行李箱_深圳市晶科辉电子有限公司_202323220938.8

相关技术

建筑工程管理招标装置_河南省唐元建筑装饰有限公司_202323194248.X

一种带支架的手把及设有该手把的行李箱_深圳市晶科辉电子有限公司_202323220938.8

一种装配式铝方通转角拼接结构_广州市亿莱建材有限公司_202323188233.2

一种厌氧罐进水分布机构_新乡市丰源生物科技有限公司_202323438116.7

一种刀片可调节的修边机_四川季茜鞋业有限公司_202323228710.3

一种带液晶显示屏可调速的墙体切割机_浙江铁仁工具制造有限公司_202323207937.X

一种监测作物生长状况的农业装置_重庆市骏驰农产品加工有限公司_202323312778.X

一种用于消毒的泵芯组装机_宁波鑫航自动化科技有限公司_202420236725.X

一种建筑施工用抹灰装置_山西中兴安盛建设有限公司_202323168955.1

一种互动茶几安全防护围挡_艾博德(成都)信息技术有限公司_202323271295.X

一种船舶舷外机通风型保护罩_杭州海的动力机械股份有限公司_202323400506.5

一种用于治疗小儿肌性斜颈的固定器_宁夏医科大学总医院_202322315253.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种AIGC模型的语音数据处理方法及系统_北京青藤科技股份有限公司_202410324909.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务