【发明公布】一种云值机特情语音转文字的方法及系统_南京感动科技有限公司_202410282022.5

导航：龙图腾网> 最新专利技术> 一种云值机特情语音转文字的方法及系统_南京感动科技有限公司_202410282022.5

申请/专利权人：南京感动科技有限公司

申请日：2024-03-13

公开（公告）日：2024-06-11

公开（公告）号：CN118173097A

主分类号：G10L15/26

分类号：G10L15/26;G10L25/63;G10L15/02;G10L15/06;G10L17/04

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.28#实质审查的生效;2024.06.11#公开

摘要：本发明公开了一种云值机特情语音转文字的方法及系统，包括以下步骤：步骤一：获取云值机特情语音；步骤二：对所述云值机特情语音进行端点检测，获取所述云值机特情语音中有效语音的起止时间；步骤三：对所述云值机特情语音进行转译，获取所述云值机特情语音的文字转译结果；步骤四：基于所述有效语音的起止时间以及所述文字转译结果制作成JSON格式的字符串类型，得到特情语音数据集。本发明采用端点检测模型、语音转译模型、人工修正的方法对收集的云值机特情语音进行信息提取，随后利用脚本文件将这些信息制作成JSON格式的特情语音数据集。

主权项：1.一种云值机特情语音转文字的方法，其特征在于，包括以下步骤：步骤一：获取云值机特情语音；步骤二：对所述云值机特情语音进行端点检测，获取所述云值机特情语音中有效语音的起止时间；步骤三：对所述云值机特情语音进行转译，获取所述云值机特情语音的文字转译结果；步骤四：基于所述有效语音的起止时间以及所述文字转译结果，制作语音数据集，包括：基于脚本将语音文件路径、所述有效语音的起止时间以及所述文字转译结果制作成JSON格式的字符串类型，得到特情语音数据集；步骤五：获取特情语音数据集中的预训练的语音识别模型，配置AdaLora微调参数包括：初始与目标低秩矩阵的秩、AdaLora层的随机失活率、偏置；配置训练参数包括：批大小、学习率、预热步数；并联预训练语音识别模型与AdaLora微调模型，初始化AdaLora低秩矩阵A，B矩阵；冻结所述预训练语音识别模型参数，采用所述特情语音数据集对所述AdaLora微调模型进行训练，得到高效微调的语音识别模型；使用CTranslate2对所述高效微调后的模型进行推理加速。

全文数据：

权利要求：

百度查询：南京感动科技有限公司一种云值机特情语音转文字的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种功能分级的智能分注管柱及使用方法_中国石油化工股份有限公司_202211701478.8

下一篇：一种红茶的制作方法_安化县亮山茶业有限公司_202310583344.9

相关技术

一种功能分级的智能分注管柱及使用方法_中国石油化工股份有限公司_202211701478.8

一种红茶的制作方法_安化县亮山茶业有限公司_202310583344.9

一种基于无人机图像的安全帽与反光衣检测方法_东北林业大学_202410326065.9

一种油溶性石墨烯的制备方法_重庆烯达科技有限公司_202410279749.8

一种自润滑长寿命硬质合金串珠及其制备方法和应用_郑州机械研究所有限公司_202311466192.0

光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

密封结构、储能柜以及储能系统_比亚迪股份有限公司_202311864539.7

用于处理车辆的路径选择的方法和系统_沃尔沃卡车集团_202311739282.2

设备的设计图生成方法和计算设备_超聚变数字技术有限公司_202410269408.2

空调器的控制方法与空调器_青岛海尔空调器有限总公司_202211643481.9

用于提供更新的机器学习算法的系统和方法_西门子医疗有限公司_202311623232.8

数据处理方法、装置、电子设备及存储介质_小红书科技有限公司_202311645889.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种云值机特情语音转文字的方法及系统_南京感动科技有限公司_202410282022.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务