首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种云值机特情语音转文字的方法及系统_南京感动科技有限公司_202410282022.5 

申请/专利权人:南京感动科技有限公司

申请日:2024-03-13

公开(公告)日:2024-06-11

公开(公告)号:CN118173097A

主分类号:G10L15/26

分类号:G10L15/26;G10L25/63;G10L15/02;G10L15/06;G10L17/04

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.28#实质审查的生效;2024.06.11#公开

摘要:本发明公开了一种云值机特情语音转文字的方法及系统,包括以下步骤:步骤一:获取云值机特情语音;步骤二:对所述云值机特情语音进行端点检测,获取所述云值机特情语音中有效语音的起止时间;步骤三:对所述云值机特情语音进行转译,获取所述云值机特情语音的文字转译结果;步骤四:基于所述有效语音的起止时间以及所述文字转译结果制作成JSON格式的字符串类型,得到特情语音数据集。本发明采用端点检测模型、语音转译模型、人工修正的方法对收集的云值机特情语音进行信息提取,随后利用脚本文件将这些信息制作成JSON格式的特情语音数据集。

主权项:1.一种云值机特情语音转文字的方法,其特征在于,包括以下步骤:步骤一:获取云值机特情语音;步骤二:对所述云值机特情语音进行端点检测,获取所述云值机特情语音中有效语音的起止时间;步骤三:对所述云值机特情语音进行转译,获取所述云值机特情语音的文字转译结果;步骤四:基于所述有效语音的起止时间以及所述文字转译结果,制作语音数据集,包括:基于脚本将语音文件路径、所述有效语音的起止时间以及所述文字转译结果制作成JSON格式的字符串类型,得到特情语音数据集;步骤五:获取特情语音数据集中的预训练的语音识别模型,配置AdaLora微调参数包括:初始与目标低秩矩阵的秩、AdaLora层的随机失活率、偏置;配置训练参数包括:批大小、学习率、预热步数;并联预训练语音识别模型与AdaLora微调模型,初始化AdaLora低秩矩阵A,B矩阵;冻结所述预训练语音识别模型参数,采用所述特情语音数据集对所述AdaLora微调模型进行训练,得到高效微调的语音识别模型;使用CTranslate2对所述高效微调后的模型进行推理加速。

全文数据:

权利要求:

百度查询: 南京感动科技有限公司 一种云值机特情语音转文字的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。