一种音频数据自动化片段对齐标注的技术方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：人民中科(北京)智能技术有限公司

摘要：本发明涉及音频数据处理技术领域，且公开了一种音频数据自动化片段对齐标注的技术方法，S1，输入后的音频语音数据首先通过人声分离模块将原始数据分离为音乐音轨和人声音轨两个文件；S2，人声音轨进入有效片段切分模块，模块只使用人声音轨数据进行音频切分；S3，切分后的有效人声片段将被输入到自动语音识别ASR模块进行文本转录；S4，片段聚类模块使用DBSCAN聚类算法对文字识别结果进行文本聚类，聚类时使用的特征是文本的TF‑IDF特征。该音频数据自动化片段对齐标注的技术方法，可以极大程度的降低人工标注的时间成本和人力成本，自动化的提供高质量的音频标注数据，推动了音频比对模型的进一步发展与应用。

主权项：1.一种音频数据自动化片段对齐标注的技术方法，其特征在于，包括以下步骤：S1，输入后的音频语音数据首先通过人声分离模块将原始数据分离为音乐音轨和人声音轨两个文件；S2，人声音轨进入有效片段切分模块，模块只使用人声音轨数据进行音频切分，低于预设音量阈值的片段被认为静默片段，该步骤会切除静默片段，并过滤掉有效片段时长小于预设时长的片段，保留有效的人声片段部分，同时记录其在原始音频中的开始时间和结束时间；S3，切分后的有效人声片段将被输入到自动语音识别ASR模块进行文本转录，每一个人声片段会生成对应的文字识别结果并保存在文件中；S4，片段聚类模块使用DBSCAN聚类算法对文字识别结果进行文本聚类，聚类时使用的特征是文本的TF-IDF特征，即可获得相似片段聚类结果，即为片段对齐的标注结果。

全文数据：

权利要求：

百度查询：人民中科(北京)智能技术有限公司一种音频数据自动化片段对齐标注的技术方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种汽车座椅调节开关

下一篇：一种Pebax1657聚合物修饰的玻璃微管的制备方法

相关技术

一种汽车座椅调节开关

一种Pebax1657聚合物修饰的玻璃微管的制备方法

显示驱动电路、方法、显示面板及其制备方法、装置

复合型重金属离子检测芯片和方法

一种机理与数据双向融合驱动的电力通信光缆数字孪生建模方法

威灵仙生物碱类化合物及其用途

一种电磁屏蔽柜钣金焊接装置

一种基于MRF超像素标记的人体姿态估计方法

一种蒸镀装置

用于水产品生产的全链路温度控制方法及平台

一种基于双边模糊集的三支决策疾病分类方法及装置

一种饲料包装机

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种音频数据自动化片段对齐标注的技术方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务