【发明公布】对话语料提取方法、系统、计算机及存储介质_江西广播电视网络传媒有限公司_202410606775.7

申请/专利权人：江西广播电视网络传媒有限公司

申请日：2024-05-16

公开（公告）日：2024-06-14

公开（公告）号：CN118197324A

主分类号：G10L17/14

分类号：G10L17/14;G10L15/16;G10L15/26

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明提供了对话语料提取方法、系统、计算机及存储介质，所述方法包括获取当前对话数据，对所述当前对话数据进行预处理，以得到当前语音数据；利用单轮非自回归模型对所述当前语音数据进行识别，利用时延自注意力机制对所述对话文字进行标点预测；利用音频处理器根据标点预测出现的时间将所述当前语音数据分割为多个音频数据，利用ResNet34网络模型对每一所述音频数据进行声纹特征提取，得到每一句所述对话文字的声纹特征；对每一句所述对话文字的声纹特征进行聚类分析，以得到所述声纹特征的聚类簇，基于所述聚类簇及标点后的所述对话文字，输出每一人对应的对话语料文档，自适应不确定多少说话人的各种场景。

主权项：1.一种对话语料提取方法，其特征在于，所述方法包括：获取当前对话数据，对所述当前对话数据进行预处理，以得到当前语音数据；利用单轮非自回归模型对所述当前语音数据进行识别，以得到所述当前语音数据中的对话文字；利用时延自注意力机制基于所述对话文字的当前词及所述当前词的短时间窗口内的未来单词对所述对话文字进行标点预测，并输出标点后的所述对话文字；利用音频处理器根据标点预测出现的时间将所述当前语音数据分割为多个音频数据，且使多个所述音频数据分别对应标点后的每一句所述对话文字，利用ResNet34网络模型对每一所述音频数据进行声纹特征提取，得到每一句所述对话文字的声纹特征；对每一句所述对话文字的声纹特征进行聚类分析，以得到所述声纹特征的聚类簇，基于所述聚类簇及标点后的所述对话文字，输出每一人对应的对话语料文档。

全文数据：

权利要求：

百度查询：江西广播电视网络传媒有限公司对话语料提取方法、系统、计算机及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种多种传感器智能小车控制电路_华南理工大学广州学院_201911114816.6

下一篇：一种适用于中、大粒径不规则种籽的排种器_石河子大学_201910333130.X

相关技术

一种多种传感器智能小车控制电路_华南理工大学广州学院_201911114816.6

一种适用于中、大粒径不规则种籽的排种器_石河子大学_201910333130.X

地质灾害防治监测取样方法_恩施自治州鄂西南地质工程有限公司_202111391185.X

一种三价铁配合物及其制备方法和应用_南京大学_202310204926.1

一种MiniLED遮光膜激光修切方法_深圳铭创智能装备有限公司_202311373560.7

隧道沉降测点装置_湖北文理学院_202111486983.0

一种车门密封条生产盘卷方法_建新赵氏科技股份有限公司_202210237785.9

一种薄膜式压力传感器动态标定装置及其使用方法_西北核技术研究所_202210898711.X

一种推货机构及自动售货机_湖南北吉星技术服务有限公司_202010779619.2

用于抑制系统低频振荡的双馈风机本地阻尼控制系统_武汉理工大学_202210055674.6

承载装置及半导体工艺设备_北京北方华创微电子装备有限公司_202011141991.7

拒绝服务攻击下合作竞争多智能体系统安全协同控制方法_北京航空航天大学_202210194476.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】对话语料提取方法、系统、计算机及存储介质_江西广播电视网络传媒有限公司_202410606775.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务