【发明授权】基于双域深度特征和注意力机制的语音裁剪痕迹定位方法_深圳大学_202111604021.0

导航：龙图腾网> 最新专利技术> 基于双域深度特征和注意力机制的语音裁剪痕迹定位方法_深圳大学_202111604021.0

申请/专利权人：深圳大学

申请日：2021-12-24

公开（公告）日：2024-06-11

公开（公告）号：CN114387977B

主分类号：G10L17/04

分类号：G10L17/04;G10L25/03;G10L25/30;G10L25/48

优先权：

专利状态码：有效-授权

法律状态：2024.06.11#授权;2022.05.17#实质审查的生效;2022.04.22#公开

摘要：本发明公开了基于双域深度特征和注意力机制的语音裁剪痕迹定位方法，包括：获取语音信号，对语音信号解压缩以及分帧处理，并计算每一语音帧的离散余弦变换，得到每一语音帧的离散余弦变换系数；通过一维卷积神经网络的特征提取子网络，提取每一语音帧的时域深度特征；通过基于胶囊网络的特征提取子网络，提取每一语音帧离散余弦变换域的频域深度特征；通过特征融合全连接层对每一语音帧的双域深度特征进行拼接融合，得到每一语音帧的融合深度特征；通过基于多头注意力机制的定位模块，捕捉融合深度特征的上下文信息，对裁剪语音中的自适应滤波痕迹进行定位。实现快速检测一段可疑录音上是否存在裁剪痕迹，并对裁剪区域进行定位。

主权项：1.一种基于双域深度特征和注意力机制的语音裁剪痕迹定位方法，其特征在于，所述基于双域深度特征和注意力机制的语音裁剪痕迹定位方法包括：S1.获取需要进行裁剪痕迹检测定位的语音信号，对所述语音信号解压缩以及分帧处理，并计算每一语音帧的离散余弦变换，得到每一语音帧的离散余弦变换系数；S2.通过训练的基于一维卷积神经网络的特征提取子网络，提取每一语音帧的时域深度特征；S3.通过训练的基于胶囊网络的特征提取子网络，提取每一语音帧离散余弦变换域的频域深度特征；S4.通过训练的特征融合全连接层对每一语音帧的时域深度特征和频域深度特征进行拼接融合，得到每一语音帧的融合深度特征；S5.通过训练的基于多头注意力机制的定位模块，捕捉所述融合深度特征的上下文信息，对裁剪语音中的自适应滤波痕迹进行定位；所述通过训练的基于一维卷积神经网络的特征提取子网络，提取每一语音帧的时域深度特征的步骤包括：预先构造一基于一维卷积神经网络的特征提取子网络，其网络结构包括一个卷积核被初始化为[-1，2，-1]的高通滤波层以及五个卷积模块；训练时，在所述基于一维卷积神经网络的特征提取子网络的顶部设置一个分类器以及一个回归器同时对网络进行训练，其中所述分类器由两个全连接层、一个BN层、一个ReLU激活函数以及一个softmax函数组成，所述回归器则由一个全连接层以及一个sigmoid激活函数组成；并通过下述损失函数对网络进行训练：，其中，所述为输入的语音帧的类别与分类器预测的类别之间的交叉熵，而为输入语音帧与重构输出的均方差，是一个可调节的权值；基于训练完成的所述基于一维卷积神经网络的特征提取子网络，获取每一语音帧的512维时域深度特征；所述通过训练的基于胶囊网络的特征提取子网络，提取每一语音帧离散余弦变换域的频域深度特征的步骤包括：预先构造一基于胶囊网络的特征提取子网络，其网络结构包括一个卷积核被初始化为[-1，2，-1]的高通滤波层、6个稠密连接块、一个胶囊块以及一个全连接层，其中，；训练时，在所述基于胶囊网络的特征提取子网络顶部设置一个分类器搭配二分类的交叉熵对网络进行训练，其中，所述分类器由1个BN层、1个ReLU激活函数、一个全连接层以及一个softmax激活函数组成；基于训练完成的所述基于胶囊网络的特征提取子网络，通过所述稠密连接块捕捉不同邻域范围内的离散余弦变换系数的幅值变化，并将输出作为所述胶囊块的输入；通过所述胶囊块的特征提取，输出一个的特征向量，再通过全连接层将所述特征向量映射为每一语音帧的512维频域深度特征；所述通过训练的基于多头注意力机制的定位模块，捕捉所述融合深度特征的上下文信息，对裁剪语音中的自适应滤波痕迹进行定位的步骤包括：预先构造一基于多头注意力机制的定位模块，包括一个嵌入层、一个位置编码层、一个丢弃层、N个多头注意力模块、一个全连接层以及一个softmax函数；训练时，通过加权的交叉熵对定位模块进行训练，其损失函数如下：，其中，表示训练数据中所有语音帧的数量，表示数据的真实标签，表示所述定位模块的预测概率，权值通过计算原始训练集中原始语音帧的数量与篡改语音帧的数量的比值得到；基于训练完成的所述基于多头注意力机制的定位模块，获取连续帧的融合深度特征进行计算，输出维度为的判决矩阵，其中，每帧的2维判决矩阵分别表示当前帧属于原始帧的概率以及属于篡改帧的概率；根据所述判决矩阵，输出每一语音帧为原始帧和或篡改帧的概率值；基于所述概率值，得到所有篡改帧的定位。

全文数据：

权利要求：

百度查询：深圳大学基于双域深度特征和注意力机制的语音裁剪痕迹定位方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种防滑型无纺布的裁剪装置_扬州丽铂环保材料有限公司_202322911817.1

下一篇：气动搬运平台_江门市扬子自动化科技有限公司_202322983207.2

相关技术

一种防滑型无纺布的裁剪装置_扬州丽铂环保材料有限公司_202322911817.1

气动搬运平台_江门市扬子自动化科技有限公司_202322983207.2

一种砂浆压实装置_莘县城市开发建设发展有限公司_202322930777.5

一种配电网规划用的智慧配电网架_国网信息通信产业集团有限公司北京分公司_202322936663.1

一种茶叶生产用高效翻炒装置_舒城县舒橙农业科技有限公司_202322947762.X

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器_深圳市信维通信股份有限公司_202322883966.1

一种地铁车辆车钩检修用辅助工具_郑州地铁集团有限公司_202323220198.8

一种连续制备五氯化磷的装置_河南景泰科技集团有限公司_202322947934.3

一种数控机床主轴箱冷却装置_莆田市华睿机械有限公司_202322982197.0

一种用于光伏发电装置的R型回转减速机_无锡天昀新能源科技有限公司_202323183045.0

一种细分子印刷喷粉加工用研磨装置_安徽唯宝印刷科技有限公司_202323133056.8

一种单因子加药泵回水安全阀_福建晋江天然气发电有限公司_202323102240.6

语音相关技术

语音唤醒方法、语音交互方法及装置、可穿戴设备_北京蜂巢世纪科技有限公司_202410485157.1

智能语音控制方法及相关设备_沈阳创高天誉科技有限公司_202410677354.3

语音信号处理方法及装置_广州三星通信技术研究有限公司_202211687982.7

语音交互的方法和电子设备_华为终端有限公司_202211684847.7

基于意图识别的语音交互方法及系统_平安科技(深圳)有限公司_202110435594.9

语音播报电子烟灰缸及其控制系统_黄冈市卓源智能科技有限公司_202410424337.9

语音质检方法、装置、设备及存储介质_平安银行股份有限公司_202110572189.1

语音识别方法和电子设备_荣耀终端有限公司_202310103614.1

一种收款语音播报器电路_河南掌优电子科技有限公司_202323024680.4

远场语音唤醒方法、设备、介质和产品_深圳市倍思科技有限公司_202410421970.2

机制相关技术

一种炒菜机制作米饭的烹饪方法_杭州九阳小家电有限公司_202211685015.7

服务层操作的自适应控制机制_康维达无线有限责任公司_201980005684.5

一种液位报警后被动安全机制_一汽-大众汽车有限公司_202211675610.2

基于单位点积注意力机制的跨视角地理定位方法_哈尔滨工业大学_202410556228.2

基于Qt反射机制与DLL注入的程序动态调试方法及系统_深圳牛学长科技有限公司_202410504115.8

综合岩体破裂机制的隧洞岩爆预警方法及系统_中铁第一勘察设计院集团有限公司_202410226711.4

基于RFLA和注意力机制的SAR遥感船舰目标检测方法_西安工程大学_202410448891.0

基于双流注意力机制的半监督农作物识别方法_安徽师范大学_202410022216.1

注意力机制计算和模型推理方法、装置、设备及介质_上海壁仞科技股份有限公司_202410473586.7

潜在风险预测与多重惩戒机制嵌套的抛洒车辆处置方法_东南大学_202210190171.X

裁剪相关技术

柔性材料立体裁剪设备_中建五局安装工程有限公司_202410409720.7

裁剪机及其冷却方法_株式会社岛精机制作所_202311777635.8

一种面料裁剪装置_温州市衣之尚服饰有限公司_202322212907.1

一种图文设计制作用裁剪装置_成都诺米儿文化传播有限公司_202322923899.1

一种汽车内饰面料裁剪机构_江苏米山复合材料有限公司_202322215302.8

一种服装裁剪定位压紧装置_晋江森拓领服装有限责任公司_202323150866.4

一种收缩膜裁剪装置_广东祥美薄膜有限公司_202323320840.X

一种钢结构加工用裁剪装置_浙江徽盛钢构有限公司_202323036944.8

一种建筑幕墙施工用幕墙裁剪装置_黄升峰_202322414700.2

一种防滑型无纺布的裁剪装置_扬州丽铂环保材料有限公司_202322911817.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】基于双域深度特征和注意力机制的语音裁剪痕迹定位方法_深圳大学_202111604021.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务