买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东北石油大学三亚海洋油气研究院
摘要:本发明提供一种基于时序变分自编码TS‑VAE的数据增强方法及系统,属于数据增强处理领域。为解决利用现有变分自编码器进行数据扩充时,声波信号不能直接输入,对提取长时间序列的时频特征的能力弱,计算效率低、扩充数据质量不佳问题。通过短时傅里叶变换将声波信号的波形图转化为频谱图;构建基于时间序列的变分自编码器TS‑VAE生成模型,在输入数据中增加时序窗口维度,分别在编码器和解码器中引入残差网络和时序趋势估计参数,利用频谱图对模型进行训练,通过皮尔逊相关系数评价并筛选生成信号。可提高模型对泄漏信号识别准确性和鲁棒性,实现管道泄漏数据扩充,为管道泄漏检测识别提供丰富样本。
主权项:1.一种基于时序变分自编码TS-VAE的数据增强方法,其特征在于,包括以下步骤:S100、利用声学传感器采集声波信号,通过短时傅里叶变换将声波信号的波形图转化为时频域的频谱图,再将幅度频谱转换为dB标度频谱,保留原始声波信号的相角信息和幅值最值,包括,S110、设置采样频率,读取声波信号,利用音频转换工具将采集到的不同泄漏孔径声波信号转化为音频数据,并保留原始声波信号对应的序号;S120、根据目标频谱图尺寸h,k结合短时傅里叶变换的帧大小和跳数,对步骤S110获取的音频数据的长度进行截取,频谱图尺寸h,k为: 其中,Length是信号长度;Frame_size是帧大小;Hop_length是帧跳数;S130、定义窗函数wt,假定声波信号xt在分析窗的短时间隔内是平稳的,将窗函数位移到中心点t=τ,对信号加窗处理:yt=xt·wt-τS140、对yt进行短时傅里叶变换,通过窗函数wt在时间轴上的移动,对声波信号进行逐段分析得到频谱分布Sw,τ: S150、将频谱幅值取对数转换成dB标度谱,用于表示信号在不同频率上的能量或功率大小;对频谱分布S取模值得到absS,则dB标度谱SdB表示为:SdB=20*log10absSS160、对dB标度谱SdB进行正则化,映射到0,1范围内;保留原始信号的dB标度谱最值和频谱S=A+Bi的相角信息,正则化处理和相角计算如下: θ=arctanBA其中,A和B分别表示信号xt实部和虚部的值;S200、引入时序窗口T对原始时间序列信号做分割,构建基于时间序列变分自编码器的TS-VAE模型,包括在编码器中引入残差网络,在解码器中引入时序趋势估计参数,包括,S210、引入时序窗口T对原始时间序列信号xt做分割,得到分割后的声波信号xt在时间步1-T上相互关联;S220、利用卷积层和残差层构建编码器,将输入映射到潜在空间,得到时间步1-T上的隐变量zt,利用近似分布qz|x表示z1…zt的聚构,其遵循高斯分布,即:logqz|x=logNz;μjz,σjz其中,N表示标准高斯分布;μj和σj分别表示近似分布qz|x输出的第j个向量的均值和方差;S230、构建解码器,将隐变量重构映射回原始空间;引入时间趋势估计参数θt,重建原始泄漏声波信号的时间趋势φt,其中,φt=θt·T;S240、利用构建的TS-VAE模型近似原始后验分布Pz|x,利用KL散度度量两分布的相似性,使得qz|x≈Pz|x,根据时序窗口T将两分布的KL散度进行分解,得到分解后的KL散度如下: 其中,qz|xt是xt的近似分布;Pxt|z是xt的先验分布;qz和qzt分别代表当前隐变量z和t时刻隐变量zt的近似分布;Pz和Pzt分别代表当前隐变量z和t时刻隐变量zt的先验分布;Eqx|q代表对生成xt的期望;S300、以步骤S100得到的频谱图作为输入对步骤S200构建的TS-VAE模型进行训练,学习原始样本的混合高斯分布,拟合出与原始样本分布相似的样本,生成新的频谱图数据,包括,S310、加载频谱图数据作为TS-VAE模型的输入,在原始的输入数据中增加时序窗口T维度,将输入改为[T,d,h,k],其中,d是特征维度;S320、利用步骤S220构建好的基于残差网络的编码器,将输入数据映射到潜在空间的隐变量;S330、利用步骤S230构建好的基于时序趋势估计的解码器,对隐变量进行采样并投射回原始空间;S340、根据时序窗口T对KL散度进行分解,对分解后的KL散度进行权重赋值,得到不同时间步下隐变量之间的相关程度,以及近似分布和后验分布的KL散度,定义损失函数如下: 其中,α为权重因子;S350、对模型进行训练,通过反向传播更新网络参数,最小化损失函数,得到最终的生成模型;S360、利用保存后的模型重构数据,生成新的频谱图;S400、通过短时傅里叶逆变换结合原始信号的相角信息和幅值最值,将步骤S300生成的新的频谱图转换回波形图,采用皮尔逊相关系数评价生成信号的质量,筛选并保留皮尔逊相关系数高的生成信号作为数据增强后的生成数据集,包括,S410、利用保留的相位信息和幅值最值,结合短时傅里叶逆变换将生成的频谱图转化为声波信号短时傅里叶逆变换公式如下: 其中,是生成的频谱信息;wt-τ是对应时刻的窗函数;S420、利用皮尔逊相关系数评价生产信号的质量,皮尔逊相关系数的计算公式如下: 其中,X和Y均为进行相关性分析的样本;cov是协方差;σ为标准差;E为估计;S430、保留皮尔逊相关系数大于0.8的生成信号作为最终的生成数据集,实现对管道声波信号数据集的增强。
全文数据:
权利要求:
百度查询: 东北石油大学三亚海洋油气研究院 基于时序变分自编码TS-VAE的数据增强方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。