首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于copula的多维去噪概率扩散模型图像序列生成方法_宜宾学院_202311143765.6 

申请/专利权人:宜宾学院

申请日:2023-09-05

公开(公告)日:2024-06-21

公开(公告)号:CN118229534A

主分类号:G06T5/00

分类号:G06T5/00;G06N3/04;G06N3/08;G06N5/04

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:序列的相邻图像帧之间、而多通道图像的通道之间都存在很强的相关性。本发明方法针对去噪概率扩散模型DenoisingDiffusionProbabilisticModel,DDPM的不足,提出基于copula的多维的去噪扩散概率模型,称为CopulaMultivariateDDPM,CM‑DDPM。提出的模型利用copula替换DDPM中单变量的高斯概率分布,实现多维去噪扩散概率模型,并解决了传统基于单变量DDPM在刻画数据源之间相关性方面的不足。本发明适用于多种应用场景,包括视频生成、动画制作、自动驾驶、人体行为识别、医学图像处理等图像生成领域。

主权项:1.基于copula的多维去噪概率扩散模型图像序列生成方法,其特征在于它包括以下步骤:步骤1,给定目标图像序列是xt={X0t,x1t,xkt},表示有k+1个相关的图像,这个序列也是预测的目标图像序列,正向扩散过程如下:步骤1.1将xt={x0t,x1t,xkt}输入到DDPM的公式1,得到k+1个独立的序列正向过程的噪声图像xit及其概率密度函数qi,其中0≤i≤k。步骤1.2将qi和xit分别看成copula的边缘分布及其边缘分布对应的观察数据。然后得到参数ψ=argqi和边缘概率累积分布Qi=CDFixit;ψ;步骤1.3根据qi产生的序列,采用最大似然算法得到概率密度函数c的参数Φ。采用高斯copula连接函数c,用下式计算正向图像序列的多维分布函数h:h=cQ1,…,Qk;Φ·Πkqixit;ψ步骤1.4再用最大似然法计算h得到正向扩散模型的多维概率分布模型h,Φ和ψ是模型的参数;步骤2逆向还原过程如下:步骤2.1用DDPM方法的公式2分别得到k+1个逆向还原的在t步的图像的概率分布pixit-1|xit;步骤2.2将pixit-1|xit和xit-1看成边copula的缘分布及其观察数据然后用最大似然法计算这k+1个边缘分布的累积分布函数;步骤2.3采用高斯copula连接函数c,用下式计算逆向复原图像序列的多维分布函数hθ: 步骤2.4再用最大似然法计算hθ得到正向扩散模型的多维概率分布模型hθ。Φ和是模型参数;步骤3CM-DDPM模型的深度网络采用UNet,训练的损失函数由如下表达式来表示:loss=λ1×MSE||Zθxt,cd-Z||2+λ2KLDhφ,h其中,Zθxt,cd是UNet网络,xt={x0t,x1t,xkt}是图像序列,cd是条件变量,可以是图像、文本、声音数据;Z是添加到图像序列的噪声;KLDhφ,h是步骤1.4和步骤2.4分别计算的高斯copula模型h和之间的Kullback-Leibler距离;λ1和λ2分别是两个控制损失函数输出loss的权重;步骤4训练好的UNet进行推理,将训练好的网络迭代采样T=1000次得到网络最终预测输出,迭代公式如下:xt-1=Zθxt,cd上面公式,在t时刻的图像xt和条件cd输入网络,反向生成t-1时刻的图像xt-1。

全文数据:

权利要求:

百度查询: 宜宾学院 基于copula的多维去噪概率扩散模型图像序列生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。