Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜四川大学龚俊吉获国家专利权

恭喜四川大学龚俊吉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜四川大学申请的专利一种基于稳定扩散模型的腹腔镜图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119963441B

龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510437623.3,技术领域涉及:G06T5/70;该发明授权一种基于稳定扩散模型的腹腔镜图像生成方法是由龚俊吉;郑雯清;易烜;周尧设计研发完成,并于2025-04-09向国家知识产权局提交的专利申请。

一种基于稳定扩散模型的腹腔镜图像生成方法在说明书摘要公布了:本申请公开了一种基于稳定扩散模型的腹腔镜图像生成方法,其包括采样n个不同时间步作为缓存点;基于缓存点,通过生成N张腹腔镜图像的过程来计算所有时间步卡尔曼滤波的超参数;将腹腔镜图像指定提示词转换为语义向量,随机生成高斯噪声矩阵,将语义向量和高斯噪声矩阵作为噪声预测网络的初始输入,在去噪过程中基于相应时间步卡尔曼滤波的超参数,生成腹腔镜图像。本申请能够实现更加准确的噪声预测。

本发明授权一种基于稳定扩散模型的腹腔镜图像生成方法在权利要求书中公布了:1.一种基于稳定扩散模型的腹腔镜图像生成方法,其特征在于,包括: 步骤1:采样n个不同时间步作为缓存点;n为正整数; 步骤2:基于缓存点,通过生成N张腹腔镜图像的过程来计算所有时间步卡尔曼滤波的超参数;N为正整数; 步骤3:将腹腔镜图像指定提示词转换为语义向量,随机生成高斯噪声矩阵,将语义向量和高斯噪声矩阵作为噪声预测网络的初始输入,在去噪过程中基于相应时间步卡尔曼滤波的超参数,生成腹腔镜图像; 所述步骤2包括: 步骤21:使用文本编码器将腹腔镜图像的指定提示词转换为语义向量,并随机初始化一个三维的高斯噪声矩阵,初始化时,t=T,作为噪声预测网络的初始输入; 步骤22:使用无缓存的噪声预测网络根据输入以及语义向量,输出当前时间步的噪声,并将其从输入中减去,得到下一时间步的输入;为t+1时间步对高斯噪声矩阵去噪的结果,在t=T时,为随机初始化的高斯噪声矩阵,为下一时间步的输入;其中,t的取值为从T至1,T为正整数; 步骤23:使用有缓存的噪声预测网络根据输入以及语义向量,输出当前时间步t的有偏噪声,利用无缓存的噪声预测网络输出的噪声、上一时间步t+1预测的当前时间步噪声,计算当前时间步t的卡尔曼滤波超参数和; 步骤24:重复步骤22和步骤23共T次,其中输入的下标t的取值从T开始,每次重复过程减1,即t的取值依次是T、T-1、T-2、...、2、1; 步骤25:重复步骤21和步骤24共N次,N为预计算过程需要生成的腹腔镜图像数量; 所述步骤22包括: 步骤221:稳定扩散模型噪声预测网络将作为输入,完整地执行主分支,即所有下采样层、中间层、以及上采样层,并自动缓存上采样层第二层的输出为,在进行计算时通过交叉注意力机制将语义向量融合到网络计算中,并将上采样层最后一层的输出作为稳定扩散模型噪声预测网络在时间步的原始预测噪声; 步骤222:使用稳定扩散模型的默认采样器PNDM将原始预测噪声从输入中减去,得到下一时间步的输入; 步骤223:根据下一时间步的输入,得到下一时间步的噪声的提前预测值; 所述步骤222包括: 下一时间步的输入的表达式,即PNDM采样器公式为: 式中,和分别表示在时间步和时稳定扩散模型的采样结果,即时间步t-1和t时稳定扩散模型的输入,和表示在时间步t和时的噪声水平,表示稳定扩散模型噪声预测网络在时间步的原始预测噪声; 所述步骤223包括: 通过以下公式得到下一时间步的噪声的提前预测值: 将上述关于的两个公式进行相等运算,推导出: 所述步骤23包括: 步骤231:稳定扩散模型噪声预测网络将作为输入,只计算下采样层第一层,并将第一层输出的结果与最近一次缓存的结果跳跃连接,共同作为上采样层最后一层的输入,在进行计算时通过交叉注意力机制将语义向量融合到网络计算中,最终计算得到稳定扩散模型在当前时间步的有偏噪声; 步骤232:使用上一时间步对当前时间步的噪声的提前预测值、步骤221中的得到的原始预测噪声、步骤231中得到的有偏噪声,计算当前时间步t的卡尔曼滤波超参数和; 所述步骤232中,当前时间步t的卡尔曼滤波超参数和的计算公式分别为: 式中,N为预计算需要生成的腹腔镜图像数量,初始值为0; 所述步骤3包括: 步骤31:使用文本编码器将腹腔镜图像指定提示词“CholecT45”转换为语义向量,并随机初始化一个三维的高斯噪声矩阵,初始化时,,作为噪声预测网络的初始输入; 步骤32:使用噪声预测网络得到输入的噪声; 步骤33:使用卡尔曼滤波对进行估计,得到最优估计值,并使用采样器得到下一时间步的输入; 步骤34:重复步骤32和步骤33共T次,其中步骤32的输入的下标从T开始取,每次重复过程减去1,即T、T-1、T-2、...、2、1,直到最终得到预测的图像潜在空间表示; 步骤35:使用解码器,由生成最终的腹腔镜图像; 所述步骤32包括: 噪声预测网络计算,其分为两种情况:第一种情况是完整计算并缓存稳定扩散模型噪声预测网络中的部分输出的时间步,在作为缓存点的时间步中,稳定扩散模型噪声预测网络完整地执行主分支,即所有下采样层、中间层、以及上采样层,并自动缓存上采样层第二层的输出为,并将上采样层最后一层的输出作为稳定扩散模型噪声预测网络在当前时间步的原始预测噪声;第二种情况是不需要完整执行网络计算的时间步,即非缓存点,对于非缓存点,当非缓存点为时间步时,稳定扩散模型噪声预测网络只计算下采样层第一层,并将第一层输出的结果与最近一次缓存的结果跳跃连接,共同作为上采样层最后一层的输入,计算得到稳定扩散模型在当前时间步的原始预测噪声;两种情况的输入都是,都会使用交叉注意力机制将语义向量融合到网络计算中; 所述步骤33包括: 使用上一时间步预测的当前时间步噪声作为当前时间步的预测值; 根据上一个时间步的状态方差、当前时间步预测值的噪声方差,得到当前时间步的状态预测方差: 式中,表示当前时间步时的状态预测方差,表示上一时间步时的状态方差,表示当前时间步时的预测值的噪声方差; 计算时间步t的卡尔曼增益,用来平衡预测误差和观测误差: 式中,表示当前时间步时的状态预测方差,表示当前时间步观测值的噪声方差大小; 将步骤32中得到噪声作为观测值,结合时间步t的卡尔曼增益修正预测状态,得到经滤波之后得到的噪声最优估计值,即滤波输出结果: 式中,表示时间步t的卡尔曼增益,表示上一时间步预测的当前时间步噪声,表示当前时间步的观测值,即噪声预测网络输出结果;更新状态值方差,以反映新的不确定性: 式中,表示当前时间步时的状态预测方差,将滤波的噪声最优估计值作为采样器在时间步实际使用的梯度,经PNDM采样器,进行采样后得到,并送入下一时间步的稳定扩散模型噪声预测网络。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610000 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。