基于纹理信息引导的高分辨率耕地伪样本可控生成方法

导航：龙图腾网> 最新专利技术> 基于纹理信息引导的高分辨率耕地伪样本可控生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东建筑大学

摘要：一种基于纹理信息引导的高分辨率耕地伪样本可控生成方法，涉及遥感影像技术领域，直接使用现有耕地地块标签捕捉耕地地块的纹理特征，剔除了非耕地区域的地物特征，直接避免了高分辨率遥感影像普遍存在的异物同谱的问题，控制单元能够只学习耕地自身的纹理特征，避免了其他地物的干扰，能为生成高质量耕地影像提供更加准确地信息引导，生成细节更丰富，更加真实的高分辨率耕地遥感影像。使生成影像满足遥感影像耕地地块语义分割任务所需样本的多样性和丰富性，提升遥感影像耕地地块分割的精度。

主权项：1.一种基于纹理信息引导的高分辨率耕地伪样本可控生成方法，其特征在于，包括如下步骤：a构建大尺寸高分辨率遥感影像耕地地块语义分割数据集D1-b，构建小尺寸高分辨率遥感影像耕地地块语义分割数据集D1-s；b将大尺寸高分辨率遥感影像耕地地块语义分割数据集D1-b划分为训练集和测试集；c利用小尺寸高分辨率遥感影像耕地地块语义分割数据集D1-s构建高分辨率遥感影像耕地地块提示词数据集D2；d建立条件扩散模型，条件扩散模型由编码器、解码器、条件控制单元、解耦交叉注意力、U-Net网络构成；e将训练集中的遥感影像输入到条件扩散模型的编码器中，得到低维潜在表示特征图Fimage；f将训练集中的遥感影像、二值耕地地块语义分割标签以及遥感影像的耕地提示词输入到条件扩散模型的条件控制单元中，输出得到输出影像嵌入分解特征FSp-I、特征图嵌入分解特征文本嵌入分解特征FSp-Text；g将特征图Fimage输入到条件扩散模型的U-Net网络中，输出得到特征Funet，将特征Funet输入到Linear线性层中，输出得到条件扩散模型的解耦交叉注意力的共用查询向量query，将影像嵌入分解特征FSp-I、特征图嵌入分解特征文本嵌入分解特征FSp-Text输入到条件扩散模型的解耦交叉注意力中，输出得到解耦交叉注意力Z；h利用解耦交叉注意力Z计算得到损失函数Lloss；i使用AdamW优化器利用损失函数Lloss训练条件扩散模型，得到优化后的条件扩散模型；j将训练集中的遥感影像输入到优化后的条件扩散模型中，输出得到耕地伪地块样本；步骤e包括如下步骤：e-1使用PIL库Image类读取训练集中的裁剪后的第i张遥感影像PiB，得到训练影像矩阵X′train-I，使用PIL库Image类读取训练集中的剪裁后的二值耕地地块语义分割标签得到训练标签矩阵X′train-L；e-2利用PyTorch中的ToTensor函数将训练影像矩阵X′train-I转化为张量Xtrain-I，Xtrain-I∈RC×W×H，R为实数空间，C为裁剪后的第i张遥感影像PiB的通道数，W为裁剪后的第i张遥感影像PiB的宽度，H为裁剪后的第i张遥感影像PiB的高度，利用PyTorch中的ToTensor函数将训练标签矩阵X′train-L转化为张量Xtrain-L，Xtrain-I∈RLC×W×H，LC为剪裁后的二值耕地地块语义分割标签的通道数；e-3条件扩散模型的编码器为预训练的AutoEncoderKL的编码器，将张量Xtrain-I输入到条件扩散模型的编码器中，得到影像的低维潜在表示特征图Fimage，ZC为低维潜在表示特征图的通道数；步骤f包括如下步骤：f-1条件扩散模型中的条件控制单元由影像控制模块、影像与标签控制模块、耕地提示词控制模块构成；f-2影像控制模块由预训练的CLIP图像编码器、投影网络构成，将张量Xtrain-I输入到预训练的CLIP图像编码器中，输出得到影像嵌入影像控制模块的投影网络由Linear线性层、LayerNorm层构成，将影像嵌入输入到投影网络的Linear线性层中，输出得到特征将特征输入到投影网络的LayerNorm层中，输出得到影像嵌入分解特征FSp-I；f-3影像与标签控制模块由耕地纹理特征增强模块、预训练的CLIP图像编码器、投影网络构成，将张量Xtrain-L输入到耕地纹理特征增强模块中，输出得到强化后的耕地纹理特征图M1′，将强化后的耕地纹理特征图M1′输入到影像与标签控制模块的预训练的CLIP图像编码器中，输出得到特征图嵌入影像与标签控制模块的投影网络由Linear线性层、LayerNorm层构成，将特征图嵌入输入到影像与标签控制模块的投影网络的Linear线性层中，输出得到特征将特征输入到影像与标签控制模块的投影网络的LayerNorm层中，输出得到特征图嵌入分解特征f-4耕地提示词控制模块由预训练的CLIP文本编码器构成，将第i张遥感影像的耕地提示词Proi输入到预训练的CLIP文本编码器中，输出得到本文嵌入分解特征FSp-Text，FSp-Text∈RK×text_embeddings_dim，其中K为文本最大编码长度，text_embeddings_dim为文本嵌入大小；将张量Xtrain-L输入到耕地纹理特征增强模块中，输出得到强化后的耕地纹理特征图M1′的方法为：f-31耕地纹理特征增强模块由耕地纹理捕捉单元、耕地纹理提取单元构成；f-32耕地纹理捕捉单元由第一平均池化层、第二平均池化层、2D卷积层、LeakyReLU函数构成，将张量Xtrain-L输入到耕地纹理捕捉单元的第一平均池化层中，输出得到特征将特征输入到耕地纹理捕捉单元的第二平均池化层中，输出得到边缘过渡平滑的耕地空间位置注意力图Map1，将张量Xtrain-I输入到耕地纹理捕捉单元的2D卷积层中，输出得到特征将特征输入到耕地纹理捕捉单元的LeakyReLU函数中，输出得到影像特征张量F1，F1∈[0,1]C′×W×H，C′为影像特征张量F1的通道数，将边缘过渡平滑的耕地空间位置注意力图Map1在通道维度上堆叠C′次后与影像特征张量F1进行逐元素相乘得到耕地地块准确的空间特征信息图M1，M1∈[0,1]1×W×H；f-33耕地纹理提取单元由第一残差卷积块、第一卷积块、第二残差卷积块、Softmax函数构成；f-34耕地纹理提取单元的第一残差卷积块由2D卷积层、BatchNormalization层、LeakyReLU函数构成，将耕地地块准确的空间特征信息图M1输入到第一残差卷积块的2D卷积层中，输出得到特征FI2-1，将特征FI2-1输入到第一残差卷积块的BatchNormalization层中，输出得到特征FI2-2，将特征FI2-2输入到第一残差卷积块的LeakyReLU函数中，输出得到特征FI2-3，将耕地地块准确的空间特征信息图M1与特征FI2-3进行相加操作，得到特征FI2；f-35耕地纹理提取单元的第一卷积块由2D卷积层、BatchNormalization层、LeakyReLU函数构成，将特征FI2输入到第一卷积块的2D卷积层中，输出得到特征FI3-1，将特征FI3-1输入到第一卷积块的BatchNormalization层中，输出得到特征FI3-2，将特征FI3-2输入到第一卷积块的LeakyReLU函数中，输出得到特征FI3-3；f-36耕地纹理提取单元的第二残差卷积块由2D卷积层、BatchNormalization层、LeakyReLU函数构成，将特征FI3-3输入到第二残差卷积块的2D卷积层中，输出得到特征FI4-1，将特征FI4-1输入到第二残差卷积块的BatchNormalization层中，输出得到特征FI4-2，将特征FI4-2输入到第二残差卷积块的LeakyReLU函数中，输出得到特征FI4-3，将特征FI4-3与特征FI3-3进行相加操作，得到特征FI4；f-37将特征FI4输入到耕地纹理提取单元的Softmax函数中，输出得到耕地纹理权重矩阵Map2，Map2∈[0,1]C′×W×H；f-38将耕地纹理权重矩阵Map2与影像特征张量F1进行逐元素相乘，得到强化后的耕地纹理特征图M1′；步骤g包括如下步骤：g-1条件扩散模型的解耦交叉注意力由影像嵌入分解特征交叉注意力、特征图嵌入分解特征交叉注意力、文本嵌入分解特征交叉注意力构成；g-2将低维潜在表示特征图Fimage输入到条件扩散模型的U-Net网络中，输出得到特征Funet，Funet∈{Fdowm1,Fdowm2,Fdowm3,Fup1,Fup2,Fup3}，Fdowm1,Fdowm2,Fdowm3为U-Net网络三个下采样过程中的特征，Fup1,Fup2,Fup3为U-Net网络三个上采样过程中的特征；g-3解耦交叉注意力的影像嵌入分解特征交叉注意力由第一Linear线性层、第二Linear线性层、第三Linear线性层构成，将输出影像嵌入分解特征FSp-I输入到影像嵌入分解特征交叉注意力的第一Linear线性层中，输出得到影像嵌入分解特征交叉注意力的键向量keySp-I，将输出影像嵌入分解特征FSp-I输入到影像嵌入分解特征交叉注意力的第二Linear线性层中，输出得到影像嵌入分解特征交叉注意力的值向量valueSp-I，将特征Funet输入到影像嵌入分解特征交叉注意力的第三Linear线性层中，输出得到影像嵌入分解特征交叉注意力的查询向量query，将影像嵌入分解特征交叉注意力的查询向量query、键向量keySp-I、值向量valueSp-I输入到pytorch库的torch.nn.functional.scaled_dot_product_attention函数中，输出得到特征Fcatt-I；g-4解耦交叉注意力的特征图嵌入分解特征交叉注意力由第一Linear线性层、第二Linear线性层、第三Linear线性层构成，将特征图嵌入分解特征输入到特征图嵌入分解特征交叉注意力的第一Linear线性层中，输出得到特征图嵌入分解特征交叉注意力的键向量将特征图嵌入分解特征输入到特征图嵌入分解特征交叉注意力的第二Linear线性层中，输出得到特征图嵌入分解特征交叉注意力的值向量将特征Funet输入到特征图嵌入分解特征交叉注意力的第三Linear线性层中，输出得到特征图嵌入分解特征交叉注意力的查询向量query，将特征图嵌入分解特征交叉注意力的查询向量query、键向量值向量输入到pytorch库的torch.nn.functional.scaled_dot_product_attention函数中，输出得到特征g-5解耦交叉注意力的文本嵌入分解特征交叉注意力由第一Linear线性层、第二Linear线性层、第三Linear线性层构成，将文本嵌入分解特征FSp-Text输入到文本嵌入分解特征交叉注意力的第一Linear线性层中，输出得到文本嵌入分解特征交叉注意力的键向量keySp-Text，将文本嵌入分解特征FSp-Text输入到文本嵌入分解特征交叉注意力的第二Linear线性层中，输出得到文本嵌入分解特征交叉注意力的值向量valueSp-Text，将特征Funet输入到文本嵌入分解特征交叉注意力的第三Linear线性层中，输出得到文本嵌入分解特征交叉注意力的查询向量query，将文本嵌入分解特征交叉注意力的查询向量query、键向量keySp-Text、值向量valueSp-Text输入到pytorch库的torch.nn.functional.scaled_dot_product_attention函数中，输出得到特征Fcatt-Text；g-6将特征Fcatt-I、特征特征Fcatt-Text进行相加操作，得到解耦交叉注意力Z；步骤h包括如下步骤：h-1使用torch.randn_like函数将低维潜在表示特征图Fimage生成尺寸一致的随机噪声Noise；h-2将随机噪声Noise与低维潜在表示特征图Fimage进行相加操作，得到特征Fnoise-image，h-3将特征Fnoise-image输入到解耦交叉注意力Z与条件扩散模型中U-Net网络二者整合后的U-Net模型中，输出得到预估噪声Noiseθ；h-4计算随机噪声Noise与预估噪声Noiseθ的均方误差，将均方误差作为损失函数Lloss。

全文数据：

权利要求：

百度查询：山东建筑大学基于纹理信息引导的高分辨率耕地伪样本可控生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于三嗪共价有机框架材料的制备及用途

下一篇：写请求的处理方法、装置、设备和介质

相关技术

一种基于三嗪共价有机框架材料的制备及用途

写请求的处理方法、装置、设备和介质

一种各向异性复合纤维水凝胶及其制备方法

一种齿轨车的制动方法、装置、设备及存储介质

电力标准知识的标签自动化标注方法、系统及存储介质

一种高速机械磨削主轴加工装置

一种新能源汽车语音功能测试方法、系统及设备

一种多自由度解耦的波浪能发电装置及其工作方法

一种1,2,3-三氮唑-4-甲酸乙酯的合成方法

用于抓毛织物表面形貌的检测方法

一种烟叶分拣定级用的翻转分料装置及方法

一种多能源能量调度系统及调度控制方法

分辨率相关技术

一种超分辨率光谱图像的重建方法、系统及应用_西湖大学_202311568890.1

一种特征聚合图像超分辨率重建方法及系统_西安邮电大学_202410112529.6

8K高分辨率的光学系统及其应用_成都联江科技有限公司_202410344674.7

多分辨率数据耦合的城市洪涝自动建模方法、装置及设备_清华大学_202410611715.4

一种正型高分辨率光刻胶及其制备方法_瑞红(苏州)电子化学品股份有限公司_202410871241.7

一种提高扫描电镜能谱空间分辨率的方法_江苏科技大学_202410759623.0

一种高分辨率拉曼光谱检测设备_山西大学_202311482647.8

一种多光栅的高分辨率光谱仪_合肥工业大学_202410881461.8

视频超分辨率方法、装置、电子设备及存储介质_深圳市斯远电子技术有限公司_202410632237.5

通过眼动追踪调整显示设备分辨率的系统和方法_安那律光电科技(上海)有限公司_202410768246.7

伪相关技术

颈部CT扫描固定及伪影减弱支架_首都医科大学宣武医院_202323221566.0

可控多涡卷混沌伪随机发生器_西南大学_202310222684.9

CT重建图像中环形伪影的校正方法、装置以及系统_杭州睿影科技有限公司_202410850600.0

三维目标伪标签的优化方法、装置、车辆、介质及程序_大卓智能科技有限公司_202410853878.3

用于清除头部移动造成的噪声消除伪影的系统和方法_哈曼国际工业有限公司_202410220049.1

一种适用于伪卫星系统的无线同步系统及方法_深圳方位天枢科技有限公司_202310221828.9

一种去除CT图像金属伪影新方法_吉林大学_202410763966.4

一种基于伪标签半监督学习的污染源超限排放研判方法_国网浙江省电力有限公司湖州供电公司_202410624401.8

通过有意引入的光学像差使视觉伪影最小化来改进结构光投影_赫克斯冈技术中心_202110494399.3

应用不同相关间距伪距观测量的单频差分GNSS接收机_大连海事大学_202210580928.6

耕地相关技术

一种区域耕地质量评价方法及系统_北京中宇瑞德建筑设计有限公司_202111563404.8

一种耕地土壤修复剂及其制备方法与应用_海拓(北京)矿物肥料有限公司_202410568900.X

一种基于遥感影像的耕地非粮化变化检测方法_中国四维测绘技术有限公司_202410456924.6

基于纹理信息引导的高分辨率耕地伪样本可控生成方法_山东建筑大学_202410065681.3

一种农机用耕地犁_凌秀红_202323517938.4

一种可减小耕地阻力的犁具结构_西南林业大学_202322819696.8

一种镉、砷污染耕地原位快速修复系统_招商局生态环保科技有限公司_202323165802.1

一种便于清理的耕地保护用渠道拦水土壤压实装置_河北康莱建筑工程有限公司_202420174311.9

一种免耕地补水播种装置_乌兰察布市农林科学研究所_202323650767.2

一种红壤坡耕地花生抗旱栽培方法_江西省红壤及种质资源研究所_202211672153.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于纹理信息引导的高分辨率耕地伪样本可控生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务