首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种融合频域与空域特征的图像特征增强算法_联通(上海)产业互联网有限公司_202410470110.8 

申请/专利权人:联通(上海)产业互联网有限公司

申请日:2024-04-18

公开(公告)日:2024-06-11

公开(公告)号:CN118172635A

主分类号:G06V10/80

分类号:G06V10/80;G06V10/26;G06V10/40;G06V10/82

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.28#实质审查的生效;2024.06.11#公开

摘要:本发明涉及人工智能领域中大模型多模态信息对齐Multimodalinformationalignment技术领域,尤其为通过设计一种融合频域与空域特征的图像特征增强算法,其步骤具体如下:S1,图像分块编码;S2,频域特征提取;S3,空域特征提取;S4,频域与空域特征融合;S5,最终特征输出及应用:本发明通过分别提取图像的频域特征和空域特征并进行融合增强,不仅克服了现有VisualTransformer架构在处理图像数据时的部分局限性,还充分利用了图像的频域信息,实现了特征提取的多元化和互补性,并且该方法能在多模态任务上提高模型性能,并且有助于提高模型对带噪声图像的鲁棒性,进而在开源数据集中,基于本算法构建的模型取得的效果位于所有算法前列。

主权项:1.一种融合频域与空域特征的图像特征增强算法,其步骤具体如下:S1,图像分块编码:输入分辨率448*448的输入图像,并将其分割为28*28个16*16分辨率的小图像块,其中每块图像在编码过程中融合了其位置信息以增强表达能力;S2,频域特征提取:利用二维傅里叶变换或小波变换空间-频域转换技术,将S1中编码后的图像块序列从空域映射至频域,然后与相同尺寸的可学习矩阵进行Hadamard积运算,从而获取图像的频域特征表示;S3,空域特征提取:将原始图像编码序列分别与三个独立可训练的参数矩阵相乘,生成查询Q、键K、值V三个矩阵,基于自注意力机制计算并输出输入图像的丰富空域特征;S4,频域与空域特征融合:首先将S2得到的频域特征通过傅里叶逆变换转回空域特征,随后与S3得到的空域特征进行串联,并经过LayerNormalization规范化处理;S5,最终特征输出及应用:经过以上一系列处理步骤生成的融合特征作为增强后的图像特征,由此输出融合了频域与空域双重信息的增强图像特征。

全文数据:

权利要求:

百度查询: 联通(上海)产业互联网有限公司 一种融合频域与空域特征的图像特征增强算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。