恭喜武汉理工大学三亚科教创新园陈亚雄获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜武汉理工大学三亚科教创新园申请的专利一种基于语义增强的海洋船舶定位方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119228897B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411770242.9,技术领域涉及:G06T7/73;该发明授权一种基于语义增强的海洋船舶定位方法是由陈亚雄;张怿;龚腾飞;孙钦婷;熊盛武设计研发完成,并于2024-12-04向国家知识产权局提交的专利申请。
本一种基于语义增强的海洋船舶定位方法在说明书摘要公布了:本发明公开了一种基于语义增强的海洋船舶定位方法,属于机器学习算法和计算机视觉技术领域,本发明通过收集数据集后进行模型训练;构建基于语义增强的海洋船舶定位模型,模型包括:特征编码模块、渐进式两阶段解码模块和信息样本学习模块;将数据集的样本数据输入模型,计算总的损失函数值,进行反向传播,通过选定的优化器和相应参数对连接权重进行优化,训练多轮后得最终的海洋船舶定位模型;输入待定位的文本图像信息,输出给定表达所指示的目标预测框。本发明基于语义感知的视觉编码来生成准确的特征,并基于渐进式两阶段解码模块有效定位目标,通过引入信息样本学习模块,促进模型对复杂多模态关系的理解,提高视觉定位的效率和准确率。
本发明授权一种基于语义增强的海洋船舶定位方法在权利要求书中公布了:1.一种基于语义增强的海洋船舶定位方法,其特征在于,包括:步骤S1,收集视觉定位数据集,采用数据集进行模型训练;步骤S2,构建基于语义增强的海洋船舶定位方法的视觉定位模型,所述模型包括:特征编码模块、渐进式两阶段解码模块和信息样本学习模块;其中,所述特征编码模块包括:步骤S21,视觉信息提取模块;所述视觉信息提取模块,对输入视觉图像进行采样,提取视觉特征Iv;步骤S22,语言信息提取模块;所述语言信息提取模块,对输入语义文本信息进行采样,提取语义特征Fe;步骤S23,动态语义感知模块;所述动态语义感知模块,将视觉特征Iv以及语义特征Fe作为输入,生成语义增强特征步骤S24,语义推动Transformer模块;所述语义推动Transformer模块,将语义增强特征以及语义特征Fe作为输入,生成重复增强特征Fv;所述渐进式两阶段解码模块,对编码器输出的重复增强特征Fv和语义特征Fe进行关联整合,输出用于预测目标对象的边界框,具体步骤如下:步骤Sc1,第一阶段解码层,编码器利用Xkv和Xq的注意力机制输出重复增强特征Fv和语义特征Fe,将这两个特征连接成序列Fve,将Fve输入到Sfsd-layer标准多模态transformers变压器中,并在渐进式两级解码器的输入中增加了一个可学习位置嵌入Pve,第一阶段过程如下: 上述中的表示查询,表示键,表示值,对其进行初始化为MHA为多头自注意力,LN为层归一化,FFN表示前馈神经网络,初始化后对其进行多头注意力机制、前馈神经网络和层归一化处理输出其中,为第l-1层的输入序列,为第l层的输出序列,为第l层的中间输出序列;步骤Sc2,第二阶段解码层,输出序列被分成视觉特征Tv和语言特征Te,同时,将位置嵌入Pve分为视觉位置嵌入Pv和语言位置嵌入Pe,以语言特征Te作为查询,视觉特征Tv作为键和值,之后,将这些划分的特征进一步馈送到第二阶段,对目标物体的位置进行逐级解码,过程如下: 其中,将初始化为表示第h-1层的输出,当h为0时,表示第h个注意力头的键,表示第h个注意力头的值,表示第h个注意力头的查询,Tv表示一个线性变换矩阵,表示第h个注意力头的最终输出,表示第h个注意力头的临时输出;步骤Sc3,将每一层的特征输入到具有ReLU激活函数的三层MLP中,以预测目标物体的边界框;所述信息样本学习模块,平滑L1损耗值和GIoU损耗值分别记为LL1和LGIOU,计算L1损耗函数和GIoU损耗函数的权重ω,公式如下: 其中,τ是一个可学习的参数,用于调整对信息样本的关注;步骤S3,将步骤S1中数据集中的样本输入视觉定位模型中,计算总的损失函数值,进行反向传播,通过优化器和相应参数对连接权重进行优化,训练多轮后得到最终的语义增强的海洋船舶定位模型;步骤S4,基于训练好的语义增强的海洋船舶定位模型,输入待定位的文本图像信息,输出给定表达所指示的目标预测框。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉理工大学三亚科教创新园,其通讯地址为:572025 海南省三亚市崖州区崖州湾科技城用友产业园9号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。