首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

图像描述方法和装置、计算机设备、存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本实施例提供一种图像描述方法和装置、计算机设备、存储介质,属于人工智能技术领域。包括:对原始图像的目标区域卷积得到原始特征图像;对原始特征图像聚合得到聚合图像;对聚合图像进行自注意力处理得到自注意力图像,对原始特征图像进行扁平化处理得到平滑图像;对平滑图像进行特征提取得到初步特征图像;关联原始特征图像和初步特征图像得到目标特征图像;对目标特征图像进行文本描述得到目标描述信息。通过对原始特征图像进行聚合,并对聚合图像进行自注意处理得到图像的通道特征;通过对原始特征图像进行扁平化处理,并对平滑图像进行特征提取处理得到图像的空间特征;本实施例能够充分考虑到图像的各个特征,进而提高图像描述的准确率。

主权项:1.一种图像描述方法,其特征在于,包括:获取原始图像;其中,所述原始图像包括目标区域,所述目标区域指的是需要对原始图像进行文本描述的区域;对所述原始图像的所述目标区域进行多次卷积处理,得到多层的原始特征图像;对多层的所述原始特征图像进行聚合处理,得到聚合图像;其中,聚合处理是用于聚合多层的所述原始特征图像的特征映射出的空间信息;对所述聚合图像进行自注意力处理,得到自注意力图像;根据所述自注意力图像对所述原始特征图像进行扁平化处理,得到平滑图像;对所述平滑图像进行特征提取处理,得到初步特征图像,包括:将所述平滑图像输入至预设的神经网络模型,通过所述神经网络模型计算所述平滑图像的空间注意分布,得到所述初步特征图像;对多层的所述原始特征图像和所述初步特征图像进行关联处理,得到目标特征图像,包括:根据预设的投影维度对所述原始特征图像进行投影处理,得到第一投影图像,将所述第一投影图像的特征输入到LSTM模型中,以使LSTM模型通过n个时间步长来细化图像特征,得到第一细化图像,根据所述投影维度对所述初步特征图像进行投影处理,得到第二投影图像,将所述第二投影图像的特征输入到LSTM模型中,以使LSTM模型通过n个时间步长来细化图像特征,得到第二细化图像,将所述第一细化图像的像素和所述第二细化图像的像素相乘,得到所述目标特征图像;根据所述目标特征图像进行文本描述处理,得到目标描述信息;其中,所述目标描述信息用于描述所述原始图像;其中,所述根据所述自注意力图像对所述原始特征图像进行扁平化处理,得到平滑图像,包括:将所述原始特征图像的像素和所述自注意力图像的像素相乘,得到细化特征图像;根据预设尺寸对所述初步特征图像进行尺寸变化处理,得到尺寸特征图像;对所述尺寸特征图像进行张量平坦化操作,得到所述平滑图像。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 图像描述方法和装置、计算机设备、存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。