首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

美学评分分布预测模型的构建和多模态图像美学评估方法 

申请/专利权人:西北大学

申请日:2024-01-18

公开(公告)日:2024-05-24

公开(公告)号:CN118069985A

主分类号:G06F18/10

分类号:G06F18/10;G06V30/18;G06V30/19;G06N3/0442;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.11#实质审查的生效;2024.05.24#公开

摘要:本发明公开了一种美学评分分布预测模型的构建和多模态图像美学评估方法,获取多模态美学数据集,对多模态美学数据集进行预处理,构建基于置信度的动态跨模态记忆网络,并对该网络中的模块进行权重初始化;将预处理后的多模态美学数据集作为训练集输入至构建的基于置信度的动态跨模态记忆网络中进行训练,得到训练好的基于置信度的动态跨模态记忆网络,将其作为美学评分分布预测模型,构建的美学评分分布预测模型,在文本模态特征缺失的情况下,使用预训练的模型通过视觉信息重建相应的文本模态特征,在多模态图像美学质量评估时减少了模态缺失对图像美学预测性能的影响,解决了多模态图像美学评估中文本评论不可用时带来的文本模态缺失问题。

主权项:1.一种模态缺失下美学评分分布预测模型的构建方法,其特征在于,该方法包括以下步骤:步骤1,获取多模态美学数据集,对多模态美学数据集进行预处理,获得预处理后的多模态美学数据集的每个图像的图像ID、对应的文本评论信息和图像美学分数标签;所述的预处理为数据清洗以及剔除损坏或不可用的图像数据;步骤2,构建基于置信度的动态跨模态记忆网络,并对该网络中各个模块进行权重初始化;所述基于置信度的动态跨模态记忆网络包括图像特征提取模块、文本特征提取模块、图像-文本记忆模块、基于置信度的动态融合模块和美学预测模块;所述的图像特征提取模块和文本特征提取模块分别与所述的图像-文本记忆模块相连,所述的图像-文本记忆模块与所述的基于置信度的动态融合模块和美学预测模块依次相连,所述的图像特征提取模块与所述的基于置信度的动态融合模块相连;步骤3,将步骤1预处理后的多模态美学数据集作为训练集输入至步骤2构建的基于置信度的动态跨模态记忆网络中进行训练,得到训练好的基于置信度的动态跨模态记忆网络,将其作为美学评分分布预测模型。

全文数据:

权利要求:

百度查询: 西北大学 美学评分分布预测模型的构建和多模态图像美学评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。