买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:暗物智能科技(广州)有限公司
摘要:本申请提供了图文数据质量的确定方法、装置、电子设备及存储介质,将获取到的目标图文数据中的目标图片数据输入至预先训练好的第一场景图生成模型中,得到与目标图片数据对应的第一场景图;将目标图文数据中的目标文本数据输入至预先训练好的第二场景图生成模型中,得到与目标文本数据对应的第二场景图;计算第一场景图与第二场景图之间的目标F1分数;若目标F1分数大于预设分数阈值,确定目标图文数据的数据质量符合预设数据质量标准。这样,目标图文数据中的目标图片数据以及目标文本数据,得到对应的第一场景图以及第二场景图,直接通过生成的第一场景图以及第二场景图,对图文数据质量进行确定,有助于提升图文数据质量确定的准确率。
主权项:1.一种图文数据质量的确定方法,其特征在于,所述确定方法包括:获取生成的目标图文数据;所述目标图文数据是文生图模型和或图生文模型生成的;或者是图文生成图文模型生成的;或者是从网页中提取得到的;或者是生成的场景图对应的图文数据;将所述目标图文数据中的目标图片数据输入至预先训练好的第一场景图生成模型中,得到与所述目标图片数据对应的第一场景图;所述第一场景图生成模型是基于目标样本数据中的图片数据以及对应的标签训练得到的CV-SGG模型;将所述目标图文数据中的目标文本数据输入至预先训练好的第二场景图生成模型中,得到与所述目标文本数据对应的第二场景图;所述第二场景图生成模型是基于目标样本数据中的文本数据以及对应的标签训练得到的Text-SGG模型;其中,所述第一场景图生成模型以及所述第二场景图生成模型使用同一份标签体系进行训练;计算所述第一场景图与所述第二场景图之间的目标F1分数,以根据所述第一场景图与所述第二场景图对所述目标图文数据的数据质量进行判定;若所述目标F1分数大于预设分数阈值,确定所述目标图文数据的数据质量符合预设数据质量标准;当所述目标图文数据为一对时,所述计算所述第一场景图与所述第二场景图之间的目标F1分数,包括:计算所述第一场景图生成模型以及所述第二场景图生成模型对应的精确率以及召回率;基于所述精确率以及所述召回率,确定所述目标F1分数;当所述目标图文数据为多对时,生成多张第一场景图以及多张第二场景图;所述计算所述第一场景图与所述第二场景图之间的目标F1分数,包括:计算每张第一场景图以及每张第二场景图从所述第一场景图生成模型以及所述第二场景图生成模型输出后,对应的模型F1分数;将多个模型F1分数的平均值确定为所述目标F1分数;通过以下步骤训练所述第一场景图生成模型以及所述第二场景图生成模型:获取对样本图文数据集筛选后的多个目标样本数据;对每个所述目标样本数据进行标注,得到每个目标样本数据对应的标签;其中,所述目标样本数据对应的标签包括场景图标签、图片风格标签以及图片属性标签;将所述目标样本数据中的图片数据以及对应的标签输入至预先构建好的第一神经网络中,对所述第一神经网络进行训练,当所述第一神经网络的损失函数值小于第一预设阈值时,确定所述第一神经网络训练结束,得到所述第一场景图生成模型;将所述目标样本数据中的文本数据以及对应的标签输入至预先构建好的第二神经网络中,对所述第二神经网络进行训练,当所述第二神经网络的损失函数值小于第二预设阈值时,确定所述第二神经网络训练结束,得到所述第二场景图生成模型。
全文数据:
权利要求:
百度查询: 暗物智能科技(广州)有限公司 图文数据质量的确定方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。