买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天翼视联科技有限公司
摘要:本申请涉及一种视频信息摘要生成方法、装置、电子装置和存储介质,其中,该视频信息摘要生成方法包括:获取初始视频和预设的针对目标对象的文字描述;将初始视频和文字描述输入至训练后的开放世界目标检测模型进行关键帧检测,得到初始视频中包含目标对象的关键帧;对若干帧的关键帧进行聚类,得到初始视频信息摘要;将初始视频信息摘要输入至图片‑文本提取单元提取文本描述,得到初始视频信息摘要的图片文本描述;将初始视频信息摘要的图片文本描述与初始视频信息摘要输入至视频‑文本语义对齐单元进行语义对齐,得到对齐后的视频特征表示;将对齐后的视频特征表示输入至文本生成单元,得到目标视频信息摘要。提高了文本摘要内容的正确性。
主权项:1.一种视频信息摘要生成方法,其特征在于,包括:获取初始视频和预设的针对目标对象的文字描述;将所述初始视频和所述文字描述输入至训练后的开放世界目标检测模型进行关键帧检测,得到所述初始视频中包含所述目标对象的关键帧;对若干帧的所述关键帧进行聚类,得到初始视频信息摘要;将所述初始视频信息摘要输入至图片-文本提取单元提取文本描述,得到所述初始视频信息摘要的图片文本描述;将所述初始视频信息摘要的图片文本描述与所述初始视频信息摘要输入至视频-文本语义对齐单元进行语义对齐,得到对齐后的视频特征表示;将所述对齐后的视频特征表示输入至文本生成单元,得到目标视频信息摘要;其中,所述将所述初始视频信息摘要输入至图片-文本提取单元提取文本描述,得到所述初始视频信息摘要的图片文本描述,包括:通过预训练后的BLIP-2模型提取所述初始视频信息摘要中的关键帧的特征表示;将所述初始视频信息摘要中的关键帧的特征表示输入至自回归文本生成器进行文本生成,得到所述初始视频信息摘要的图片文本描述。
全文数据:
权利要求:
百度查询: 天翼视联科技有限公司 视频信息摘要生成方法、装置、电子装置和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。