首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】媒体视听信息流监测监管数据样本及其标注方法_上海科江电子信息技术有限公司_202011351922.9 

申请/专利权人:上海科江电子信息技术有限公司

申请日:2020-11-27

公开(公告)日:2024-06-14

公开(公告)号:CN112347303B

主分类号:G06F16/71

分类号:G06F16/71;G06F16/75;G06F16/78;G06F16/783

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2021.03.19#实质审查的生效;2021.02.09#公开

摘要:本发明公开了一种媒体视听信息流监测监管数据样本及其标注方法,每一个视听信息流经过监测监管平台,实时采样、标注、转码后衍生出一段多媒体信息流,取名为:视听信息流监测监管数据样本,具体样本格式为:镜头序列前缀以及依次排列在镜头序列前缀后的多个镜头数据,任一个镜头的格式包括镜头前缀以及依次设置在镜头前缀后面的多个关键帧序列;该方案可以建立视听信息流监测监管大数据集堆、库,利用大数据分析和机器智能算法对大数据样本进行分析并学习和揭示其中的统计特征和舆论泛起模式规律,提高视听信息流监测监管效率。对移动互联网上发布的海量短视频可以建立机器索引和内容分类标准,为提高搜索视频内容提供厚实的技术基础。

主权项:1.一种媒体视听信息流监测监管数据样本的标注方法,该方法通过建立视听信息流监测监管大数据集,利用大数据分析和机器智能算法对大数据样本进行分析并学习和揭示其中的统计特征和舆论泛起模式,对移动互联网上发布的海量短视频建立机器索引和内容分类标准;来提高视听信息流监测监管效率;其特征在于:所述样本格式定义为:镜头序列前缀以及依次排列在镜头序列前缀后的多个镜头数据,任一个镜头的格式包括镜头前缀以及依次设置在镜头前缀后面的多个关键帧序列;其中,镜头序列前缀包括镜头数量、帧数、镜头数据属性,镜头前缀包括序列号、时间轴坐标、帧数、镜头属性、镜头内容描述;具体标注方法包括如下步骤:步骤1、计算每帧图像的图像属性特征,首先计算颜色类属性,构成颜色矢量并对其进行标注,然后,计算SIFT_Sobel特征点属性,构成SIFT_Sobel特征矢量并进行标注;步骤2、镜头聚类分析计算,将一段视听信息媒体流分割成镜头序列;步骤3、对镜头序列中的每一个镜头进行标注;其中,步骤1中计算颜色类属性,构成颜色矢量并对其进行标注的具体过程如下:步骤a、在一帧图像内选择%65左右像素点构成集合,在颜色域内对该集合的像素点进行颜色聚类运算;步骤b、引入类别数的限制参数C1,引入每个颜色类最少个数的限制参数C2,按最近邻颜色距离规则聚类每一像素点;按最近邻颜色类规则合并颜色类,使得帧内颜色聚类的类别数为C1或小于C1;步骤c、计算每个颜色类的中心坐标、计算每个颜色类的半径、统计每个颜色类的像素点个数,构成颜色矢量及其标注;步骤1中计算SIFT_Sobel特征点属性,构成SIFT_Sobel特征矢量并进行标注的具体过程如下:步骤A、利用基于高斯微分函数来提取图像中不变的特征点,即SIFT特征点;步骤B、利用高斯平滑和微分求导来计算图像中灰度近似边缘的特征点,即Soble特征点;步骤C、采用FPGA实现的SIFT_Sobel算子,提取每一帧图像的SIFT_Sobel特征点;步骤D、将步骤C中的特征点按坐标排序按最近邻规则取Count个点;步骤E、以步骤D中的Count个点为中心、按窗口WxW、计算亮度平均值,构成SIFT_Sobel特征矢量及其标注;步骤2中镜头聚类分析计算的具体过程如下:步骤2.1、根据理论模型和统计经验,建立基于颜色矢量、SIFT_Sobel特征点及亮度分布的图像相似度估计模型;步骤2.2、将每一帧图像的特征进行聚类分析计算,将一段视听信息媒体流分割成镜头序列;步骤3中每一个镜头的组成包括:序列号、时间轴坐标、帧数、图像属性数据表、镜头内容描述;其中,图像属性数据表包括颜色坐标、亮度分布、几何特征,镜头内容描述包括语音转文本关键词、画面文字提取识别的关键词、人工输入关键词。

全文数据:

权利要求:

百度查询: 上海科江电子信息技术有限公司 媒体视听信息流监测监管数据样本及其标注方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。