恭喜深圳市音络科技有限公司丁帆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳市音络科技有限公司申请的专利基于深度学习的视频会议场景人形检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113989850B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111315469.0,技术领域涉及:G06V40/10;该发明授权基于深度学习的视频会议场景人形检测方法是由丁帆;任永忠;梅宇青;王沛;曾德军;陶宇设计研发完成,并于2021-11-08向国家知识产权局提交的专利申请。
本基于深度学习的视频会议场景人形检测方法在说明书摘要公布了:本发明公开了一种基于深度学习的视频会议场景人形检测方法,用于在视频会议场景中提取全景图像并检测各个人员在图像中的位置,有助于实现局部画面聚焦、辅助语音增强等;该方法使用摄像机从会议场景中采集原始全景图像并矫正;将矫正后的矩形全景图像拼接映射成长宽相等的方形图像,并作归一化预处理和数据增强;构建基于残差网络‑特征金字塔网络的深度学习模型;建立边界框回归网络,同时计算出人体目标四周边框位置以及置信度和中心加权;使用自适应焦点损失来训练模型,输入会议场景图像进行训练。本发明通过边界回归、中心加权和自适应焦点损失来引导模型适应特殊场景中的人体目标,从而提高密集人员会议场景下检测的准确率、召回率,具有良好的应用前景。
本发明授权基于深度学习的视频会议场景人形检测方法在权利要求书中公布了:1.一种基于深度学习的视频会议场景人形检测方法,其特征在于,包括如下步骤:步骤A、使用摄像机从会议场景中获取矩形全景图像,并对其进行矫正;步骤B、将矫正后的矩形全景图像拼接映射成长宽相等的方形图像,并作归一化预处理和数据增强操作,随后进行归一化处理,其中归一化预处理和数据增强操作,具体为随机翻转、区域裁剪和区域掩盖重组;步骤C、构建基于残差网络-特征金字塔网络的深度学习模型作为基线模型,输入步骤B中处理完成的图像,输出图像中所有人体的矩形位置边框,包括以下步骤,步骤C1、输入步骤B中处理完成的图像,而后构建基线模型,依次连接残差卷积网络和特征金字塔网络;步骤C2、将用于学习原始图像空间语义特征的残差卷积网络作为主干网络,采用特征金字塔网络实现图像的多尺度特征融合,对特征从不同的尺度大小进行建模;步骤C3、将全连接层通过浅层卷积网络作为检测头,获取目标人形的位置,使用k-means聚类算法获取适配数据集中人形的锚框,而后输出图像中所有人体的矩形位置边框;步骤D、在步骤C中基线模型的基础上引入边界框回归网络,计算出人体目标四周边框位置以及置信度和中心加权,包括以下步骤,步骤D1、引入边界框回归网络,输入第一层特征金字塔网络输出的特征图与第一路多层卷积通过改变上层输入的通道数,回归出目标候选框区域的边界,输出第一路卷积形状为H×W×5的张量,其中H和W为上一层输出的长和宽的数值,5为通道数字,作为目标人体上下左右的边界与当前检测区域中心点的距离l,t,r,b和置信度;步骤D2、将特征图与原图位置一一对应,设置原图与特征图的缩小比例为d,特征图中的坐标x,y所对应的原图中心点坐标为当前区域真实存在的人体,通过边界框回归网络回归出该人体上下左右边界与当前检测区域中心点的距离为l,t,r,b,这四个值与人体目标四周边框的四个角的坐标点进行对应; 其中,x1,y1x2,y2分别是人体目标四周边框左上角点和右下角点的坐标,d是原图与特征图的缩小比例,H和W为该网络输入特征图的长和宽;步骤D3、与步骤D1进行相同输入,输入第二层特征金字塔网络输出的特征图,第二路多层卷积通过改变上层输入的通道数,回归出目标候选框区域的边界,而后输出第二路多层卷积形状为H×W×1的张量,并且代表了当前区域中心点与真实框中心点的距离系数,作为中心权重,其表示数值为ω,用于保证每个检测区域尽可能只检测与自己最近的真实人体;步骤E、引入自适应焦点损失训练模型,根据训练后的人形检测模型输入步骤B中获取的会议场景图像,检测出对应与会者的位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市音络科技有限公司,其通讯地址为:518000 广东省深圳市宝安区新安街道灵芝园社区22区勤诚达乐园13号楼1302-1307;在宝石科技园E栋北六楼设有经营场所从事生产经营活动;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。