Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于图神经网络的VVC视频编码单元划分方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:聊城莱柯智能机器人有限公司;数炬(山东)智能科技有限公司

摘要:一种基于图神经网络的VVC视频编码单元划分方法,属于视频编码技术领域,包括S1:收集VVC编码的视频数据,提取编码单元的特征和标签信息;S2:根据CU之间的空间关系或时间关系构建边;设计基于图注意力神经网络GNN,再通过图注意力网络设计一个能够同时利用节点和边信息的信息传递机制;S3:使用交叉熵损失函数解决CU划分的六分类问题,然后使用SGD优化器进行训练;S4:基于图神经网络的CU划分;S5:将训练好的模型部署到实际的VVC编码系统中,以自动预测和优化编码单元的划分模式。本发明将CU的划分问题建模为多分类问题。在图神经网络的输出特征基础上,使用分类器对CU进行分类,从而降低编码的复杂度。

主权项:1.一种基于图神经网络的VVC视频编码单元划分方法,其特征在于,包括以下步骤:S1:收集VVC编码的视频数据,然后提取编码单元的特征和标签信息;S2:根据CU之间的空间关系或时间关系构建边,在图神经网络中,每个CU表示为一个图节点;然后设计基于图注意力神经网络GNN,使用GNN的设计允许每个节点通过关注邻居节点的不同重要性来加权聚合邻居信息,同时,使用嵌入层将CU的特征编码成向量形式,并对边的标签进行编码;再通过图注意力网络设计一个能够同时利用节点和边信息的信息传递机制;并设计自适应注意力层,在允许模型根据训练数据的特性和学习过程中的性能反馈来调整注意力机制的参数: α=σ1vTXWnew=αWold其中,σ1是sigmoid函数,确保α在0和1之间,v是可学习的权重向量,X是所有节点的特征矩阵,Wold和Wnew分别是调整前后的特征转换权重;新的节点特征是相邻节点特征的线性组合,其权重由注意力系数决定,节点特征更新如下: ;其中表示经过GNN处理后的节点i的特征;σ2是非线性ReLU函数;Ni表示节点i的邻域系统集合;αij表示注意力系数;W是所有节点共享的线性转换权重矩阵,用于转换特征向量;Xj是节点j的特征向量;在GNN的最后一层添加一个分类器,表示将节点的特征向量映射到六种划分模式的概率;这些概率用一个softmax层来输出: pyi|X=softmax;其中,yi是CU节点i的预测划分模式;X是所有节点的特征矩阵;W是从GNN特征到分类标签的转换矩阵;b是偏置项;S3:训练与优化使用交叉熵损失函数解决CU划分的六分类问题,然后使用SGD优化器进行训练;S4:基于图神经网络的CU划分将步骤S3中训练和优化好的模型集成到实际的VVC编码流程中,自动化选择最优的CU划分模式;最后选择概率最高的划分模式作为最终决策:yˆi=argmaxkpyik|X其中,k是CU可能的划分模式类别;S5:将训练好的模型部署到实际的VVC编码系统中,以自动预测和优化编码单元的划分模式。

全文数据:

权利要求:

百度查询: 聊城莱柯智能机器人有限公司 数炬(山东)智能科技有限公司 一种基于图神经网络的VVC视频编码单元划分方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。