【发明授权】面向边缘蜂窝网络基于强化学习的视频码率自适应方法_上海大学_202211574628.3

导航：龙图腾网> 最新专利技术> 面向边缘蜂窝网络基于强化学习的视频码率自适应方法_上海大学_202211574628.3

申请/专利权人：上海大学

申请日：2022-12-08

公开（公告）日：2024-06-18

公开（公告）号：CN116016987B

主分类号：H04N21/2343

分类号：H04N21/2343;G06N20/00;H04N21/4402;H04N19/40

优先权：

专利状态码：有效-授权

法律状态：2024.06.18#授权;2023.05.12#实质审查的生效;2023.04.25#公开

摘要：一种面向边缘蜂窝网络基于强化学习的视频码率自适应方法，通过构建能够多址边缘计算MEC转码的服务端及内置缓存的客户端作为视频流会话仿真环境，采用并行协作联合多视频切片码率转码和传输的ABR方法PCMC模型，以视频数据集和无线带宽轨迹数据集在视频流会话仿真环境中进行基于异步强化学习A3C的训练，在在线阶段通过该模型对视频码率进行自适应调整。本发明在配置MEC的无线网络场景下，充分利用RAN侧的信息以及MEC计算资源和存储资源的同时，使用传输和转码并行执行的策略，减少MEC带来的额外计算延迟和计算能耗，提高客户端的视频流QoE指标。

主权项：1.一种面向边缘蜂窝网络基于强化学习的视频码率自适应方法，其特征在于，通过构建能够多址边缘计算MEC转码的服务端及内置缓存的客户端作为视频流会话仿真环境，采用并行协作联合多视频切片码率转码和传输的自适应比特率方法模型，以视频数据集和无线带宽轨迹数据集在视频流会话仿真环境中进行基于异步强化学习的训练，在在线阶段通过该模型对视频码率进行自适应调整；所述的并行协作联合多视频切片码率转码和传输的自适应比特率方法模型具备多动作输出的网络结构，包括：环境编码模块、策略生成模块和策略评价模块，其中：环境编码模块根据反映环境Environment特征的状态信息生成特征向量，策略生成模块根据特征向量输出由未来k个动作的集合An组成的策略，策略评价模块对当前的策略进行评价估值并反馈至策略生成模块以估值调整其策略模型；所述的并行协作联合多视频切片码率转码和传输的自适应比特率方法模型具体包括：环境编码模块、策略生成模块以及策略评价模块，其中：环境编码模块根据反映环境Environment特征的环境状态信息bn-1，Zn，m，dn-1，Cn，ln输出特征向量；策略生成模块生成决策模型根据环境编码模块生成的特征向量输出未来k块视频切片的码率选择，即动作An＝vn，vn+1，...，vn+k的概率分布当传输索引n的切片时，并行执行n+1的切片码率的转码过程以减小因转码带来的延时，vn为请求索引n视频切片选择的码率，为在t时刻客户端Buffer的长度，bn为传输索引n视频切片的平均网络吞吐量，Zn，m为索引n码率m视频切片的字节大小，dn-1为传输索引n视频造成客户端播放卡顿时长，Cn为索引n视频切片在缓存中最高的码率版本，ln为剩余的视频切片数量；策略评价模块拟合状态值V函数，根据环境状态信息的特征向量输出V值至策略生成模块，用于梯度更新；所述的并行协作联合多视频切片码率转码和传输的自适应比特率方法模型，以最大化期望回报值Jπθ为目标，采用A3C方法进行异步训练，即在AC网络架构的基础上部署多个子线程进行同时训练，子线程训练完毕后将参数同步给主线程；训练过程中策略生成模块和策略评价模块的参数分别通过以下方式进行更新：其中：状态采取动作An比平均水平的差异从状态并执行动作An的双重设定下，在策略π下能够获得的期望回报值V函数的贝尔曼方程为强化学习模型的优化目标应为最大化在观察到下的期望回报值θ表示强化学习模型中所有的参数集合，置信空间向量为在状态信息下观察到的概率分布；智能体做出动作后得到环境的奖励为ω、μ、δ、为各子项的权重系统，为常量；q0为最高码率，方便归一化处理；同时为使模型权衡近期奖励和长期奖励的重要性，使用随着时间衰减的折扣回报Rτ来使策略模型能考虑长远的回报值：并行协作联合多视频切片码率转码和传输的自适应比特率方法模型的策略生成模块和环境编码模块不断交互产生奖励直至达到终止状态，此过程的状态信息、动作和奖励的所有集合即轨迹τ，其发生的概率Pτ；在部分可观察马尔可夫决策过程POMDP中，回报值为r′n，即在置信空间向量下能够得到的rn的期望值；将r′n替换折扣回报Rτ中rn得到新的折扣回报R′τ；由于环境状态转移和策略都具有随机性，同样的策略模型作用于同初始状态的同一环境，也可能产生截然不同的轨迹，因此强化学习模型的优化目标应为最大化在观察到下的期望回报；视频流会话总能量损耗E＝Ec+Eom+Etc，其中：MEC服务端执行缓存任务时带来的能耗Ec＝wcm*Zn，m，当缓存未命中时，请求源服务器数据的传输延时Tom＝Zn，mWom，传输能耗Eom＝eom*Zn，m*Tom；当缓存中存在码率版本高于请求时，MEC执行转码任务的计算能耗Etc＝ρ0*ctm*qext-qtar*Ttcn，m；wcm为MEC的缓存能耗单位，wom为MEC到源服务器的带宽，eom为MEC到源服务器的传输能耗单位，ρ0为CPU运行每周期的能耗，ctm为CPU处理每比特转码任务所需的周期数。

全文数据：

权利要求：

百度查询：上海大学面向边缘蜂窝网络基于强化学习的视频码率自适应方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

下一篇：车辆控制装置、车辆控制方法以及非暂时性存储介质_丰田自动车株式会社_202311560781.5

相关技术

光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

车辆控制装置、车辆控制方法以及非暂时性存储介质_丰田自动车株式会社_202311560781.5

车辆显示控制装置、车辆显示控制方法和非暂时性存储介质_丰田自动车株式会社_202311728960.5

乙烷混合液烃萃取精馏脱碳系统及方法_长庆工程设计有限公司_202211655444.X

一种机房巡检机器人控制方法及系统_广州申迪智能科技有限公司_202311823017.2

一种微型电机防水密封检测装置_全南县超亚科技有限公司_202410179550.8

升降销硬止动件_朗姆研究公司_202280073752.3

一种ORB特征匹配融合AMCL的机器人重定位方法_重庆邮电大学_202410163891.6

一种电磁炉陶瓷凹盘及其制备方法_佛山市越富炉具实业有限公司_202410294934.4

一种功能分级的智能分注管柱及使用方法_中国石油化工股份有限公司_202211701478.8

催化剂质子膜涂层及其制备方法、以及膜电极、燃料电池_武汉氢能与燃料电池产业技术研究院有限公司_202410642734.3

设备的设计图生成方法和计算设备_超聚变数字技术有限公司_202410269408.2

学习相关技术

通过逆向强化学习的人类技能学习_发那科株式会社_202311717238.1

一种基于多层次增强对比学习的慕课学习者学习成效预测方法_华中师范大学_202410337219.4

基于补丁匹配度量的语义交互元学习网络及学习方法_西北工业大学_202410198101.8

一种基于智能学习机的学习进度自适应跟进系统_山东金声教育科技有限公司_202410387512.1

一种基于课程学习的图像分类的增量学习方法_西北工业大学_202410254888.5

一种英语学习助记器_盐城师范学院_202322721576.4

综合思维能力学习装置_可丽普株式会社_202110859201.7

一种学习机_深圳市锐族数码科技有限公司_202322594024.1

强化学习的方法和装置_华为技术有限公司_202010308484.1

一种新型学习教具_青岛滨海学院_202322503391.6

强化相关技术

锂铝硅酸盐玻璃的强化方法、强化玻璃及其应用_咸宁南玻光电玻璃有限公司_202410019601.0

玻璃的强化方法、强化玻璃和可折叠电子设备_深圳市锐尔觅移动通信有限公司_202211652048.1

强化学习的方法和装置_华为技术有限公司_202010308484.1

一种强化传热石墨换热器_淄博华鸣新材料有限公司_202321631528.X

强化烘干多段焙烧炉_中际山河科技有限责任公司_202322259939.7

强化的电池热屏障和方法_亚斯朋空气凝胶公司_202311767179.9

一种高强化发动机活塞_瑞安市程泰活塞制造有限公司_202322999464.5

一种方便拆卸组装的强化传热管_山东交通学院_202410414528.7

通过逆向强化学习的人类技能学习_发那科株式会社_202311717238.1

一种表面急冷强化除雾装置_潜江宜生新材料有限公司_202322840726.3

网络相关技术

网络系统_关连风科技股份有限公司_201880088748.8

网络接头改良结构_吴绍钧_202410349844.0

自动化系统网络_探求自动化服务有限公司_201980064702.7

智能网络拓扑优化算法_上海云域网络科技有限公司_202410345925.3

一种可插拔网络模块接口电路及带网络功能的装置_广州朗国电子科技股份有限公司_202210092015.X

基于混合持续变分量子神经网络的网络入侵检测方法_西安邮电大学_202211606329.3

缓存管理方法及装置、网络芯片、网络设备_华为技术有限公司_202211651844.3

用于管理通信网络中的网络切片的方法和系统_三星电子株式会社_202380014430.6

基于脉冲神经网络的残差网络优化方法、装置及电子设备_中国科学院自动化研究所_202410281281.6

光交换网络系统和光交换网络实现方法_鹏城实验室_202410159073.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】面向边缘蜂窝网络基于强化学习的视频码率自适应方法_上海大学_202211574628.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务