Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜贵州大学;贵州移动信息科技有限公司季卿获国家专利权

恭喜贵州大学;贵州移动信息科技有限公司季卿获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜贵州大学;贵州移动信息科技有限公司申请的专利基于深度强化学习的多任务卸载方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119271381B

龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411797805.3,技术领域涉及:G06F9/48;该发明授权基于深度强化学习的多任务卸载方法、系统及设备是由季卿;李少波;陈澈;杨静;胡丙齐;麻兴江;黄子宸;刘琳设计研发完成,并于2024-12-09向国家知识产权局提交的专利申请。

基于深度强化学习的多任务卸载方法、系统及设备在说明书摘要公布了:本申请公开了一种基于深度强化学习的多任务卸载方法、系统及设备,所述方法包括:构建多接入边缘计算任务卸载场景,对用户终端计算任务进行有向无环图建模,利用编码器将任务转换为序列,通过贪心算法排序并进行特征提取;基于特征设置结构化状态空间模型,定义状态变换矩阵,引入时间尺度参数进行离散化,并通过全局卷积过程,构建基于注意力机制的深度强化学习网络架构;利用构建的网络架构定义状态空间和动作空间,构建奖励函数,采用近似策略优化算法进行策略优化,引入广义优势估计方法降低策略梯度方差。通过本申请的方案,能够快速适应动态卸载场景快速适应,对新的学习任务具有高效的卸载任务推理能力。

本发明授权基于深度强化学习的多任务卸载方法、系统及设备在权利要求书中公布了:1.一种基于深度强化学习的多任务卸载方法,其特征在于,包括:构建多接入边缘计算任务卸载场景,对用户终端计算任务进行有向无环图建模,利用编码器将任务转换为序列,通过贪心算法排序并进行特征提取;基于特征设置结构化状态空间模型,定义状态变换矩阵,引入时间尺度参数进行离散化,并通过全局卷积过程,构建基于注意力机制的深度强化学习网络架构;其中,包括:基于任务表征,设置结构化状态空间模型;定义隐藏状态变换矩阵和输入输出线性变换矩阵;引入时间尺度参数,对状态空间模型进行离散化处理;设计全局卷积过程,计算结构化卷积核;构建基于注意力机制的深度强化学习网络架构,设置多层叠加的编码器;利用构建的网络架构定义状态空间和动作空间,构建奖励函数,采用近似策略优化算法进行策略优化,引入广义优势估计方法降低策略梯度方差;其中,包括:利用构建的网络架构,定义状态空间,将任务表示为矩阵形式;设计动作空间,用于决策任务在本地执行或边缘服务器执行;构建奖励函数,使用任务完成时间的归一化负值作为奖励;采用近似策略优化算法进行策略优化,并使用截断方式限制新旧策略的差异;引入广义优势估计方法计算优势函数,以降低策略梯度的方差,并构建优化目标;其中,引入广义优势估计方法计算优势函数,以降低策略梯度的方差,并构建优化目标,包括: ,其中,表示在初始策略下的期望,表示从时间步0到n的求和,表示新旧策略的比值,表示在旧策略下计算的优势函数值,表示裁剪函数,为限制新旧策略之间的比例,将限制在范围内,表示限制新旧策略的差异;初始化网络参数,从数据集获取样本批次,生成动作和值估计,计算广义优势估计,更新策略网络参数以最小化损失函数;对离线数据集进行有向无环图转换,计算初始策略,进行迭代训练过程,生成动作值对并计算优势函数,更新网络权重直至收敛,并输出最终训练策略,以进行任务卸载。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州大学;贵州移动信息科技有限公司,其通讯地址为:550025 贵州省贵阳市花溪区贵州大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。