Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜环球数科股份有限公司张卫平获国家专利权

恭喜环球数科股份有限公司张卫平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜环球数科股份有限公司申请的专利一种基于强化学习的算力调度策略优化系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119356824B

龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411895936.5,技术领域涉及:G06F9/48;该发明授权一种基于强化学习的算力调度策略优化系统是由张卫平;钟楚炯;李显阔;刘资媛;何文刚;杨淦;梁昊星设计研发完成,并于2024-12-23向国家知识产权局提交的专利申请。

一种基于强化学习的算力调度策略优化系统在说明书摘要公布了:本发明提供了一种基于强化学习的算力调度策略优化系统,涉及电数字数据处理领域,包括环境感知模块、强化决策模块、算力调度模块和反馈奖励模块,所述环境感知模块用于采集感知状态信息,所述强化决策模块基于强化学习输出调度策略,所述算力调度模块用于执行调度策略分配算力资源,所述反馈奖励模块基于调度效果反馈奖励信息;本系统通过强化学习模型对处理方案不断进行筛选细化,能够使输出的调度策略越来越合理,提高算力资源的利用效率。

本发明授权一种基于强化学习的算力调度策略优化系统在权利要求书中公布了:1.一种基于强化学习的算力调度策略优化系统,其特征在于,包括环境感知模块、强化决策模块、算力调度模块和反馈奖励模块;所述环境感知模块用于采集感知状态信息,所述强化决策模块基于强化学习输出调度策略,所述算力调度模块用于执行调度策略分配算力资源,所述反馈奖励模块基于调度效果反馈奖励信息;所述环境感知模块包括资源监控单元、任务分析单元和网络通信单元,所述资源监控单元用于实时采集算力资源的使用状态和负载情况,所述任务分析单元用于分析各个任务的算力需求、优先级和时限要求,所述网络通信单元用于监控资源节点之间的通信延迟和带宽状态;所述强化决策模块包括状态表示单元、动作生成单元和策略优化单元,所述状态表示单元用于将感知数据转换为强化学习的输入状态,所述动作生成单元利用强化学习模型生成调度策略,所述策略优化单元基于奖励信息对模型进行优化;所述算力调度模块包括任务管理单元、任务分配单元和任务监测单元,所述任务管理单元用于管理任务信息,所述任务分配单元基于调度策略将任务分配至对应节点,所述任务监测单元用于监测任务的运行信息;所述反馈奖励模块包括效果跟踪单元、奖励计算单元和反馈管理单元,所述效果跟踪单元用于跟踪任务在完成时的效果信息,所述奖励计算单元用于计算出决策方案的奖励信息,所述反馈管理单元用于将奖励信息汇总后反馈给强化决策模块;所述策略优化单元包括概率优化处理器、方案优化处理器和优化控制处理器,所述概率优化处理器基于奖励信息对处理方案的概率进行调整,所述方案优化处理器用于将一个处理方案发展细化成多个处理方案,所述优化控制处理器用于对优化过程进行控制;所述策略优化单元的优化过程包括如下步骤:S1、所述概率优化处理器接收奖励信息;S2、所述优化控制处理器对奖励信息的分布进行优化判断,满足条件时,进入步骤S3;S3、所述概率优化处理器对每个处理方案的概率进行优化调整,将概率信息同步到概率选择处理器中;S4、所述优化控制处理器判断是否存在裁剪的处理方案,若存在,进入步骤S5;S5、删除需要裁剪的处理方案,筛选出概率最大的处理方案作为目标方案,将裁剪的处理方案的概率累加到目标方案的概率上;S6、方案优化处理器将目标方案细分成n+1个子处理方案,将目标方案的概率均分成n+1份作为每个子处理方案的概率,n为裁剪的处理方案数量;S7、将子处理方案和概率信息同步到动作生成单元中;所述概率优化处理器对概率进行优化调整的过程包括如下步骤:S21、计算出每个处理方案的平均奖励值,记为Vri,表示第i个处理方案的平均奖励值;S22、根据下式计算出每个处理方案的新概率: ;其中,Pi表示第i个处理方案的原概率,P’i表示第i个处理方案的新概率,N为处理方案的数量,为奖励权重系数;所述奖励计算单元包括历史信息寄存器、效果对比处理器和奖励计算处理器,所述历史信息寄存器用于存储任务的效果信息,所述效果对比处理器用于从历史效果信息中提炼出标准并与当前的任务效果进行比较,所述奖励计算处理器基于比较结果计算出任务对应处理方案的奖励值;所述奖励计算处理器根据下式计算出奖励值Vr: ;其中,m为效果项目,ki为第i个效果项目的权重值,表示第i个效果项目的比较值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人环球数科股份有限公司,其通讯地址为:518063 广东省深圳市南山区粤海街道高新南九道10号深圳湾科技生态园10栋B座17层01-03号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。