首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于赛汝生产调度的鲁棒优化方法、装置和设备_北京理工大学_202410239420.9 

申请/专利权人:北京理工大学

申请日:2024-03-04

公开(公告)日:2024-06-14

公开(公告)号:CN117829552B

主分类号:G06Q10/0631

分类号:G06Q10/0631;G06Q10/04;G06Q50/04;G06N3/126

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2024.05.28#著录事项变更;2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本申请提供了一种基于赛汝生产调度的鲁棒优化方法、装置和设备,涉及赛汝生产技术领域,该方法包括:创建初始化赛汝种群,将初始化赛汝种群划分为赛汝调度子代种群和赛汝构造子代种群;通过强化学习模块获取状态空间信息,输出动作空间信息;根据动作空间信息,以最小化产品批次加工时间最坏情况下的最大完工时间为优化目标,对赛汝调度子代种群和或赛汝构造子代种群进行种群进化;根据进化后的结果,计算奖励值;根据奖励值,更新强化学习模块;重新获取状态信息,以利用新的动作空间信息重新进行种群进化,直至目标函数收敛,将赛汝调度子代种群和赛汝构造子代种群的最优解,确定为赛汝生产调度的最优方案。

主权项:1.一种基于赛汝生产调度的鲁棒优化方法,其特征在于,所述方法包括:创建初始化赛汝种群,每个种群个体表示一种赛汝构造-赛汝调度对,赛汝构造表示并行工作的赛汝单元数量和每个赛汝单元中的工人组合,赛汝调度表示为每个赛汝单元分配的待执行的产品批次;将所述初始化赛汝种群划分为赛汝调度子代种群和赛汝构造子代种群;通过强化学习模块获取所述赛汝调度子代种群和所述赛汝构造子代种群的状态空间信息,输出动作空间信息;所述状态空间信息表示当前的所述赛汝调度子代种群和所述赛汝构造子代种群的进化状态,所述动作空间信息用于指示下一次种群进化的目标为所述赛汝调度子代种群和或所述赛汝构造子代种群;根据所述动作空间信息,以最小化产品批次加工时间最坏情况下的最大完工时间为优化目标,对所述赛汝调度子代种群和或所述赛汝构造子代种群进行种群进化;根据进化后的结果,计算奖励值;所述奖励值表示种群进化效率;根据所述奖励值,更新所述强化学习模块;利用更新后的所述强化学习模块重新获取状态信息,以利用新的动作空间信息重新进行种群进化,直至目标函数收敛,将所述赛汝调度子代种群和所述赛汝构造子代种群的最优解,确定为赛汝生产调度的最优方案;其中,所述通过强化学习模块获取所述赛汝调度子代种群和所述赛汝构造子代种群的状态空间信息,输出动作空间信息,包括:所述强化学习模块生成一个随机数;在所述随机数大于预设概率值的情况下,输出第一动作空间信息,所述第一动作空间信息指示先对所述赛汝构造子代种群进行进化,然后对所述赛汝调度子代种群进行进化;在所述随机数小于或等于所述预设概率值的情况下,输出第二动作空间信息,所述第二动作空间信息指示对所述赛汝调度子代种群或所述赛汝构造子代种群进行进化;按照如下公式根据进化后的结果,计算所述奖励值: ;其中,表示第t轮进化后所得到的奖励值,表示在状态下采用动作导致的目标值的变化,表示在状态下采用动作所需要的求解时间;按照如下公式,根据所述奖励值,更新所述强化学习模块: ;其中,表示折扣因子,0≤≤1,表示学习率,0≤≤1,表示第t轮进化后所得到的奖励值;按照如下公式计算所述产品批次加工时间最坏情况下的最大完工时间: ;其中,表示赛汝单元集合,表示赛汝单元m中产品批次加工时间的不确定集,表示产品批次集合,表示在产品批次j被分配到赛汝单元m进行加工的情况下,=1,表示赛汝单元m中加工产品批次j的时间,其中,按照如下公式计算: ;其中,表示产品批次j包含的产品数量,表示赛汝单元i中加工产品批次j中单个产品的单工人等效加工时间,表示工人集合,表示在工人i被分配到赛汝单元m上时,则=1,表示工人i加工产品批次j中单个产品的时间。

全文数据:

权利要求:

百度查询: 北京理工大学 一种基于赛汝生产调度的鲁棒优化方法、装置和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。