首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于值分布DDPG算法的微波加热系统温度场优化方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:昆明理工大学

摘要:本发明公开了一种基于值分布DDPG算法的微波加热系统温度场优化方法,包括:建立微波加热系统三维模型;将每个磁控管设置为智能体,用于控制每个时刻的功率输入控制;以加热物料的温度作为优化目标,微波源功率变化作为决策变量,并考虑过程约束,将加热物料的温度场优化形式描述为一个典型的多目标优化问题,采用DDPG算法以实现对值分布的估计和策略的更新,得到优化控制策略。本发明基于系统运行数据和值分布DDPG算法高效地提升了微波加热过程中加热物料的温度均匀性。

主权项:1.一种基于值分布DDPG算法的微波加热系统温度场优化方法,其特征在于:包括以下步骤:S1,确定微波加热系统腔体结构及各微波源在腔体上的位置分布,并以此建立微波加热系统三维模型;S2,设定每次加热的总时长、各个微波源的总功率,确定被加热式样材料并设定其需要的各项参数;S3,将每个微波源设置为一个智能体,用于控制功率大小的控制;S4,智能体通过与微波加热系统三维模型仿真平台的交互学习获取当前阶段各个微波源功率状态和加热物料温度场数据;S5,对采集的数据进行滑动平均滤波处理、归一化和反归一化处理并利用线性函数转化方法将数据转化成0-1范围内的数值;S6,利用神经网络和S5获得的数据构建微波加热系统的神经网络模型;S7,确定DDPG智能体的状态变量、动作变量、奖励信号以及结构;利用值分布深度确定性策略梯度算法来训练智能体,以实现对微波功率的优化调节,这个网络将学习如何根据当前状态选择最优的微波功率分配策略;S8,根据当前状态选择动作,并根据值分布DDPG算法输出的概率分布随机选择下一阶段的动作或选择最大值作为动作;S9,仿真平台根据智能体提供的动作执行微波加热过程,进入下一阶段状态;S10,基于当前状态、动作、奖励和下一阶段状态生成经验数组,并存储到经验池中;S11,在每次训练时,从经验池中随机抽取经验数组,计算当前目标Q值,评价每次功率分配的效果,促使智能体学习出最优的策略;然后通过梯度反向传播更新Critic和Actor网络的参数;S12,根据计算得到的梯度更新神经网络的参数;S13,根据一定频率更新目标网络参数;S14,判断当前状态是否为终止状态,若是则结束当前轮迭代,否则转到步骤S5。

全文数据:

权利要求:

百度查询: 昆明理工大学 一种基于值分布DDPG算法的微波加热系统温度场优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。