Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习的聚变等离子体环电压控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:合肥综合性国家科学中心能源研究院(安徽省能源实验室)

摘要:本发明涉及聚变等离子体控制技术领域,尤其涉及一种基于强化学习的聚变等离子体环电压控制方法。其技术方案包括以下步骤:选择训练模型的数据:在托卡马克聚变等离子体背景下,将当前时刻的等离子体参数作为输入,输出为下一时刻的vloop;构建数据库:收集运行托卡马克装置放电数据以及未来装置前期的放电数据,作为构建模型的初始训练数据。本发明提高托卡马克vloop控制算法精度和响应速度,强化学习模型具备自学习和自适应能力,提升了托卡马克系统中vloop控制方法的长期稳定性和优化效果,提升了整体控制效果,减少了对人工干预和操作的需求,降低了操作成本和人力资源投入,实现可控核聚变具有重要意义。

主权项:1.一种基于强化学习的聚变等离子体环电压控制方法,其特征在于,包括以下步骤:选择训练模型的数据:在托卡马克聚变等离子体背景下,将当前时刻的等离子体参数作为输入,输出为下一时刻的vloop;构建数据库:收集运行托卡马克装置放电数据以及未来装置前期的放电数据,作为构建模型的初始训练数据;构建神经网络模型:采用长短期记忆神经网络作为训练模型,LSTM神经网络的层数、神经元数量根据具体训练过程确定;神经网络模型的训练:基于主流框架搭建模型并进行训练,根据预测结果调节网络结构;神经网络模型测试:准备除训练数据外的新数据用于模型测试,通过对比预测结果和真实结果的差别判断模型是否有效,进行多步推理验证,并保证该过程预测结果与实验数据保持一致;构建强化学习模型:采用近端策略优化算法;强化学习训练:将训练好的响应模型作为强化学习的交互环境,根据LHW的能力设置探索范围,在规定范围内找到最优控制命令;强化学习模型测试:对当前状态添加一定噪声,基于当前状态利用强化学习控制器给出控制命令,将控制命令输入到响应环境中,查看控制效果;替换当前环电压控制器:在满足控制要求后,将训练好的模型替换传统的vloop控制算法,通过实时采集信号,根据vloop控制的需求,实时给出LHW功率信号,实现vloop的精准控制。

全文数据:

权利要求:

百度查询: 合肥综合性国家科学中心能源研究院(安徽省能源实验室) 一种基于强化学习的聚变等离子体环电压控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。