首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

通过基于学习的控制代理来控制机器的方法及控制装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西门子股份公司

摘要:为了控制机器M而提供性能评估器PEV和动作评估器VAE。性能评估器PEV使用控制信号A,A1来确定机器M的性能RET,而动作评估器VAE确定与预给定控制流程SP的偏差D。此外,生成多个权重值W,用于相对于偏差D对性能RET进行加权。这些权重值W和多个状态信号S,S1被馈入到控制代理POL中,其中所述控制代理POL的分别产生的输出信号A,A1作为控制信号被馈入到所述性能评估器PEV和所述动作评估器VAE中。根据相应的权重值W,通过目标函数TF相对于由所述动作评估器VAE确定的偏差D而对由所述性能评估器PEV确定的性能RET进行加权。因此,所述控制代理POL鉴于如下方面被训练,基于状态信号S,S1和权重值W输出优化所述目标函数TF的控制信号A,A1。为了控制所述机器M,然后将所述机器M的运行权重值WO和运行状态信号SO馈入到经训练的控制代理POL中,并且将经训练的控制代理POL的产生的输出信号AO输送给所述机器M。

主权项:1.一种通过基于学习的控制代理POL控制机器M的计算机实现的方法,其中a提供性能评估器PEV,所述性能评估器使用控制信号A,A1来确定针对通过所述控制信号A,A1对所述机器M进行控制方面的性能RET,b提供动作评估器VAE,所述动作评估器使用所述控制信号A,A1来确定与预给定的控制流程SP的偏差D,c生成多个权重值W,用于相对于所述偏差D对所述性能RET进行加权,d将多个状态信号S,S1和所述多个权重值W馈入到所述控制代理POL中,其中-所述控制代理POL的分别产生的输出信号A,A1作为控制信号被馈入到所述性能评估器PEV和所述动作评估器VAE中,-根据相应的权重值W,通过目标函数TF相对于由所述动作评估器VAE分别确定的偏差D而对由所述性能评估器PEV分别确定的性能RET进行加权,并且-所述控制代理POL鉴于如下方面被训练,基于状态信号S,S1和权重值W输出优化所述目标函数TF的控制信号A,A1,并且e为了控制所述机器M-将所述机器M的运行权重值WO和运行状态信号SO馈入到经训练的控制代理POL中,并且-将经训练的控制代理POL的产生的输出信号AO输送给所述机器M。

全文数据:

权利要求:

百度查询: 西门子股份公司 通过基于学习的控制代理来控制机器的方法及控制装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。