通过基于学习的控制代理来控制机器的方法及控制装置

导航：龙图腾网> 最新专利技术> 通过基于学习的控制代理来控制机器的方法及控制装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西门子股份公司

摘要：为了控制机器M而提供性能评估器PEV和动作评估器VAE。性能评估器PEV使用控制信号A，A1来确定机器M的性能RET，而动作评估器VAE确定与预给定控制流程SP的偏差D。此外，生成多个权重值W，用于相对于偏差D对性能RET进行加权。这些权重值W和多个状态信号S，S1被馈入到控制代理POL中，其中所述控制代理POL的分别产生的输出信号A，A1作为控制信号被馈入到所述性能评估器PEV和所述动作评估器VAE中。根据相应的权重值W，通过目标函数TF相对于由所述动作评估器VAE确定的偏差D而对由所述性能评估器PEV确定的性能RET进行加权。因此，所述控制代理POL鉴于如下方面被训练，基于状态信号S，S1和权重值W输出优化所述目标函数TF的控制信号A，A1。为了控制所述机器M，然后将所述机器M的运行权重值WO和运行状态信号SO馈入到经训练的控制代理POL中，并且将经训练的控制代理POL的产生的输出信号AO输送给所述机器M。

主权项：1.一种通过基于学习的控制代理POL控制机器M的计算机实现的方法，其中a提供性能评估器PEV，所述性能评估器使用控制信号A，A1来确定针对通过所述控制信号A，A1对所述机器M进行控制方面的性能RET，b提供动作评估器VAE，所述动作评估器使用所述控制信号A，A1来确定与预给定的控制流程SP的偏差D，c生成多个权重值W，用于相对于所述偏差D对所述性能RET进行加权，d将多个状态信号S，S1和所述多个权重值W馈入到所述控制代理POL中，其中-所述控制代理POL的分别产生的输出信号A，A1作为控制信号被馈入到所述性能评估器PEV和所述动作评估器VAE中，-根据相应的权重值W，通过目标函数TF相对于由所述动作评估器VAE分别确定的偏差D而对由所述性能评估器PEV分别确定的性能RET进行加权，并且-所述控制代理POL鉴于如下方面被训练，基于状态信号S，S1和权重值W输出优化所述目标函数TF的控制信号A，A1，并且e为了控制所述机器M-将所述机器M的运行权重值WO和运行状态信号SO馈入到经训练的控制代理POL中，并且-将经训练的控制代理POL的产生的输出信号AO输送给所述机器M。

全文数据：

权利要求：

百度查询：西门子股份公司通过基于学习的控制代理来控制机器的方法及控制装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种大尺寸贴膜冶具

下一篇：电动叉车驱动轮总成

相关技术

一种大尺寸贴膜冶具

电动叉车驱动轮总成

一种船舶油泵拆装机构

一种化学发光仪器的样本混匀装置

一种亚硝酸钠干燥装置

一种线材固定结构及电子设备

一种可提高收纳效果的加油站用加油管缠绕装置

一种调度装置

一种控制道壁件加工变形的夹具

一种用于收获机械变速箱与分动箱的钢球连接结构

一种滴灌带打孔装置

一种游离甲醛和有机溶剂的回收利用装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

通过基于学习的控制代理来控制机器的方法及控制装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务