基于策略迭代求解的机器人数据驱动控制方法和装置

导航：龙图腾网> 最新专利技术> 基于策略迭代求解的机器人数据驱动控制方法和装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本申请涉及一种基于策略迭代求解的机器人数据驱动控制方法和装置。所述方法包括：根据待优化的线性增益矩阵和升维特征函数，构建机器人动力学模型的控制策略；所述升维特征函数是在Koopman算子框架中将机器人的原始状态空间映射到高维特征空间，以此将控制策略的非线性优化问题转化为高维线性优化问题，在线性空间中，定义Q函数，通过Q函数转化，以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵，以此得到机器人动力学模型的控制策略。采用本方法能够避免引入模型误差，能够计算更优的控制策略。

主权项：1.一种基于策略迭代求解的机器人数据驱动控制方法，其特征在于，所述方法包括：根据待优化的线性增益矩阵K和升维特征函数，构建机器人动力学模型的控制策略；所述升维特征函数是在Koopman算子框架中将机器人的原始状态空间映射到高维特征空间，以此将控制策略的非线性优化问题转化为高维线性优化问题；将控制策略u的非线性优化问题转化为高维线性优化问题为：；其中，，，，k表示离散时间指针；所述高维线性优化问题满足高维下的模型约束为：；表示的下一个状态，和均表示模型误差，均为求解所述高维特征空间的模型参数；在线性空间中，定义Q函数为：；其中，，表示所述升维特征函数的简化表示，，为模型误差，表示折扣因子，表示状态值函数；根据所述Q函数，定义，其中，表示升维特征函数的空间维度，表示控制策略的维度，是与相关的矩阵的向量化；以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵K，以此得到机器人动力学模型的控制策略u。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学基于策略迭代求解的机器人数据驱动控制方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种室内AGV分拣小车防冲突调度及应急避障方法

下一篇：一种混凝土桥梁病害并行智能量化方法及装置

相关技术

一种室内AGV分拣小车防冲突调度及应急避障方法

一种混凝土桥梁病害并行智能量化方法及装置

一种托辊式管状带式输送机

一种基于实例分割网络的角膜移植缝合操作的AR导航方法及系统

一种智能型链条张紧装置

一种基于人机混合智能的综合科技服务链集成系统及方法

水利工程计价文件的创建方法、装置、设备和存储介质

一种烧结混合料的定质量取样系统及方法

一种吹扫式气热共储装置及换热系统

处理网络游戏异常的方法、装置、存储介质及计算机设备

一种基于改进蚁群算法的飞机低空突防航线规划方法

光学瞄准镜防震动冲击转换装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于策略迭代求解的机器人数据驱动控制方法和装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务