一种基于度量学习和元强化学习的机器人装配方法及系统

导航：龙图腾网> 最新专利技术> 一种基于度量学习和元强化学习的机器人装配方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东大学

摘要：本发明提出了一种基于度量学习和元强化学习的机器人装配方法及系统，从源域中习得元策略，利用度量学习衡量不同样本间距离，进而在目标域中将通用策略更快泛化为适用于特定任务新任务的策略，相比于每个新任务都需要重新训练，本发明所提方法能够基于通用策略更快地泛化到不同的新任务中，提升学习效果，提高机器人装配的智能化水平。

主权项：1.一种基于度量学习和元强化学习的机器人装配方法，其特征在于，包括：获取源域中机械臂装配的多个训练样本集，每个训练样本集包括同一任务的多个训练样本；基于所获取的多个训练样本集，对强化学习网络进行训练，直至网络收敛，得到目标强化学习网络；其中，在强化学习网络训练过程中，基于元学习网络将历史训练过的数据和当前训练任务数据进行比对，得到用于强化学习网络训练的数据；基于度量学习计算目标域中新任务与源域中测试样本之间的距离，来表征源域中测试样本与目标域中新任务之间的相似度；基于相似度的计算确定用于新任务策略训练的测试样本，在新任务上对所述目标强化学习网络进行强化学习更新训练，直至网络收敛，得到新任务装配策略。

全文数据：

权利要求：

百度查询：山东大学一种基于度量学习和元强化学习的机器人装配方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于事件相机的模糊车牌识别方法

下一篇：解析医嘱大语言模型构建方法、装置、介质及设备

相关技术

一种基于事件相机的模糊车牌识别方法

解析医嘱大语言模型构建方法、装置、介质及设备

用于路基工程的防护排水预制安装施工工艺

一种数字自动化的钢绞线切割装置及切割方法

一种焦炉自动加热耦合控制方法

一种用于环保设备制造的金属线材加工设备

一种安全性高的弹簧式紧急泄放阀

山地风电场风电机组叶轮组装的双承平台及抗风方法

一种用于应急自救的玻璃破拆装置

半导体结构及半导体结构制作方法

一种旋喷桩径检测系统

一种新型冲压焊接前副车架

学习相关技术

多功能学习桌_杭州毅宇科技有限责任公司_202420530224.2

学习机的运行优化方法、控制装置及学习机_深圳倍爱思科技有限公司_202411021733.3

一种基于状态语义表征学习内在奖励的强化学习方法_深圳清华大学研究院_202411366573.6

融合深度学习和宽度学习的野生鸟类图像数据流在线识别方法及系统_重庆工商大学_202411138122.7

一种基于可持续学习的强化学习自动驾驶决策切换方法_武汉理工大学_202410891616.6

一种基于度量学习和元强化学习的机器人装配方法及系统_山东大学_202411144898.X

一种基于视觉模仿学习的机器人细粒度技能学习与泛化方法_北京理工大学_202411023335.5

基于深度强化学习的安全电力调度方法_国网四川省电力公司宜宾供电公司_202411372731.9

联邦学习隐私保护方法、装置、设备及存储介质_鹏城实验室_202410929064.3

一种多任务强化学习推荐方法_哈尔滨工程大学_202111450470.4

机器人相关技术

机器人路径规划方法、机器人及存储介质_广州视源电子科技股份有限公司_202310468668.8

立体仓储机器人的驱动装置及立体仓储机器人_苏州魔仓机器人有限公司_202420517053.X

足式机器人的机械腿及足式机器人_卓益得人形机器人(上海)有限公司_202110343623.9

仿生机器人的头部结构和仿生机器人_肖进视觉(北京)科技有限公司_201710527200.6

机器人辅助充电方法、机器人及计算机存储介质_优地机器人(无锡)股份有限公司_202111237542.7

机器人过凸角方法及清扫机器人_盛视科技股份有限公司_202411008317.X

一种人形机器人的腿部动力结构和人形机器人_杭州宇树科技有限公司_202420836784.0

机器人示教迁移方法及机器人_杭州海康机器人股份有限公司_202410979593.4

一种机器人吸盘夹具及机器人_武汉市兰皓科技有限责任公司_202323438530.8

机器人关节制动控制方法、电路及机器人_节卡机器人股份有限公司_202411246711.7

强化相关技术

一种铝合金管内壁强化设备及强化工艺_江阴富达管业有限公司_202410950832.3

轴承强化寿命试验装置_瓦房店轴承集团国家轴承工程技术研究中心有限公司_202411082577.1

强化管件四通_温州庐威阀门管件有限公司_202420343409.2

基于深度强化学习的安全电力调度方法_国网四川省电力公司宜宾供电公司_202411372731.9

一种声学强化系统及方法_深圳华声强化技术有限公司_202311800822.3

一种多任务强化学习推荐方法_哈尔滨工程大学_202111450470.4

强化难降解工业废水脱氮除碳的处理方法和系统_清华大学_202411018060.6

基于强化学习的全双工安全中继选择及功率分配方法_北京邮电大学_202410919519.3

一种基于Q-Learning强化学习的模块化公交系统_重庆交通大学_202410554132.2

一种纳米SiC颗粒复合强化的时效镁锡合金及其制备工艺_河北石油职业技术大学_202411147099.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于度量学习和元强化学习的机器人装配方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务