恭喜北京邮电大学张娇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京邮电大学申请的专利基于强化学习的多路径TCP拥塞控制方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115766583B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211422331.5,技术领域涉及:H04L47/12;该发明授权基于强化学习的多路径TCP拥塞控制方法和装置是由张娇;刘远捷;魏德惠;李浩哲;黄韬设计研发完成,并于2022-11-14向国家知识产权局提交的专利申请。
本基于强化学习的多路径TCP拥塞控制方法和装置在说明书摘要公布了:本申请提供一种基于强化学习的多路径TCP拥塞控制方法和装置,方法包括:若检测到目标网络当前的网络环境发送变化,则获取目标网络在当前时刻的目标网络状态数据;将目标网络状态数据加入包含有先验数据的数据集中,并基于更新后的数据集以深度强化学习算法对预设的智能体进行微调,得到适用于目标网络当前的网络环境的新智能体,以基于该新智能体对目标网络进行拥塞控制;智能体预先以深度强化学习算法基于包含有先验数据的数据集离线预训练得到。本申请能够在网络环境变化时及时且自动对智能体进行在线微调,并能够提高智能体更新的效率及有效性,保证智能体持续的高性能,以提高使用智能体进行多路径TCP拥塞控制的有效性及可靠性。
本发明授权基于强化学习的多路径TCP拥塞控制方法和装置在权利要求书中公布了:1.一种基于强化学习的多路径TCP拥塞控制方法,其特征在于,包括:若检测到目标网络当前的网络环境发送变化,则获取所述目标网络在当前时刻的目标网络状态数据;将所述目标网络状态数据加入包含有先验数据的数据集中,并基于更新后的数据集以深度强化学习算法对预设的智能体进行微调,得到适用于所述目标网络当前的网络环境的新智能体,以基于该新智能体对所述目标网络进行多路径TCP拥塞控制;其中,所述智能体预先以深度强化学习算法基于包含有先验数据的数据集离线预训练得到;在所述获取所述目标网络在当前时刻的目标网络状态数据之前,还包括:获取目标网络的先验数据,所述先验数据包括:专家数据和或预设的次优数据;根据所述目标网络的先验数据设置数据集,该数据集用于存储目标网络的状态参数、动作参数、下一个状态参数和奖励参数之间的对应关系;基于深度强化学习算法,采用所述数据集对预设的深度强化学习模型进行预训练,得到用于根据目标网络当前时刻的状态信息输出由当前时刻至下一时刻的动作参数的智能体;所述深度强化学习模型包括:用于在在线微调阶段和离线预训练阶段之间交替执行的AWAC-LSTM模型;所述AWAC-LSTM模型为预先将AWAC模型中的MLP网络替换为LSTM网络后得到的模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。