申请/专利权人:北京邮电大学
申请日:2024-02-26
公开(公告)日:2024-06-28
公开(公告)号:CN118265053A
主分类号:H04W24/02
分类号:H04W24/02;G06N3/0475;G06N3/0895;G06N3/092
优先权:
专利状态码:在审-公开
法律状态:2024.06.28#公开
摘要:本申请提供一种通信辅助感知场景下的高效数据增强优化方法及相关设备;该方法包括:数据增强模型从本地端接收感知数据,并进行数据增强,得到增强样本;深度强化学习模型接收本地模型参数,在每个回合利用各本地模型参数和各增强样本构建当前状态,在当前状态下确定当前动作,并确定对应的奖励和该回合中的下一状态,将当前状态、当前动作、对应的奖励和下一状态组成该回合中对应当前状态的转移样本,利用转移样本训练深度强化学习模型,动作包括将增强样本添加到对应的本地端;全局模型获取每个本地端的本地模型参数并进行聚合,得到下一训练时刻的全局模型参数,响应于接收到本地端的参数请求,将下一训练时刻的全局模型参数下发至本地端。
主权项:1.一种通信辅助感知场景下的高效数据增强优化方法,其特征在于,应用于中央平台,所述中央平台包括全局模型、深度强化学习模型和数据增强模型;该方法包括:令所述数据增强模型从每个本地端接收感知数据,并对全部感知数据组成的感知数据集进行数据增强,得到增强样本;令所述深度强化学习模型接收每个本地端发来的本地模型参数,并从所述数据增强模型获取增强样本,在每个回合利用各本地模型参数和各增强样本构建当前状态,在所述当前状态下确定当前动作,并确定对应的奖励和该回合中的下一状态,将所述当前状态、所述当前动作、对应的奖励和下一状态组成该回合中对应所述当前状态的转移样本,利用所述转移样本训练所述深度强化学习模型,所述动作包括将所述增强样本添加到对应的本地端;令每个训练时刻全局模型获取当前每个本地端的本地模型参数,并对全部本地模型参数进行聚合,得到下一训练时刻的全局模型参数,响应于接收到本地端的参数请求,将下一训练时刻的全局模型参数下发至本地端。
全文数据:
权利要求:
百度查询: 北京邮电大学 通信辅助感知场景下的高效数据增强优化方法及相关设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。