恭喜杭州衡泰技术股份有限公司张伯雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州衡泰技术股份有限公司申请的专利一种基于值分布环境模型的策略评估系统及风险管控方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119377624B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411933299.6,技术领域涉及:G06F18/21;该发明授权一种基于值分布环境模型的策略评估系统及风险管控方法是由张伯雷;徐行;严军荣;陈宏;吴杰;张丽君设计研发完成,并于2024-12-26向国家知识产权局提交的专利申请。
本一种基于值分布环境模型的策略评估系统及风险管控方法在说明书摘要公布了:本发明公开了一种基于值分布环境模型的策略评估系统及风险管控方法,包括:筛选离线数据模块:筛选离线数据并根据四元组数据格式生成离线数据集;基于值分布的奖赏值分布模型构建模块:根据值分布学习和四元组离线数据集建立损失函数,根据损失函数构建基于值分布的奖赏值分布模型;状态转移模型构建模块:根据四元组离线数据集训练状态转移模型;状态序列生成模块:根据奖赏值分布模型和状态转移模型生成状态序列;策略评估模块:评估状态序列的收益,根据状态序列的收益得到策略评估结果。本发明解决了目前策略评估方法中策略评估效率低、结果稳定性和可靠性不足的问题。
本发明授权一种基于值分布环境模型的策略评估系统及风险管控方法在权利要求书中公布了:1.一种基于值分布环境模型的策略评估系统,其特征在于,包括:筛选离线数据模块:根据历史策略的收益和或历史策略的特异性筛选离线数据并根据四元组数据格式生成离线数据集;所述四元组数据格式为:状态st、行为at、下一时刻状态st+1、风险Rt;自动驾驶领域,所述时刻t是根据数据所在环境需求设置每一天或每半天或每小时或每分钟或每秒作为一个时刻t;所述状态st表示在每一个时刻t,收集到的与驾驶相关的环境状态,包含行驶路面信息、车辆状态信息、驾驶人员状态信息、交通状态信息;所述行为at表示在环境中每一个时刻t内做出的相关行为或动作,包含方向盘操作、操纵杆操作、换挡杆操作、灯光变换、喇叭鸣响、后视镜移动、安全带收紧、安全带解除、座椅调整、安全气囊弹出;所述风险Rt为在险价值;或在气候灾害预警领域,所述时刻t是根据数据所在环境需求设置每一天或每半天或每小时或每分钟或每秒作为一个时刻t;所述状态st表示在每一个时刻t,收集到的环境状态,包含温度、湿度、气压、风力、云层厚度、降水概率、雷暴指数;所述行为at表示在环境中每一个时刻t内做出的相关行为或动作,包含气候播报、灾害等级确定、气候灾害预警、紧急通知;所述风险Rt为在险价值;基于值分布的奖赏值分布模型构建模块:根据值分布学习和四元组离线数据集建立损失函数,根据损失函数构建基于值分布的奖赏值分布模型;所述根据值分布学习和四元组离线数据集建立损失函数,包括:定义奖赏值分布模型;所述奖赏值分布模型的输入为每个时刻的状态st和行为at,输出为奖赏Rt的分布;计算奖赏函数的累积分布函数并以此得到分位数概率分布函数;根据模型预测值与真实值的差值建立损失函数;所述根据损失函数构建基于值分布的奖赏值分布模型,包括:根据损失函数将奖赏值分布模型建模为神经网络;通过损失函数的梯度下降法进行参数更新得到奖赏函数不同分位点的估计值,以此得到基于值分布的奖赏值分布模型;状态转移模型构建模块:采用深度神经网络和梯度反向传播算法,根据四元组离线数据集训练状态转移模型;状态序列生成模块:根据奖赏值分布模型和状态转移模型生成状态序列;策略评估模块:根据奖赏值和序列长度和模型误差评估状态序列的收益,根据状态序列的收益得到策略评估结果;所述根据奖赏值和序列长度和模型误差评估状态序列的收益,包括:根据奖赏函数不同分位点的估计值与收益的正相关关系计算奖赏权重值;根据序列长度与收益的正相关关系计算序列长度权重值;根据奖赏值分布模型和状态转移模型的平均误差计算模型误差权重值;根据奖赏权重值和序列长度权重值和模型误差权重值计算状态序列的收益评估值;根据收益评估值评估状态序列的收益。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州衡泰技术股份有限公司,其通讯地址为:310012 浙江省杭州市西湖区教工路23号百脑汇科技大厦1215室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。