恭喜北京理工大学陈晨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京理工大学申请的专利一种基于决策者偏好的人机交互方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119440264B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510038611.3,技术领域涉及:G06F3/01;该发明授权一种基于决策者偏好的人机交互方法是由陈晨;缪昌昊;申奥;吴秉鸿;王元;李楠;邓方;陈杰设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。
本一种基于决策者偏好的人机交互方法在说明书摘要公布了:本发明属于人机交互技术领域,具体涉及一种基于决策者偏好的人机交互方法,能够精确捕捉和量化决策者对于不同策略的偏好,选出最佳决策结果。该方法的具体过程为:与仿真环境交互进行轨迹数据生成;随机截取设定长度的轨迹数据,并两两组合进行决策者偏好标签标注,构成用于训练的样本数据;利用所述样本数据进行神经网络训练,神经网络输出每一时间步对应的偏好得分和对应权重,得到偏好预测结果,计算损失函数并更新神经网络参数;将给定的若干个均衡策略输入仿真环境中,获得轨迹数据,利用训练好的神经网络获得轨迹数据的偏好得分和对应权重,进一步计算出最优的策略。
本发明授权一种基于决策者偏好的人机交互方法在权利要求书中公布了:1.一种基于决策者偏好的人机交互方法,其特征在于,具体过程为:样本数据生成:智能体与仿真环境进行个时间步交互生成轨迹数据,所述轨迹数据为智能体的状态与动作信息;随机截取设定长度的轨迹数据,并两两组合进行决策者偏好标签标注,构成用于训练的样本数据;神经网络训练:利用所述样本数据进行神经网络训练,神经网络输出每一时间步对应的偏好得分和对应权重;基于所述偏好得分和对应权重,分别进行组合的偏好预测;基于所述偏好预测结果,计算损失函数并更新神经网络参数;人机交互最佳策略选定:将给定的若干个均衡策略输入仿真环境中,获得轨迹数据,利用训练好的神经网络获得轨迹数据的偏好得分和对应权重,进一步计算出最优的策略;所述进行组合的偏好预测包括:组合中轨迹数据优于轨迹数据的概率 组合中轨迹数据优于轨迹数据的概率 其中,和分别表示轨迹数据和轨迹数据时间步对应的偏好得分,所述偏好得分为智能体当前时间步下的表现与决策者偏好的符合程度,和分别表示轨迹数据和轨迹数据时间步对应的偏好权重;所述轨迹数据为状态-动作对的元组形式,其中表示第步的状态信息,表示第步的动作信息;所述神经网络包含线性映射层和自注意力层,所述线性映射层将每个时间步的状态-动作对编码为,所述自注意力层针对编码,计算偏好对应权重和偏好得分;所述线性映射层编码获得为: 其中,表示向量间的拼接,和表示线性变换矩阵;所述自注意力层由查询、键和值三部分组成,所对应的线性变换矩阵为; 其中,分别代表每一时间步的查询、键和值;计算偏好权重为: 其中,为归一化指数函数,为隐藏层维度;计算偏好得分为: ;所述计算出最优的策略为:计算每一均衡策略对应的得分,选择得分最高的作为最优的策略 其中,表示该策略与人类偏好的符合程度,为截取轨迹的长度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。