买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京有竹居网络技术有限公司
摘要:本公开涉及异策学习方法、装置、电子设备以及介质。该异策学习方法包括:通过使用第一策略对各条数据中收到的特征对商品的反馈进行加权平均得到第一策略的平均奖励,其中所述第一策略表示为给定特征选择商品的概率,并且所述第一策略选择的每个商品收到的正向反馈越多,则所述第一策略的平均奖励越高,表明所示第一策略越好;以及使用所述第一策略为给定特征选择商品,其中,使用第一策略对各条数据中收到的特征对商品的反馈进行加权平均包括:使用第二策略对各条数据中收到的特征对商品的反馈与第一权重的乘积进行加权平均,其中所述第一权重为使用第一策略为给定特征选择商品的概率与使用第二策略为给定特征选择商品的概率的第一比值。
主权项:1.一种异策学习方法,包括:通过使用第一策略对各条数据中收到的特征对商品的反馈进行加权平均得到第一策略的平均奖励,其中所述第一策略表示为给定特征选择商品的概率,并且所述第一策略选择的每个商品收到的正向反馈越多,则所述第一策略的平均奖励越高,表明所示第一策略越好;以及使用所述第一策略为给定特征选择商品,其中,使用第一策略对各条数据中收到的特征对商品的反馈进行加权平均,包括:使用第二策略对各条数据中收到的特征对商品的反馈与第一权重的乘积进行加权平均,其中所述第一权重为使用第一策略为给定特征选择商品的概率与使用第二策略为给定特征选择商品的概率的第一比值。
全文数据:
权利要求:
百度查询: 北京有竹居网络技术有限公司 异策学习方法、装置、电子设备以及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。