首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于多目标排序的系统、计算机实施的方法和非暂时性计算机可读介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:百度时代网络技术(北京)有限公司;百度(美国)有限责任公司

摘要:本文中描述了基于强化学习的大规模多目标排序系统的实施方式。本系统的实施方式可用于优化视频共享平台上的短视频推荐。用户反馈中的多重竞争排序目标和隐式选择偏差是现实世界平台中的主要挑战。为了解决这些挑战,将多门专家混合MMoE和软演员评论家SAC一起集成为MMoE_SAC系统。实验结果表明,与仅基于单个策略的系统相比,MMoE_SAC系统的实施方式可大大降低损失函数。

主权项:1.一种用于多目标排序的计算机实施的方法,包括:在包括多个专家和门控网络的多门专家混合MMoE层处,接收与一个或多个状态和一个或多个动作相对应的隐藏嵌入;由使用软演员评论家SAC的多个专家中的每个,基于所述隐藏嵌入生成预测,每个预测均包括分别对应于所述一个或多个动作的一个或多个预测参数;根据由所述门控网络为每个专家生成的权重,获取所述多个专家预测的加权和;以及基于所述加权和,从所述MMoE层生成MMoE布局输出。

全文数据:

权利要求:

百度查询: 百度时代网络技术(北京)有限公司 百度(美国)有限责任公司 用于多目标排序的系统、计算机实施的方法和非暂时性计算机可读介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。