首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于强化学习算法的动态陈列调整方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳市秦丝科技有限公司

摘要:本发明提供一种基于强化学习算法的动态陈列调整方法及系统,涉及动态陈列技术领域,包括获取目标场所的历史数据,并按照时间序列进行排序,基于因果表示学习构建销售预测模型,通过因果驱动的预测算法得到销售预测值;构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分;以商品的当前陈列数据为基础,确定状态空间;基于商品的陈列动作,确定动作空间;确定奖励函数,构建动态陈列模型;确定待调整的状态特征,输入动态陈列模型,通过计算动作的概率分布,结合探索衰减因子和软化因子,从动作空间中选择最优动作,确定最优动态陈列策略,进行陈列调整。

主权项:1.基于强化学习算法的动态陈列调整方法,其特征在于,包括:获取目标场所的历史数据,所述历史数据包括销售数据、商品属性数据、用户行为数据和陈列数据,对所述历史数据进行预处理,并按照时间序列进行排序,基于因果表示学习构建销售预测模型,通过因果驱动的预测算法得到销售预测值;构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分;以商品的当前陈列数据为基础,结合所述销售预测值和所述商品推荐得分,确定状态空间;基于商品的陈列位置调整动作、陈列数量调整动作、陈列增删动作和陈列替换动作,确定动作空间;以销售利润和用户满意度为正相关因素,确定奖励函数;基于所述状态空间、所述动作空间和所述奖励函数,构建动态陈列模型;基于所述状态空间,确定待调整的状态特征,输入动态陈列模型,通过计算动作的概率分布,结合探索衰减因子和软化因子,从动作空间中选择最优动作,确定最优动态陈列策略,基于所述最优动态陈列策略,进行陈列调整;构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分包括:对商品属性数据进行预处理,得到商品属性特征,利用卷积神经网络对商品的文本描述和图像数据进行特征提取,得到文本特征向量和图像特征向量,将商品属性特征、文本特征向量和图像特征向量拼接,得到商品融合特征;基于用户行为数据,统计每个用户对每个商品的交互次数,对不同类型的交互行为赋予对应的权重,计算用户-商品交互矩阵;以用户-商品交互矩阵作为二部图,使用图卷积神经网络对所述二部图进行特征学习,通过聚合所述二部图中每个节点的邻域信息,得到用户和商品的隐含表示,提取用户-商品偏好特征;将所述商品融合特征和所述用户-商品偏好特征作为两个不同的视图,使用多视图图注意力网络对视图中的节点特征进行学习和更新,通过注意力机制自适应聚合邻域节点信息,将两个视图的输出进行拼接,得到商品综合表示;基于所述商品综合表示,计算不同商品之间的余弦相似度,构建商品相似度矩阵;根据预设的商品关联规则,将所述商品相似度矩阵作为边的权重,构建商品关联图,使用门控图神经网络对商品关联图进行推理,通过多步消息传递和门控单元,更新节点的隐状态,得到商品之间的互补关系和替代关系;将商品的综合表示、互补关系和替代关系表示拼接,构建商品特征矩阵,对所述商品特征矩阵和所述用户-商品交互矩阵,使用非负矩阵分解,得到商品隐因子矩阵和用户隐因子矩阵,通过所述商品隐因子矩阵和所述用户隐因子矩阵的内积,计算每个用户对每个商品的推荐得分。

全文数据:

权利要求:

百度查询: 深圳市秦丝科技有限公司 基于强化学习算法的动态陈列调整方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。