买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:鱼快创领智能科技(南京)有限公司
摘要:本发明提出一种基于注意力多智能体模型的车辆配货方法及系统,包括采集车与货环境数据车与货环境数据,将采集到的数据进行标签画像,将数据和标签画像输入训练好的Attention‑SmartTranformer基于时空注意力和POI推荐算法引擎模型,给出TOP‑N车货推荐,将TOP‑N车货推荐再输入训练好的多智能体MADDPG深度强化学习决策算法引擎模型,给出最优的车辆配货决策;再对最优的车辆配货决策进行基于兜底规则的专家决策,得到最终的车辆选择配货。解决了大数据量车辆货品匹配的大生态环境,无法考虑在运营中进行博弈竞争合作混合关系的难题。
主权项:1.一种基于注意力多智能体模型的车辆配货方法,其特征在于包括以下步骤:S1,采集车与货环境数据,车与货环境数据包括内部数据和外部数据;所述内部数据包括车辆配置和运营价格数据、车辆货品运营线路和TCO数据、锁车预警车辆和车主司机数据、付费车辆数据、流失预警车辆数据、货运全生命周期内的监控点风险数据;所述外部数据包括货品数据和货主数据,道路数据和实时拥堵信息,天气数据;S2,针对车辆、货主、运营线路、POI运营场景主题进行各个主体的标签和画像,得到车辆标签画像、车辆运营标签画像、货主标签画像、按照业务场景的POI地点标签画像、按照运营线路的车辆TCO标签画像、驾驶员运营诚信标签画像、货主运营诚信标签画像;S3,构建Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型;Attention-SmartTranformer通过车货标注标签画像数据来微调fine-tuning以完成Transformer模型参数的配置;Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型包括四个组件:输入组件、Encoder编码器组件、Decoder解码器组件和输出组件;输入组件,用于输入多类数据,并对输入的多类数据经过one-hot编码后一维向量展开Embedding,然后再加上车辆和货品位置编码信息得到一个基本的输入Embedding向量;Encoder编码器组件,对输入Embedding向量经过一个统一网络的结构,这个结构就是编码结构,编码结构有N次,对输入循环处理N次,每一个encode层中又分成Attention层和全连接层,采用SkipConnection做跳跃连接,还包括Normalization层;Docedder解码器组件,第一次输入信息是空前缀信息,之后的就是上一次产出的Embedding,加入车辆和货品位置编码信息,然后进入一个可以重复很多次的模块,即解码模型;所述解码模型分成三块来看,第一块也是Attention层,第二块是crossAttention,不是Self-Attention,第三块是全连接层,也采用SkipConnection做跳跃连接和Normalization层;输出组件,通过全连接层Linear-1000,再通过softmax做预测,依据概率推荐M个中的TOP-N货品推荐;M大于N,N≥1;S4,对步骤S3构建的Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型进行训练,训练出能够依据概率推荐TOP-N最优解的Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型,即训练出合格的Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型;S5,构建多智能体MADDPG深度强化学习决策算法引擎模型,MADDPG为Multi-agentdeepdeterministicpolicygradient;所述多智能体MADDPG深度强化学习决策算法引擎模型包括Q个Actor-Critic网络,每个网络对应一个智能体A_i,在每个时间步骤,Q≥1;智能体A_i根据自己的Actor网络输出的策略选择一个动作,智能体A_i执行选择的动作并观察到下一个状态和自己的奖励信号,将每个智能体A_i的经验元组、动作、下一个状态、奖励存储在经验回放缓冲区中;S6,对步骤S5构建的多智能体MADDPG深度强化学习决策算法引擎模型进行训练,训练出综合毛利润指标能够达标的多智能体MADDPG深度强化学习决策算法引擎模型;S7,将步骤S1获得的车辆配置和运营价格数据、车辆货品运营线路和TCO数据、货运全生命周期内的监控点风险数据、货品数据和货主数据,以及步骤S2获得的车辆标签画像、车辆运营标签画像、货主标签画像、按照业务场景的POI地点标签画像、按照运营线路的车辆TCO标签画像、驾驶员运营诚信标签画像、货主运营诚信标签画像,以及本次运货的价格和本次运单TCO成本数据输入步骤S4合格的Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型,Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型依据概率给出TOP-N货品推荐;S8,将步骤S7Attention-SmartTranformer基于时空注意力和POI推荐算法引擎模型的输出组件输出结果作为步骤S6得到的训练达到指定次数或综合毛利润指标能够达标的多智能体MADDPG深度强化学习决策算法引擎模型的输入,多智能体MADDPG深度强化学习决策算法引擎模型给出高级快速决策,即最优的车辆配货决策;S9,针对步骤S8得到的最优的车辆配货决策进行基于兜底规则的专家决策方法,判断是否审核通过,得到最终的车辆选择配货。
全文数据:
权利要求:
百度查询: 鱼快创领智能科技(南京)有限公司 基于注意力多智能体模型的车辆配货方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。