首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种大语言模型的推理方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京潞晨科技有限公司

摘要:本发明公开了一种大语言模型的推理方法、装置、设备及存储介质,包括:获取用户输入的原始模型,对推理引擎进行初始化配置,通过预设的集成训练工具,根据推理引擎对应的当前优化策略,对原始模型中的模型层与算子进行替换,同时对原始模型进行切分,并将多个切分结果分别部署在多个不同的加速卡上得到优化后模型,获取用户输入的提示词序列,通过优化后模型推理输出提示词序列的生成结果。本发明实施例的技术方案可以提高大语言模型的推理效率,提高计算资源的利用率。

主权项:1.一种大语言模型的推理方法,其特征在于,应用于推理引擎中,所述方法包括:获取用户输入的原始模型,并对所述推理引擎进行初始化配置;通过预设的集成训练工具,根据所述推理引擎对应的当前优化策略,对所述原始模型中的模型层与算子进行替换,同时对所述原始模型进行切分,并将多个切分结果分别部署在多个不同的加速卡上,得到优化后模型;获取用户输入的提示词序列,通过所述优化后模型推理输出所述提示词序列的生成结果;其中,在通过预设的集成训练工具,根据所述推理引擎对应的当前优化策略,对所述原始模型中的模型层与算子进行替换之前,还包括:对每个加速卡预先分配对应的激活缓存;对所述推理引擎对应的分块式KV缓存管理器进行初始化处理,并对每个加速卡分配对应的分块式KV缓存;对所述推理引擎对应的调度器进行初始化处理。

全文数据:

权利要求:

百度查询: 北京潞晨科技有限公司 一种大语言模型的推理方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。