恭喜北京燧原智能科技有限公司靳超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京燧原智能科技有限公司申请的专利一种大语言模型模块化推理计算系统、方法、装置及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119005275B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411496525.9,技术领域涉及:G06N3/063;该发明授权一种大语言模型模块化推理计算系统、方法、装置及介质是由靳超;杜天启;李相相;李川鸣;柴亮;邱尧设计研发完成,并于2024-10-25向国家知识产权局提交的专利申请。
本一种大语言模型模块化推理计算系统、方法、装置及介质在说明书摘要公布了:本发明公开了一种大语言模型模块化推理计算系统、方法、装置及介质。通过对大语言模型模块化推理计算系统中的文本嵌入模块、多簇注意力模块、多层感知机模块和线性映射模块分别进行不同单元的配置,来实现对输入文本令牌序列的生成词令牌的计算,另外的,对注意力机制计算数据流方法和线性层计算数据流方法进行了改进。解决了现有技术中受限于外部存储带宽,将难以充分发挥芯片的计算效率、性能差和对专业人员要求高的问题,实现了构建更加完善的大语言模型,设计了高吞吐的计算数据流,能够充分发挥芯片的算力。
本发明授权一种大语言模型模块化推理计算系统、方法、装置及介质在权利要求书中公布了:1.一种大语言模型模块化推理计算系统,其特征在于,所述大语言模型模块化推理计算系统包括文本嵌入模块、多簇注意力模块、多层感知机模块和线性映射模块;其中,所述文本嵌入模块,包括第一可配置归一化计算单元;所述第一可配置归一化计算单元包括:第一不做归一化子单元、第一LayerNorm归一化计算子单元和第一RMSNorm归一化计算子单元;所述多簇注意力模块,包括第二可配置归一化计算单元、特征提取计算单元、多簇注意力机制计算单元、输出线性映射计算单元和第一可配置残差链接计算单元;其中,所述第二可配置归一化计算单元包括:第二不做归一化子单元、第二LayerNorm归一化计算子单元和第二RMSNorm归一化计算子单元;所述第一可配置残差链接计算单元包括第一不做残差链接计算子单元和第一做残差链接计算子单元;所述多层感知机模块,包括第三可配置归一化计算单元、线性升维计算单元、可配置激活函数计算单元、线性降维计算单元和第二可配置残差链接计算单元;其中,所述第三可配置归一化计算单元包括:第三不做归一化子单元、第三LayerNorm归一化计算子单元和第三RMSNorm归一化计算子单元;所述可配置激活函数计算单元包括至少一种激活函数类型的计算单元;所述第二可配置残差链接计算单元包括第二不做残差链接计算子单元和第二做残差链接计算子单元;所述线性映射模块,包括第四可配置归一化计算单元和线性概率映射计算单元;其中,所述第四可配置归一化计算单元包括:第四不做归一化子单元、第四LayerNorm归一化计算子单元和第四RMSNorm归一化计算子单元;其中,所述多簇注意力机制计算单元是基于改进的注意力机制计算数据流方法进行计算的;所述特征提取计算单元、所述输出线性映射计算单元和所述线性概率映射计算单元均是基于改进的线性层计算数据流方法进行计算的。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京燧原智能科技有限公司,其通讯地址为:100191 北京市海淀区知春路23号14层1401、1403、1405、1407室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。