申请/专利权人:安徽航天信息有限公司
申请日:2023-12-13
公开(公告)日:2024-04-26
公开(公告)号:CN117931864A
主分类号:G06F16/2455
分类号:G06F16/2455;G06F16/25;G06F16/33;G06F18/22;G06F40/30
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.14#实质审查的生效;2024.04.26#公开
摘要:本发明提供一种大语言模型缓存系统,涉及语言模型技术领域,该系统包括向量模块、搜索模块、相似度模块、调用模块、存储模块以及反馈模块;向量模块用于将用户的查询语句向量化,生成查询语句词向量;搜索模块用于搜索相似语句;相似度模块用于生成语义相似度,并将相似语句和查询语句词向量传输至调用模块;调用模块用于根据相似语句调用存储模块中与相似语句对应的第一查询结果,还用于根据查询语句词向量调用模型接口,生成第二查询结果,并将第二查询结果缓存至存储模块;存储模块用于存储查询语句、查询语句词向量以及第二查询结果;反馈模块用于将第一查询结果或第二查询结果反馈给用户。该系统可以提高效率,降低成本。
主权项:1.一种大语言模型缓存系统,其特征在于,包括:向量模块、搜索模块、相似度模块、调用模块、存储模块以及反馈模块;所述向量模块用于将用户的查询语句向量化,生成查询语句词向量;所述搜索模块用于在所述存储模块中搜索与所述查询语句词向量相似的相似语句;所述相似度模块用于生成所述查询语句与所述相似语句的语义相似度,还用于当所述语义相似度大于或等于预设阈值时,将所述相似语句传输至所述调用模块,当所述语义相似度小于所述预设阈值时,将所述查询语句传输至所述调用模块;所述调用模块用于根据所述相似语句调用所述存储模块中与所述相似语句对应的第一查询结果,还用于根据所述查询语句调用模型接口,生成第二查询结果,并将所述第二查询结果缓存至所述存储模块;所述存储模块用于存储所述查询语句、所述查询语句词向量以及所述第二查询结果;所述反馈模块用于将所述第一查询结果或所述第二查询结果反馈给所述用户。
全文数据:
权利要求:
百度查询: 安徽航天信息有限公司 一种大语言模型缓存系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。