Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜广州赛意信息科技股份有限公司;广东赛意信息科技有限公司袁海岗获国家专利权

恭喜广州赛意信息科技股份有限公司;广东赛意信息科技有限公司袁海岗获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜广州赛意信息科技股份有限公司;广东赛意信息科技有限公司申请的专利一种基于多路召回的RAG文本处理方法、装置及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119167921B

龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411666863.2,技术领域涉及:G06F40/205;该发明授权一种基于多路召回的RAG文本处理方法、装置及介质是由袁海岗;张永君;占虾仔;黄涛;黎昆涛设计研发完成,并于2024-11-21向国家知识产权局提交的专利申请。

一种基于多路召回的RAG文本处理方法、装置及介质在说明书摘要公布了:本申请提出了一种基于多路召回的RAG文本处理方法、装置及介质,包括:对RAG使用的语料进行处理,得到多个文档块;对每个文档块分别进行如下处理,再保存处理结果:调用RAG嵌入模型进行向量化处理,利用ElasticSearch进行关键词索引处理,调用LLM模型生成多个假设性问题;对用户的提示词进行语义增强处理,得到新提示词;基于新提示词,对RAG嵌入模型、ElasticSearch以及多个假设性问题执行多路召回,得到按排名汇总的文档块集合;调用LLM模型从文档块集合中筛选出若干个目标文档块;根据预设的文档块数量,对若干个目标文档块进行切割处理,得到最终的上下文输出结果;将新提示词和上下文输出结果进行组合,作为LLM模型的输出答案。

本发明授权一种基于多路召回的RAG文本处理方法、装置及介质在权利要求书中公布了:1.一种基于多路召回的RAG文本处理方法,其特征在于,包括:对RAG使用的语料进行处理,得到多个文档块;调用RAG嵌入模型对每个所述文档块进行向量化处理,保存每个所述文档块的向量结果;利用ElasticSearch对每个所述文档块中的关键词进行索引处理,保存每个所述文档块的关键词索引结果;调用LLM模型为每个所述文档块生成多个假设性问题,保存多个所述假设性问题,所述LLM模型是指大语言模型;对用户的提示词进行语义增强处理,得到新提示词;基于所述新提示词,对所述RAG嵌入模型、所述ElasticSearch以及所述多个假设性问题执行多路召回,得到按排名汇总的文档块集合;调用所述LLM模型从所述文档块集合中筛选出若干个目标文档块,所述目标文档块为与所述新提示词相关的文档块;根据预设的文档块数量,对若干个所述目标文档块进行切割处理,得到最终的上下文输出结果;将所述新提示词和所述上下文输出结果进行组合,作为所述LLM模型的输出答案;其中,所述RAG嵌入模型包括maidalun1020bce-embedding-base_v1嵌入模型、baaibge-large-zh-v1.5嵌入模型、GanymedeNiltext2vec-large-chinese嵌入模型;其中,调用RAG嵌入模型对每个所述文档块进行向量化处理,保存每个所述文档块的向量结果包括:分别调用所述maidalun1020bce-embedding-base_v1嵌入模型、所述baaibge-large-zh-v1.5嵌入模型和所述GanymedeNiltext2vec-large-chinese嵌入模型对每个所述文档块进行向量化处理,得到三个第一子向量结果;将三个所述第一子向量结果分别保存到Milvus的不同索引中,得到所述向量结果;其中,基于所述新提示词,对所述RAG嵌入模型、所述ElasticSearch以及所述多个假设性问题执行多路召回,得到按排名汇总的文档块集合包括:调用所述maidalun1020bce-embedding-base_v1嵌入模型、所述baaibge-large-zh-v1.5嵌入模型、所述GanymedeNiltext2vec-large-chinese嵌入模型分别对所述新提示词进行向量化处理后,根据向量结果召回若干个第一相关文档块;调用倒数排名融合RRF算法计算每个所述第一相关文档块的得分;调用所述maidalun1020bce-embedding-base_v1嵌入模型对所述新提示词进行向量化处理后,对所述多个假设性问题进行索引检索,召回若干个第二相关文档块;调用所述RRF算法计算每个所述第二相关文档块的得分;将所述新提示词在ElasticSearch上利用BM25算法进行关键词搜索,召回若干个第三相关文档块;调用RRF算法计算每个所述第三相关文档块的得分;将若干个所述第一相关文档块、若干个所述第二相关文档块和若干个所述第三相关文档块中存在相同的至少两个相关文档块的得分进行相加,得到得分总数,保留所述至少两个相关文档块中的一个相关文档块,并所述得分总数作为所述一个相关文档块的得分;按照得分大小对若干个所述第一相关文档块、若干个所述第二相关文档块和若干个所述第三相关文档块中的剩下相关文档块进行排序汇总,得到所述文档块集合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州赛意信息科技股份有限公司;广东赛意信息科技有限公司,其通讯地址为:510630 广东省广州市天河区珠江西路17号4501室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。