买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京超图软件股份有限公司
摘要:本申请公开了一种面向大语言模型的知识库构建方法、检索方法及相关装置,该知识库构建方法中,首先,获取多个知识文档;而后,基于多个知识文档的类型所各自对应的存储规则,将多个知识文档存入向量数据库,得到知识库;其中,存储规则至少包括:若知识文档的类型为包含章节信息的第一类型,则基于章节标题将知识文档划分为多个章节块,章节块包括章节标题和章节正文;在一个章节块中,基于章节标题和按句划分章节正文得到的多个单句文本,得到拼接文本;将拼接文本存为知识、章节正文作为补充信息存为所属章节块中所有知识的元数据,逐个章节块存入向量数据库。由此,不会因按句划分知识文档而破坏其完整型,保证了存入知识库的知识的完整性。
主权项:1.一种面向大语言模型的知识库构建方法,其特征在于,所述方法包括:获取多个知识文档;基于多个知识文档的类型所各自对应的存储规则,将所述多个知识文档存入向量数据库,得到知识库;所述存储规则至少包括:若所述知识文档的类型为包含章节信息的第一类型,则基于章节标题将知识文档划分为多个章节块,所述章节块包括章节标题和章节正文;在一个章节块中,基于章节标题和按句划分章节正文得到的多个单句文本,得到拼接文本;将拼接文本存为知识、章节正文作为补充信息存为所属章节块中所有知识的元数据,逐个章节块存入向量数据库。
全文数据:
权利要求:
百度查询: 北京超图软件股份有限公司 面向大语言模型的知识库构建方法、检索方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。