首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于大语言模型的信息提取装置、方法 

申请/专利权人:山东浪潮科学研究院有限公司

申请日:2024-02-23

公开(公告)日:2024-06-28

公开(公告)号:CN118260390A

主分类号:G06F16/332

分类号:G06F16/332;G06F16/33;G06F16/335;G06F16/338;G06F40/30;G06V30/413;G06V30/418

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本申请涉及自然语言处理领域,公开一种基于大语言模型的信息提取方法,包括文本识别模块、信息提取模块、答案定位模块。文本识别模块用于处理不同格式的文档,通过ocr技术做文本识别,并通过版面分析算法进一步得出完整的文档内容;信息提取模块用于处理文档内容,根据用户问题,通过结构化检索与向量检索相结合提取其中关键信息;答案定位模块用于根据关键信息,定位到其在原文中的位置。本公开通过结合OCR技术、向量检索、提示词工程等创新方法,增加对不同格式文档、不同长度文本的兼容性,并激发大语言模型的信息提取能力;并通过答案定位模块精确定位答案出处,以便用户进行溯源验证。本公开还提供一种基于大语言模型的信息提取方法、装置。

主权项:1.一种基于大语言模型的信息提取装置,其特征在于,包括:文本识别模块,用于处理不同格式的文档,得出完整的文档内容;信息提取模块,用于处理文档内容,根据用户问题,通过结构化检索与向量检索相结合提取其中关键信息;答案定位模块,用于根据关键信息,定位到其在原文中的位置。

全文数据:

权利要求:

百度查询: 山东浪潮科学研究院有限公司 基于大语言模型的信息提取装置、方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。