首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于大模型的财报自动化问答方法和装置_之江实验室_202311379778.3 

申请/专利权人:之江实验室

申请日:2023-10-24

公开(公告)日:2024-06-11

公开(公告)号:CN117235233B

主分类号:G06F16/332

分类号:G06F16/332;G06F40/205;G06F18/214;G06Q40/12

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2024.01.02#实质审查的生效;2023.12.15#公开

摘要:本发明公开了一种基于大模型的财报自动化问答方法和装置,该方法包括以下步骤:基于金融数据集和历年财报数据对基础开源大模型进行预训练和微调,构建具有财务问答能力的财报大模型;用户上传财报文件并输入问题至财报大模型,通过财报大模型对财报文件进行文件解析并生成答案返回给用户;构建数据库,其中包括历年财报数据、财报文件解析结果和对答案的打分结果;利用数据库中的信息通过反馈迭代机制对财报大模型进行迭代优化;利用优化后的财报大模型进行财报自动化问答。本发明方法能够有效提高财报分析的准确性和效率,适用于财务领域中对财报数据的智能化问答应用场景。

主权项:1.一种基于大模型的财报自动化问答方法,其特征在于,包括以下步骤:基于金融数据集和历年财报数据对基础开源大模型进行预训练和微调,构建具有财务问答能力的财报大模型;用户上传财报文件并输入问题至财报大模型,通过财报大模型对财报文件进行文件解析并生成答案返回给用户,具体包括:将财报文件和问题输入财报大模型,通过财报大模型的文件解析模块利用文件解析技术对财报文件进行文件解析,提取财报中的图文信息并存入数据库中,其中文件解析技术至少包括利用OCR技术对财报文件中的图文信息进行识别和存储,利用Python技术读取和解析各种财务报表格式并对财报数据进行处理;通过财报大模型的问答模块对数据库中的图文信息进行信息抽取并对数据库中的历年财报数据进行信息检索,得到回答问题所需的相关信息;通过编码器将相关信息与问题转为财报大模型可处理的tokens标记;根据问题类别对相关信息进行不同方式的处理,生成用户所提出问题的答案,其中包括对于查找类问题,直接根据返回信息生成答案,对于计算类问题,利用API调用计算器,并结合问题要求生成答案,对于常识类问题,利用API调用搜索引擎,并根据搜索引擎返回的内容生成答案,最后将答案返回给用户;构建数据库,其中包括历年财报数据、财报文件解析结果和对答案的打分结果;利用数据库中的信息通过反馈迭代机制对财报大模型进行迭代优化;利用优化后的财报大模型进行财报自动化问答。

全文数据:

权利要求:

百度查询: 之江实验室 一种基于大模型的财报自动化问答方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。