首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于文档视觉问答的系统、方法、存储介质及计算机产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国建设银行股份有限公司;建信金融科技有限责任公司

摘要:本发明实施例提供一种用于文档视觉问答的系统、方法、存储介质及计算机产品。该系统包括:编码器被配置为:提取问题的特征信息和多页文档中每页文档的文档信息,包括全局图像特征、文本语义信息及文本位置信息;将问题编码信息和多页文档的编码信息进行拼接。解码器被配置为:对问题编码信息和多页文档的编码信息进行解码,得到对应的问题解码信息和多页文档的解码信息,以将问题解码信息和多页文档的解码信息输入预设的文档视觉问答模型,得到问题的答案。将多模态信息抽取与大模型GPT技术结合,充分利用每页文档的全局图像特征、文本语义信息及文本位置信息;再通过GPT解码器,将上述信息送入大型文档视觉问答模型中,以实现多页文档视觉问答。

主权项:1.一种用于文档视觉问答的系统,其特征在于,所述用于文档视觉问答的系统包括:编码器,所述编码器被配置为:提取问题的特征信息和多页文档中每页文档的文档信息,所述文档信息包括全局图像特征、文本语义信息及文本位置信息;对所述问题的特征信息进行编码,得到问题编码信息;对所述每页文档的文档信息进行编码,得到所述每页文档的编码信息;以及将所述每页文档的编码信息进行拼接,得到所述多页文档的编码信息,并将所述问题编码信息和所述多页文档的编码信息进行拼接;以及解码器,所述解码器被配置为:获取拼接后的所述问题编码信息和所述多页文档的编码信息;以及对所述问题编码信息和所述多页文档的编码信息进行解码,得到对应的问题解码信息和所述多页文档的解码信息,以将所述问题解码信息和所述多页文档的解码信息输入预设的文档视觉问答模型,得到所述问题的答案。

全文数据:

权利要求:

百度查询: 中国建设银行股份有限公司 建信金融科技有限责任公司 用于文档视觉问答的系统、方法、存储介质及计算机产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术