首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于DS证据理论的网页多模态信息抽取方法及系统_郑州大学;河南众诚信息科技股份有限公司_202410422480.4 

申请/专利权人:郑州大学;河南众诚信息科技股份有限公司

申请日:2024-04-09

公开(公告)日:2024-06-14

公开(公告)号:CN118193816A

主分类号:G06F16/951

分类号:G06F16/951;G06F16/35;G06F40/279;G06F18/2415;G06F18/25

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:本发明公开了一种基于DS证据理论的网页多模态信息抽取方法,针对目前的多模态信息抽取方法存在解释性较弱的问题,通过基于DS证据理论,对待抽取文档中不同模态特征分别使用不同的方法进行处理并生成不同的证据,然后使用基于证据支持度距离的修正方法对证据进行修正,接着通过计算不同证据之间关系、同一证据内不同分类支持度之间的关系来获取各个证据的权重,最后使用DS理论的融合规则进行证据融合并得出最终决策,以此将关键信息从文档中识别出来。该方法采用基于决策层的融合方式,与数据层融合相比,更具有可解释性;对不同模态信息分别进行处理,从而避免了特征冗余、特征不兼容的问题。

主权项:1.一种基于DS证据理论的网页多模态信息抽取方法,其特征在于,包括:在信息抽取的决策层中,对文本特征进行SentenceBert编码和BiLSTM推理,获得不同标签的分类概率,构成文本特征对应的证据;采用狄利克雷分布建模训练数据集中位置信息与分类标签之间的关系,并利用狄利克雷分布的概率密度函数生成布局特征对应的证据;拼接文本特征证据与布局特征证据,得到合成证据;对合成证据进行修正及权重分配,得到用于决策的证据集合;将证据集合中的证据进行融合,生成最终的决策结果;基于所述决策结果,抽取信息。

全文数据:

权利要求:

百度查询: 郑州大学;河南众诚信息科技股份有限公司 基于DS证据理论的网页多模态信息抽取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。