中国科学院软件研究所韩先培获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院软件研究所申请的专利一种面向文档理解模型的性能评价方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116340465B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310391444.1,技术领域涉及:G06F16/334;该发明授权一种面向文档理解模型的性能评价方法是由韩先培;林鸿宇;徐若曦;管新岩;孙乐设计研发完成,并于2023-04-13向国家知识产权局提交的专利申请。
本一种面向文档理解模型的性能评价方法在说明书摘要公布了:本发明公开了一种面向文档理解模型的性能评价方法,其步骤包括:1构建性能评价基准;2根据基准对文档数据进行处理,得到用于测试不同性能的数据集;3实现以待测试的文档理解模型为主干的文本分类模型,在文档分类数据集上训练并测试,得到模型的文档分类能力值;4实现以文档理解模型为主干的序列标注模型,在文档结构分析数据集上训练并测试,得到模型的文档结构分析能力值;5实现以文档理解模型为主干的问答模型,在文档信息提取数据集上训练并测试,得到模型的文档信息提取能力值;6实现以文档理解模型为主干的生成模型,在文档转写数据集上训练并测试,得到模型的文档转写能力值;7根据上述所得结果获得模型的评估结果。
本发明授权一种面向文档理解模型的性能评价方法在权利要求书中公布了:1.一种面向文档理解模型的性能评价方法,其步骤包括: 1构建面向文档理解模型的性能评价基准,所述性能评价基准包括文档分类能力、文档结构分析能力、文档信息提取能力和文档转写能力; 2收集文档理解任务的文档数据,根据所述性能评价基准对收集的文档数据进行处理,得到用于测试不同性能的数据集;包括文档分类数据集、文档结构分析数据集、文档信息提取数据集和文档转写数据集; 3实现以待测试的文档理解模型为主干的文本分类模型,在所述文档分类数据集上训练并测试所述文本分类模型,根据测试结果得到所述文档理解模型的文档分类能力值; 4实现以待测试的文档理解模型为主干的序列标注模型,在所述文档结构分析数据集上训练并测试所述序列标注模型,根据测试结果得到所述文档理解模型的文档结构分析能力值; 5实现以待测试的文档理解模型为主干的问答模型,在所述文档信息提取数据集上训练并测试所述问答模型,根据测试结果得到所述文档理解模型的文档信息提取能力值; 6实现以待测试的文档理解模型为主干的生成模型,在所述文档转写数据集上训练并测试所述生成模型,根据测试结果得到所述文档理解模型的文档转写能力值; 7根据上述得到的所述文档理解模型的文档分类能力值、文档结构分析能力值、档信息提取能力值和文档转写能力值,获得所述文档理解模型的文档理解性能评估结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院软件研究所,其通讯地址为:100190 北京市海淀区中关村南四街4号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。