恭喜国泰新点软件股份有限公司毛锴楠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜国泰新点软件股份有限公司申请的专利一种原文拆解和标签识别方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119025963B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411110591.8,技术领域涉及:G06F18/24;该发明授权一种原文拆解和标签识别方法、系统、设备及存储介质是由毛锴楠;袁勋;陈虎兵;姜智明;王福梅;王能设计研发完成,并于2024-08-13向国家知识产权局提交的专利申请。
本一种原文拆解和标签识别方法、系统、设备及存储介质在说明书摘要公布了:本发明一种原文拆解和标签识别方法、系统、设备及存储介质。原文拆解和标签识别方法包括:将原文件输入到预先训练好的预训练模型中,获得文本标签向量;将文本向量输入到预先训练好的管道模型中,分别获得多个类别的标签、实体BIO序列和每个标签中的逻辑关系,管道模型包括多标签分类模型、实体识别模型和多类别分类模型;通过规则模型对多个类别的标签、实体BIO序列和每个标签中的逻辑关系进行关键词识别和单位识别,获得识别结果。本发明通过三种模型组成管道模型,每一个模型的输出都是下一模型的输入,减少单独训练每个任务模型的成本,再通过管道模型中每个模型输出的结果对原文件中每个标签的单位进行识别,提高了识别原文件的范围和准确率。
本发明授权一种原文拆解和标签识别方法、系统、设备及存储介质在权利要求书中公布了:1.一种原文拆解和标签识别方法,其特征在于,包括:将文件输入到预先训练好的预训练模型中,获得文本标签向量;将所述文本标签向量输入到预先训练好的管道模型中,分别获得多个类别的标签、实体BIO序列和每个标签中的逻辑关系,所述管道模型包括多标签分类模型、实体识别模型和多类别分类模型;通过规则模型对所述多个类别的标签、所述实体BIO序列和所述每个标签中的逻辑关系进行关键词识别和单位识别,获得识别结果;所述管道模型的训练,包括:将所述文本标签向量输入到所述多标签分类模型中通过sigmod函数选取大于设定阈值的所述文本标签向量,并输出多个类别的标签;将所述多个类别的标签与所述文本标签向量拼接后输入到所述实体识别模型中,输出每个标签的实体BIO序列;通过所述多个类别的标签、所述每个标签的实体BIO序列和所述文本标签向量输入到所述多类别分类模型中,输出每个标签中的逻辑关系。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国泰新点软件股份有限公司,其通讯地址为:215699 江苏省苏州市张家港经济开发区(杨舍镇长兴路);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。