首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种标准术语结构化处理方法_江苏省质量和标准化研究院_202410527490.4 

申请/专利权人:江苏省质量和标准化研究院

申请日:2024-04-29

公开(公告)日:2024-05-31

公开(公告)号:CN118114631A

主分类号:G06F40/166

分类号:G06F40/166;G06F16/13;G06F16/16;G06F16/31;G06F16/36;G06F16/22;G06F40/205;G06F40/247;G06F16/33

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.18#实质审查的生效;2024.05.31#公开

摘要:本发明公开了一种标准术语结构化处理方法,属于自然语言处理技术领域,包括标准预处理、将标准矢量文本建立索引、提取标准共性结构要素信息、维护标准元素存储器、提取术语信息和构建标准术语结构化数据库,解决了文档中术语信息提取、标准化处理和高效存储查询的技术问题,促进标准化术语管理和信息交流的准确性与效率,实现了标准文档处理数字化,达到术语信息溯源的效果,同时,规则引擎的应用,确保术语标准化处理的一致性,提高了完成标准术语自动化的精准度;通过构建标准化的基础术语库,解决难以从海量标准文档中精准查询用户感兴趣的术语问题,促进知识的积累和创新,为更进一步的术语智能分析和数据挖掘提供数据基础。

主权项:1.一种标准术语结构化处理方法,其特征在于:包括如下步骤:步骤1:对标准资源进行预处理,得到矢量文档,具体包括如下步骤:步骤A1:使用扫描仪将纸质文档转换为电子文档,扫描仪通过数据线将电子文档发送给客户端;步骤A2:客户端利用光学字符识别技术识别电子文档中的文本内容,并转换成可编辑的文本文件;步骤A3:客户端根据文本文件生成可编辑的矢量文档;步骤2:客户端构建标准全文存储器,客户端对标准矢量文本建立索引,并存储到标准全文存储器中,将标准全文存储器中的标准矢量文本视为标准资源;步骤3:客户端从标准资源中提取标准共性结构要素,包括封面、前言、范围、规范性引用文件、术语和核心技术要素;步骤4:客户端构建标准元素存储器,将提取的标准共性结构要素存入标准元素存储器,并建立标准共性结构要素与索引之间的关联关系;步骤5:客户端建立术语提取模块和标准术语存储器,术语提取模块调取标准元素存储器,从其中的标准共性结构要素中提取术语信息,并将术语信息存储至标准术语存储器中;步骤6:客户端构建标准术语结构化数据库,具体包括如下步骤:步骤B1:选择Drools规则引擎工具,编写术语标准化规则;步骤B2:将标准术语存储器中的数据导入Drools,根据术语标准化规则进行标准化处理;步骤B3:将步骤B2得到的数据存储至标准术语结构化数据库中。

全文数据:

权利要求:

百度查询: 江苏省质量和标准化研究院 一种标准术语结构化处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。