【发明公布】一种基于半监督学习的企业数字化术语库构建方法及系统_武汉大学_202311666252.3

导航：龙图腾网> 最新专利技术> 一种基于半监督学习的企业数字化术语库构建方法及系统_武汉大学_202311666252.3

申请/专利权人：武汉大学

申请日：2023-12-05

公开（公告）日：2024-06-14

公开（公告）号：CN118194867A

主分类号：G06F40/295

分类号：G06F40/295;G06F40/284;G06N3/0895;G06F40/289

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明提供一种基于半监督学习的企业数字化术语库构建方法及系统，包括：S1：收集企业的年报文本数据；S2：使用ERNIE对年报文本进行表征向量化；S3：使用GlobalPointer模型对年报文本进行特征提取和术语识别，以最终的输出概率作为术语边界及其类型识别依据；S4：对模型的性能进行评价，若满足退出条件，则得出最终术语识别模型，否则进行S5；S5：使用模型在未标注数据集上进行术语识别，并对所有样本以输出概率进行排序；S6：取排名最高的前N个样本及前N个样本对应的识别结果扩充有标签数据集，修正模型，返回S2，直到满足S4中最终退出条件，得到最终数字化术语抽取模型。本发明将深度学习和半监督学习技术与领域问题相结合，提高了数字化术语识别的效率，增强了数字化术语词典的可拓展性。

主权项：1.一种基于半监督学习的企业数字化术语库构建方法，其特征在于，包括：步骤S1，收集企业的年报文本数据；步骤S2，基于信息实体增强语言表示ERNIE模型对所述年报文本数据进行表征，获得年报文本向量序列；步骤S3，采用命名实体识别任务GlobalPointer模型对所述年报文本向量序列进行特征提取，确定初始术语识别模型的最终输出概率，所述最终输出概率用于识别术语边界及术语类型；步骤S4，依据预设衡量指标对所述初始术语识别模型进行评价，若满足预设训练结束条件，则输出最终术语识别模型，否则进入步骤S5；步骤S5，基于所述初始术语识别模型对未标注数据集进行术语识别，根据排序算法对所有样本以输出概率进行排序，得到排序后年报文本样本数据；步骤S6，利用所述排序后排名最高的前N个样本及所述前N个样本对应的识别结果扩充有标签数据集，由所述有标签数据集得到最终术语识别模型，基于所述最终术语识别模型输出所述企业数字化术语库。

全文数据：

权利要求：

百度查询：武汉大学一种基于半监督学习的企业数字化术语库构建方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电解槽下料器和电解槽下料系统_云南云铝涌鑫铝业有限公司_202211606255.3

下一篇：由独立组分生产的果仁酱仿品_航行食品股份有限公司_202280059657.8

相关技术

电解槽下料器和电解槽下料系统_云南云铝涌鑫铝业有限公司_202211606255.3

由独立组分生产的果仁酱仿品_航行食品股份有限公司_202280059657.8

一种自润滑长寿命硬质合金串珠及其制备方法和应用_郑州机械研究所有限公司_202311466192.0

一种基于遥测信号辅助的干涉测量带宽综合方法_北京航天飞行控制中心_202410175613.2

一种裁床警示镜自动装配机_广东元一科技实业有限公司_202211629661.1

针对根据亮度预测色度的预测选择下采样滤波器_腾讯美国有限责任公司_202280075374.2

催化剂质子膜涂层及其制备方法、以及膜电极、燃料电池_武汉氢能与燃料电池产业技术研究院有限公司_202410642734.3

一种机房巡检机器人控制方法及系统_广州申迪智能科技有限公司_202311823017.2

基于多模块组合的应用程序越权漏洞检测方法及系统_深圳开源互联网安全技术有限公司_202410023783.9

一种高定向度W波段单定向耦合器_苏州伏波电子科技有限公司_202211653060.4

一种油溶性石墨烯的制备方法_重庆烯达科技有限公司_202410279749.8

一种集成传感器的封装结构和封装方法_合肥中航天成电子科技有限公司_202410654911.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于半监督学习的企业数字化术语库构建方法及系统_武汉大学_202311666252.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务