首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

企业的产业链节点确定方法、装置、终端及存储介质 

申请/专利权人:上海帜讯信息技术股份有限公司

申请日:2021-11-25

公开(公告)日:2024-06-28

公开(公告)号:CN114154829B

主分类号:G06Q10/0637

分类号:G06Q10/0637;G06F18/23213;G06N3/04;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2022.03.25#实质审查的生效;2022.03.08#公开

摘要:本申请公开了一种企业的产业链节点确定方法、装置、终端及存储介质。方法包括:利用实体识别算法对企业信息进行识别处理,确定企业实体信息;利用聚类算法对企业实体信息进行聚类,确定企业核心实体信息;基于企业核心实体信息、产业链信息和相似度算法,确定企业对应的至少一个产业链节点。本发明将多维度的企业信息依次进行识别和聚类,可有效去除噪音实体,并提高了对企业信息的处理效率,最后通过相似度算法对得到的企业核心实体信息进行产业链节点的分类,不仅提高了分类的准确度,还极大的优化了分类结果的解释性。

主权项:1.一种企业的产业链节点确定方法,其特征在于,包括:利用实体识别算法对企业信息进行识别处理,确定企业实体信息,包括:对所述企业信息进行文本预处理,得到预处理后的企业信息;在所述预处理后的企业信息选取训练样本,并采用所述训练样本对初始深度神经网络模型进行训练,得到目标深度神经网络模型;在所述预处理后的企业信息中选取预测样本,并将所述预测样本输入至所述目标深度神经网络模型中,输出所述企业实体信息;利用聚类算法对所述企业实体信息进行聚类,确定企业核心实体信息;基于所述企业核心实体信息、产业链信息和相似度算法,确定企业对应的至少一个产业链节点;所述产业链信息包括产业链定义信息、产业链节点及关系信息和产业链节点关键词信息;其中,产业链定义信息包含价值链、企业链、供需链和空间链4个维度的信息;产业链节点及关系信息包括上位关系、下位关系和平行关系;其中,所述目标深度神经网络模型通过最小化标签训练误差来调优获得;利用实体识别算法对企业信息进行识别处理,包括:文本分段分句,通过人工标注的方式对分句后的文本进行实体标注,为模型的训练提供样本;利用Bert词向量和预训练语言模型将文本进行编码,然后输入构造完成的神经网络模型进行训练,以最小化标签训练误差来调优模型,得到目标深度神经网络模型;利用CRF或者全连接层对标签进行预测;根据预测的标签还原每句话中的实体,提取企业核心实体信息;所述提取企业核心实体信息,包括:统计聚类结果中的每个类簇的实体数目,得到多个实体数目;将多个实体数目按照从大到小的顺序进行排列,得到排列结果;在排列结果中选取前预设数量的实体数目作为核心实体簇,并将核心实体簇中的实体作为企业核心实体信息;基于所述企业核心实体信息、产业链信息和相似度算法,确定企业对应的至少一个产业链节点,包括;利用词向量数据库分别计算企业核心实体信息对应的第一文本向量和产业链信息对应的第二文本向量,再将第一文本向量作为企业核心实体信息向量,以及将第二文本向量作为产业链信息向量;计算企业核心实体信息向量和产业链信息向量之间的余弦距离,得到余弦距离值,再基于余弦距离值,确定企业核心实体信息向量和产业链信息向量的相似度,若相似度大于预设相似度,将企业核心实体信息向量与产业链信息向量进行关联,以得到企业对应的至少一个产业链节点。

全文数据:

权利要求:

百度查询: 上海帜讯信息技术股份有限公司 企业的产业链节点确定方法、装置、终端及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。