恭喜北京科杰科技有限公司高经郡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京科杰科技有限公司申请的专利非结构化文本数据的计算方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474383B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510076252.0,技术领域涉及:G06F16/35;该发明授权非结构化文本数据的计算方法及系统是由高经郡;高海玲;高松设计研发完成,并于2025-01-17向国家知识产权局提交的专利申请。
本非结构化文本数据的计算方法及系统在说明书摘要公布了:本发明提供非结构化文本数据的计算方法及系统,涉及自然语言处理技术领域,包括对输入的非结构化文本数据进行多层级处理,根据词频分布动态调整分词粒度,并结合上下文语义信息构建词性共现矩阵,提取实体信息,融合词性共现矩阵和实体信息生成层次化语义标签序列。采用不同卷积核尺寸的特征提取单元提取特征表示,并计算不同语义层次间余弦相似度建立关联权重矩阵。基于实体信息构建语义增强向量,并进行对抗训练,得到多模态语义特征矩阵。计算融合特征向量间的语义相似度进行聚类,并根据类簇的复杂度、一致性和模糊度设定难度权重排序后输入分类器,迭代优化分类结果,得到计算结果。
本发明授权非结构化文本数据的计算方法及系统在权利要求书中公布了:1.非结构化文本数据的计算方法,其特征在于,包括:对输入的非结构化文本数据进行多层级处理,根据词频分布动态调整分词粒度,结合上下文语义信息构建词性共现矩阵进行词性标注,从文本数据中识别并提取实体信息,融合所述词性共现矩阵和所述实体信息生成层次化语义标签序列,并对所述层次化语义标签序列进行大小写统一和特殊字符替换;采用不同卷积核尺寸的特征提取单元对所述层次化语义标签序列进行特征提取得到特征表示,通过计算所述特征表示中不同语义层次间的余弦相似度建立关联权重矩阵,基于所述实体信息的类别属性和层级关系构建语义增强向量,在所述特征表示中插入预设比例的随机噪声生成对抗样本进行对抗训练,将训练后的特征表示、关联权重矩阵和语义增强向量在特征维度上串联组合得到多模态语义特征矩阵;计算所述多模态语义特征矩阵中相邻的融合特征向量的语义相似度得到相似度矩阵,基于所述相似度矩阵对融合特征向量进行聚类得到特征类簇,根据所述特征类簇的结构复杂度、语义一致性和边界模糊度设定难度权重,将所述特征类簇按照难度权重排序后依次输入分类器,对每个特征类簇计算类别概率分布和类簇中心距离;采用类簇内样本对的对比损失构建优化目标,基于所述优化目标对分类器的预测结果进行迭代优化,得到非结构化文本数据的计算结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科杰科技有限公司,其通讯地址为:100096 北京市海淀区东升科技园北街6号院10号楼11层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。