买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东电网有限责任公司
摘要:本申请提供了一种专利文本分类方法及装置,其中方法包括:获取待分类专利文本,并提取待分类专利文本的专利属性特征;对待分类专利文本进行分词处理和词向量构建处理,得到文本词向量特征;将专利属性特征与文本词向量特征输入到专利文本分类模型,以根据专利文本分类模型的运算,获得待分类专利文本的分类结果;其中,专利文本分类模型为根据预设的训练样本,结合预设的技术分类节点对应的分类信息集合构建的神经网络模型。本申请通过神经网络学习的方式,根据用户的技术体系建立的技术分类节点,并基于由技术分类节点构建的分类信息集合训练出的专利文本分类模型实现对专利文本的分类工作,解决了现有技术对专利文本的分类效率低的技术问题。
主权项:1.一种专利文本分类方法,其特征在于,包括:获取待分类专利文本,并提取所述待分类专利文本的专利属性特征;对所述待分类专利文本进行分词处理和词向量构建处理,得到文本词向量特征;将所述专利属性特征与所述文本词向量特征输入到专利文本分类模型,以根据所述专利文本分类模型的运算,获得所述待分类专利文本的分类结果;其中,所述专利文本分类模型的配置过程具体包括:根据预设的训练样本,分别获得所述训练样本的专利属性特征和文本词向量特征;将所述训练样本的专利属性特征、所述训练样本的文本词向量特征以及预设的技术分类节点对应的分类信息集合输入至初始神经网络模型进行模型训练,训练完成后得到所述专利文本分类模型;所述将所述专利属性特征与所述文本词向量特征输入到专利文本分类模型,以根据所述专利文本分类模型的运算,获得所述待分类专利文本的分类结果具体包括:将所述专利属性特征与所述文本词向量特征输入到专利文本分类模型,通过所述专利文本分类模型的运算,得到所述待分类专利文本与各个所述技术分类节点的匹配度;根据各个所述匹配度的大小,以最大匹配度对应的技术分类节点对所述待分类专利文本进行分类,以获得所述待分类专利文本的分类结果。
全文数据:
权利要求:
百度查询: 广东电网有限责任公司 一种专利文本分类方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。