Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜有米科技股份有限公司黄于晏获国家专利权

恭喜有米科技股份有限公司黄于晏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜有米科技股份有限公司申请的专利应用于文本分类的词名单生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115238681B

龙图腾网通过国家知识产权局官网在2025-05-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210741184.1,技术领域涉及:G06F40/284;该发明授权应用于文本分类的词名单生成方法及装置是由黄于晏;杨辰设计研发完成,并于2022-06-28向国家知识产权局提交的专利申请。

应用于文本分类的词名单生成方法及装置在说明书摘要公布了:本发明公开了一种应用于文本分类的词名单生成方法及装置,该方法包括:将样本文本输入至训练好的文本分析向量模型中进行分析,得到样本文本中每个样本句的句向量;基于所有样本句的句向量,对所有样本句执行聚类操作,得到至少一个类簇下的样本句集;对每个类簇下的样本句集执行分词操作,得到每个类簇下的词名单。可见,实施本发明能够通过对样本文本的样本句进行聚类及分词,得到应用于文本分类的词名单,丰富了文本分类系统的智能化确定文本类别方式,有利于提高所确定出的文本类别之间的互斥性,使得文本类别之间的类别特性更加明确,进而有利于提高对待分析文本的分类可靠性以及分类准确性,从而有利于精准地对待分析文本分门别类。

本发明授权应用于文本分类的词名单生成方法及装置在权利要求书中公布了:1.一种应用于文本分类的词名单生成方法,其特征在于,所述方法包括:将样本文本输入至预先训练出的文本分析向量模型中进行分析,得到所述样本文本中每个样本句的句向量;基于所有所述样本句的句向量,对所有所述样本句执行聚类操作,得到至少一个目标类簇下的样本句集;每个所述目标类簇下的样本句集包括至少一个所述样本句;对每个所述目标类簇下的样本句集执行分词操作,得到每个所述目标类簇下的词名单;所述词名单用于确定待确定类簇文本中每个句子所属的类簇;其中,所述对每个所述目标类簇下的样本句集执行分词操作,得到每个所述目标类簇下的词名单,包括:通过预设的分词器,对每个所述目标类簇下的样本句集执行分词操作,得到每个所述目标类簇下的词表;每个所述目标类簇下的词表包括多个词;对于每个所述目标类簇下的词表,确定该目标类簇与所有其他目标类簇之间的词表差集,并将该目标类簇与所有所述其他目标类簇之间的词表差集确定为该目标类簇下的第一词表;从该目标类簇下的词表中去除该目标类簇下的第一词表,得到该目标类簇下的第二词表,并判断该目标类簇下的第二词表所包含的所有所述词的词数量是否大于等于预设词数量阈值,若否,则将该目标类簇下的第一词表确定为该目标类簇下的词名单。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人有米科技股份有限公司,其通讯地址为:510006 广东省广州市番禺区小谷围街青蓝街26号1701;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。