首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种针对政府服务热线领域的工单自动分类方法_上海德拓信息技术股份有限公司_202011563677.8 

申请/专利权人:上海德拓信息技术股份有限公司

申请日:2020-12-25

公开(公告)日:2024-05-03

公开(公告)号:CN112632965B

主分类号:G06F40/216

分类号:G06F40/216;G06F40/242;G06F40/284;G06F16/35;G06N20/00;G06Q50/26

优先权:

专利状态码:有效-授权

法律状态:2024.05.03#授权;2021.04.27#实质审查的生效;2021.04.09#公开

摘要:本发明公开了一种针对政府服务热线领域的工单自动分类方法,包括以下步骤:步骤1:数据清洗和预处理;步骤2:计算历史全量工单;步骤3:训练词向量模型;步骤4:对热频词进行聚类;步骤5:干预聚类结果;步骤6:工单打标签分类;步骤7:模型增量训练。利用本发明提出的工单自动分类方法,会根据工单的内容,对每条工单打上多个标签。同时,还可以根据所打上的标签,对工单进行分类。一方面,可以帮助政府工作人员,了解某段时间或某个地区的市民关注热点。另一方面,在得到每条工单的分类标签后,还可以在此基础上进行更深入的数据挖掘。

主权项:1.一种针对政府服务热线领域的工单自动分类方法,其特征在于:具体分类方法包括以下步骤:步骤1:数据清洗和预处理,对政府服务热线领域的工单反映的内容,进行数据清洗和预处理;步骤2:计算历史全量工单热频词;使用TFIDF计算热频词;步骤3:训练词向量模型,使用Word2vec对全量工单进行训练,得到词向量模型;步骤4:对热频词进行聚类,根据热频词和其相应的词向量进行聚类;步骤5:干预聚类结果,工作人员对算法得到的聚类结果进行调整,得到用来给工单进行打标签和分类的近似词分类字典表;步骤6:工单打标签和分类,利用所述步骤5得到的近似词分类字典表,根据工单反映的内容进行映射,给工单打标签和分类;步骤7:模型增量训练,对增量数据,增量训练模型,并以增量的方式将新增的热频词添加到近似词分类字典表中;所述步骤6是利用步骤5得到的近似词分类字典表,对工单进行打标签分类,其详细步骤如下:步骤6.1:设置每条工单最多打标签个数labelnum;步骤6.2:对待打标签的工单,对工单反映内容利用结巴分词进行分词;步骤6.3:初始化每条工单在近似词分类字典表中各个类的得分为0;将每条工单分词后的每个词,与近似词分类字典表中各个类的热频词进行匹配;匹配成功因此加上匹配上的热频词的得分;匹配结束计算出每条工单在近似词分类字典表各个类中的得分;对每条工单,取得分较高的前labelnum个类的类别名称做为该工单的标签;并按照类的得分,将标签名称从高到低排序给出;工单中没有匹配到任一个类,则标为“其他”;步骤6.4:根据每条工单打上的标签,对工单进行分类,根据工单打标签的结果,设定前TopN个标签对工单进行分类。

全文数据:

权利要求:

百度查询: 上海德拓信息技术股份有限公司 一种针对政府服务热线领域的工单自动分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术