首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】民生问题高发地的识别方法、装置及电子设备_彭涛_202010841732.9 

申请/专利权人:彭涛

申请日:2020-08-20

公开(公告)日:2024-05-10

公开(公告)号:CN112131382B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/279;G06F18/23213;G06Q50/26

优先权:

专利状态码:有效-授权

法律状态:2024.05.10#授权;2021.01.12#实质审查的生效;2020.12.25#公开

摘要:本公开提供了民生问题高发地的识别方法、装置及电子设备。该方法的一具体实施方式包括:获取历史民生热线文本集;提取历史民生热线文本集中每个历史民生热线文本的特征向量并生成特征向量集;基于预设的聚类算法对特征向量集进行聚类处理,得到至少一个聚类簇;确定每个聚类簇的聚类中心;根据各聚类簇的聚类中心对应的地址,确定与历史民生热线文本集对应的民生问题高发地址集。该实施方式能够自动识别民生问题高发地,无需人工干预,减少了人力成本和时间成本。

主权项:1.一种民生问题高发地的识别方法,包括:获取历史民生热线文本集;提取所述历史民生热线文本集中每个历史民生热线文本的特征向量并生成特征向量集,其中,所述特征向量包括表示地址的分量、表示来电时间的分量和表示民生问题类别的分量;所述特征向量是历史民生热线文本的属性量化值的集合,所述特征向量的分量对应于所述历史民生热线文本的属性,所述属性包括所述历史民生热线文本对应的来电时间、民生事件的发生时间、来电地址、民生事件的发生地址、民生事件的涉及人数民生问题类别;基于预设的聚类算法对所述特征向量集进行聚类处理,得到至少一个聚类簇,其中,每个所述聚类簇包括至少一个所述特征向量;确定每个所述聚类簇的聚类中心,其中,每个所述聚类簇的聚类中心是该聚类簇中与该聚类簇中其他全部特征向量的距离之和最小的特征向量;根据各所述聚类簇的聚类中心对应的地址,确定与所述历史民生热线文本集对应的民生问题高发地址集;在所述确定与所述历史民生热线文本集对应的民生问题高发地址集之前,所述方法还包括:对于通过所述聚类处理得到的每个聚类簇,对该聚类簇执行以下分布密度检测步骤,以确定所述民生问题高发地址集中的元素:基于该聚类簇中各所述特征向量对应的地址,确定该聚类簇对应的地址分布密度,其中,所述地址分布密度用于表示该聚类簇对应的各地址在地理分布中的聚集程度;响应于确定该聚类簇对应的地址分布密度大于预设密度阈值,将该聚类簇的聚类中心对应的地址确定为所述民生问题高发地址集中的元素;所述提取所述历史民生热线文本集中每个历史民生热线文本的特征向量并生成特征向量集,包括:对于所述民生热线文本集中每个历史民生热线文本,根据该历史民生热线文本对应的结构化数据,确定该历史民生热线文本对应的特征向量的相应分量;和或对该历史民生热线文本进行信息提取,确定该历史民生热线文本对应的特征向量的相应分量;所述结构化数据是通过接线人员基于通话内容对民生事件的发生地址、民生事件的涉及人数、民生问题类别信息进行人工标注得到的,或者,是通过民生热线记录服务器对民生热线的来电时间、来电地址信息进行自动记录得到的;所述聚类算法为kmeans算法;以及所述基于预设的聚类算法对所述特征向量集进行聚类处理,得到至少一个聚类簇,包括:将所述特征向量集中预设数目的特征向量确定为初始点;以各所述初始点作为中心点,执行以下聚类步骤:根据各所述中心点与所述特征向量集中各所述特征向量的距离,确定所述特征向量集中各所述特征向量对应的中心点;根据各所述中心点对应的全部所述特征向量,生成各所述中心点对应的归属簇;根据各所述归属簇中全部或部分特征向量的平均值,确定各所述归属簇的新的中心点;重复所述聚类步骤直至达到预设停止条件,其中,所述预设停止条件包括以下至少一种:各所述归属簇的中心点在所述聚类步骤前后不发生变化,所述聚类步骤的重复次数大于预设次数;将当前的各所述归属簇确定为各所述聚类簇。

全文数据:

权利要求:

百度查询: 彭涛 民生问题高发地的识别方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。