申请/专利权人:浙江工业大学
申请日:2024-03-15
公开(公告)日:2024-06-11
公开(公告)号:CN118171734A
主分类号:G06N5/025
分类号:G06N5/025;G06N5/04;G06N5/01;G06F18/2413;G06F18/2431;G06F18/23;G06F18/2137;G06F18/20
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.06.28#实质审查的生效;2024.06.11#公开
摘要:本发明涉及一种基于迭代自组织聚类的招聘单位画像构建方法,首先通过网络爬虫和手工录入方式获取原始数据;随后,对原始数据进行提取、清洗和转化,得到招聘单位画像模型的数据集,确保数据质量和可用性。在此基础上,通过对数据集在不同维度上进行标签划分,形成六个维度的招聘单位画像标签。接着,利用信息熵理论计算各标签维度下的信息熵和特征的权重值。进一步,基于改进的迭代自组织聚类对不同维度下的特征进行迭代自组织聚类。最终,根据形成的标签,得到招聘单位画像标签向量,最终构建可视化的雷达图作为招聘单位的画像。本发明方法优化了招聘单位画像构建过程,提高了数据划分的准确性。
主权项:1.一种基于迭代自组织聚类的招聘单位画像构建方法,其特征在于,包括如下步骤:1通过网络爬虫和手工录入的方式,获取用于招聘单位画像构建的原始数据;2对原始数据进行提取、清洗和转化,获得招聘单位画像模型的数据集;3将步骤2中的数据集在不同维度上进行标签划分;4基于各个标签维度计算信息熵,并根据信息熵计算各个特征的权重值;5基于信息熵理论,采用马氏距离替换欧式距离,对不同维度下的特征所组成的向量进行迭代自组织聚类,形成聚类标签;6根据步骤3以及步骤5得到的标签,构建可视化的雷达图,并作为招聘单位的画像。
全文数据:
权利要求:
百度查询: 浙江工业大学 一种基于迭代自组织聚类的招聘单位画像构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。