首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种用手机信令数据识别新市民和本地居民的方法和装置_浙江工业大学;浙大启真未来城市科技(杭州)有限公司_202410415666.7 

申请/专利权人:浙江工业大学;浙大启真未来城市科技(杭州)有限公司

申请日:2024-04-08

公开(公告)日:2024-06-14

公开(公告)号:CN118200859A

主分类号:H04W4/029

分类号:H04W4/029;H04W4/20;G06F16/215;G06F16/2458

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:一种用手机信令数据识别新市民和本地居民的方法,包括如下步骤:步骤1:识别用户年度常住城市标签并获取常住居民数据集;通过用户月度常住标签识别每个用户每年的年度常住标签,按每年常住月份数大于6个月为标准对年度常住城市标签进行识别,提取在当前城市常住的用户数据集,根据历年的数据统计每个用户在当前城市的常住标签计数;步骤2:识别当前城市的本地居民,依据用户的出生城市标签以及前序各年的常住城市标签筛选出生于当前城市的用户以及非本地出生并累计五年以上在当前城市常住的用户,将这些常住用户识别为本地居民;步骤3:识别城市新市民,依据用户的出生城市标签,前序各年的常住城市标签以及年龄标签,分别识别出小于23岁的新市民和大于23岁的新市民。本发明仅需使用现有手机信令数据产品即可完成用户类型的识别,不需要从原始数据开始识别,通过数据分类、分组计数、表连接等简单算法就可以实现,深度挖掘现有数据的价值;用户识别较为精准,考虑到多种不同情况下可能会出现的用户数据特征,通过分类识别有效的提升了识别的精准性。

主权项:1.一种用手机信令数据识别新市民和本地居民的方法,包括如下步骤:步骤1:识别用户年度常住城市标签并获取常住居民数据集;通过用户月度常住标签识别每个用户每年的年度常住标签;按每年常住月份数大于6个月为标准对年度常住城市标签进行识别;提取在当前城市常住的用户数据集;根据历年的数据统计每个用户在当前城市的常住标签计数;步骤11:从用户月度驻留信息表中提取用户信息;从用户月度驻留信息表中提取出用户信息并汇总为一张表,数据集包括用户编号,年份,月份,以及月度常住标签的信息;步骤12:对用户每年的月度常住标签进行统计;根据用户编号、年份以及月度常住标签对用户数据进行分组,对每一分组的月度常住标签进行计数,并将结果存入计数字段,得到用户月度常住标签计数表,包含用户编号、年份、月度常住标签与标签计数4个字段;步骤13:根据用户月度常住标签识别年度常住标签;根据用户各年份的月度常住标签识别该年的年度常住标签;若某一城市的计数大于等于6,则该城市就是该用户该年度的常住城市;若有两个城市都是6,则取该年9月的常住城市作为年度常住城市;若月度常住城市计数均小于等于5则赋空值;整理后得到用户年度常住标签表,数据集包括用户编号、年份以及常住城市标签3个字段;步骤14:提取在当前城市常住的用户数据集并统计其历年数据;根据当前年份的常住城市标签识别当前城市的常住用户,并提取其数据集;常住用户历年数据集中包括用户编号、年龄、出生城市、各年常住城市以及对应年份,共5个字段;对历年数据进行统计,得到历年常住标签统计,数据集中包括用户编号、年龄、出生城市、常住城市、当前标签计数5个字段;步骤15:提取在当前城市常住的用户编号;根据本年度常住城市标签从用户数据集中提取在当前城市常住的用户数据集,包含用户编号与当前常住城市2个字段;步骤16:提取在当前城市常住的用户的历年常住城市标签;根据当前城市常住用户的编号从往年的常住城市数据集中获取前序各年份的常住城市标签,从用户属性表中获取用户的年龄以及出生城市标签;输出的数据集包括用户编号、年龄、出生城市、历年的常住城市以及年份共5个字段;步骤17:按用户对历年常住城市进行计数;对上一步骤输出的数据集中按照用户编号、年龄、出生城市分组,对各用户在当前城市的记录进行计数,结果存入计数字段;输出的数据集包括用户编号、年龄、常住城市、常住城市计数5个字段;步骤2:识别当前城市的本地居民;依据用户的出生城市标签以及前序各年的常住城市标签筛选出生于当前城市的用户以及非本地出生并累计五年以上在当前城市常住的用户,将这些常住用户识别为本地居民;步骤21:筛选出生于当前城市的本地居民;根据出生城市标签,从当前城市常住用户的常住标签统计数据集中识别出生在当前城市的本地居民,提取其用户编号并标注,数据集包含用户编号与用户类型2个字段;步骤22:获取迁居常住用户的数据集;对其余非本地出生的常住用户,判定为迁居常住用户,提取其历年数据集,形成迁居常住用户常住标签统计数据集;步骤23:筛选迁居的本地居民;根据当前城市常住标签计数字段,从迁居常住用户的用户常住标签统计数据集中,筛选出前序累计5年常住于当前城市的用户提取其用户编号并标注,数据集包含用户编号与用户类型2个字段;步骤24:合并本地市民数据集;合并步骤21中所识别的本地出生的本地居民用户编号数据集和步骤23中识别的迁居的本地市民用户编号数据集,得到本地居民的用户编号数据集;步骤3:识别城市新市民;依据用户的出生城市标签,前序各年的常住城市标签以及年龄标签,分别识别出小于23岁的新市民和大于23岁的新市民;步骤31:识别年龄小于23岁的新市民;根据用户的年龄标签,从迁居常住用户常住标签统计数据集中筛选年龄小于23岁的用户,提取其用户编号并标注,数据集包含用户编号与用户类型2个字段;步骤32:识别年龄大于23岁的迁居常住用户;从迁居常住用户常住标签统计数据集中筛选年龄大于23岁的用户,提取其用户编号与城市常住用户历年数据集进行连接,得到对应用户的历年数据集,包括用户编号、年龄、常住城市、常住城市计数5个字段;步骤33:筛选有两年以上记录且用户年龄大于23岁的迁居常住用户;基于大于23岁的迁居常住用户的历年数据集,对每个用户的年度常住标签进行计数,筛选有效非空年度常住标签数量在2个及以上的用户,提取其用户编号并与城市常住用户历年数据集进行连接,得到有两年以上记录且用户年龄大于23岁的迁居常住用户的历年数据集,包括用户编号、年龄、常住城市、常住城市计数5个字段;步骤34:识别年龄大于23岁的新市民;基于有两年以上记录且用户年龄大于23岁的迁居常住用户的历年数据集对每个用户的年度常住标签进行排序,筛选出每个用户最早的年度常住城市标签,筛选出首个常住城市标签不在当前城市且年龄大于23岁并有两年以上记录的迁居常住用户,提取其用户编号并标注,数据集包括用户编号、年龄、常住城市、常住城市计数5个字段;步骤35:合并新市民数据集;合并步骤31中筛选出的小于23岁的新市民用户编号数据集与步骤34中筛选出的大于等于23岁的新市民用户编号数据集,得到新市民的用户编号数据集,数据集包含用户编号与用户类型2个字段;步骤36:合并用户识别数据集;将步骤11中的当前城市常住居民数据集与步骤24标注的本地居民数据以及步骤35中标注的新市民数据进行连接,并标注未识别的用户,得到用户识别数据集;数据集包含用户编号,常住城市与用户类型3个字段。

全文数据:

权利要求:

百度查询: 浙江工业大学;浙大启真未来城市科技(杭州)有限公司 一种用手机信令数据识别新市民和本地居民的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。