首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】参保单位识别方法及相关产品_平安医疗健康管理股份有限公司_201811282846.3 

申请/专利权人:平安医疗健康管理股份有限公司

申请日:2018-10-30

公开(公告)日:2024-06-18

公开(公告)号:CN109493242B

主分类号:G06Q40/08

分类号:G06Q40/08;G06F16/245

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2020.11.17#实质审查的生效;2019.03.19#公开

摘要:本申请实施例公开了一种参保单位识别方法及相关产品,其中方法包括:从预设数据库中获取目标参保单位的目标基本信息集;根据所述目标基本信息集确定与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集;将所述目标特征信息集输入预先建立的识别模型以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。采用本申请,可提高参保单位识别效率和准确率。

主权项:1.一种参保单位识别方法,其特征在于,包括:从预设数据库中获取目标参保单位的目标基本信息集,所述目标基本信息集包括以下至少一项:参保人数、就诊人数、参保成员的年龄集、就诊机构集、诊断信息集、开药信息集;根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集,所述多个预设特征维度包括开取药品与诊断信息之间的关联关系、就诊比例、参保成员对应的群体、就诊机构分布、就诊时间分布,所述就诊比例为所述目标参保单位各个年龄段中就诊人数与参保人数之间的比值,所述参保成员对应的群体包括以年龄段、学校、学历、职业中至少一项分类得到的群体,所述就诊机构分布包括各个就诊机构的就诊人数之比、集中开药地点、异常机构分布,就诊时间分布包括集中开药时段、异常就诊时间,所述开取药品与诊断信息之间的关联关系包括合理关系和异常关系;所述目标特征信息集包括目标基本信息集中与各个预设特征维度之间对应的目标特征信息,所述目标特征信息集包括多个目标特征信息,每一目标特征信息对应一个预设特征维度;将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位;其中,若所述预设特征维度包括开取药品与诊断信息之间的关联关系,所述根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集,包括:确定所述就诊机构集中每一就诊机构的就诊人数和所述目标参保单位的参保人数之间的比值,以得到多个目标比值;根据所述多个目标比值确定所述就诊机构集中的集中就诊机构;确定所述诊断信息集中与所述集中就诊机构对应的多个目标诊断信息;确定所述开药信息集中与所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息;确定所述多个目标诊断信息中每一目标诊断信息对应的就诊对象的指定就诊机构以得到多个指定就诊机构;确定所述集中就诊机构和所述多个指定就诊机构中每一指定就诊机构之间的距离以得到多个距离;根据所述多个距离确定所述集中就诊机构的第一合理值;根据所述多个目标开药信息和所述多个目标诊断信息确定开取的异常药品;确定所述异常药品的数量或金额;根据所述数量或所述金额确定所述集中就诊机构的第二合理值;根据所述第一合理值和所述第二合理值确定所述开取药品与诊断信息之间的关联关系。

全文数据:参保单位识别方法及相关产品技术领域本申请涉及数据处理技术领域,主要涉及了一种参保单位识别方法及相关产品。背景技术随着社会经济的发展,国家为了给老百姓提供更好的医保环境,医保政策越来越好。然而,总有一些人通过各种各样的手段来骗取医保。当前的医疗保险,行业整体业务经营与管理比较粗放,缺乏风险把控;粗放的理赔服务和条款赔付,缺乏对疾病治疗的深度分析、医疗费用的风险把控、医疗服务的合理性判断,导致大量欺诈、不合理医疗,严重损害了其他真正需要医保救治人的权益,给危害了国家医疗保险制度,如何避免骗取医保基金,提高医保基金的风控是本领域技术人员待解决的技术问题。发明内容本申请实施例提供了一种参保单位识别方法及相关产品,可提高识别可疑参保单位的准确率。第一方面,本申请实施例提供一种参保单位识别方法,其中:从预设数据库中获取目标参保单位的目标基本信息集;根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集;将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。第二方面,本申请实施例提供一种参保单位识别装置,其中:获取单元,用于从预设数据库中获取目标参保单位的目标基本信息集;确定单元,用于根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集;识别单元,用于将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;所述确定单元,还用于当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。实施本申请实施例,将具有如下有益效果:采用了上述的参保单位识别方法及相关产品之后,从预设数据库中获取目标参保单位的目标基本信息,根据该目标基本信息确定与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,将该目标特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。如此,根据一个预先建立的识别模型和目标参保单位的特征信息对该目标参保单位进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:图1为本申请实施例提供的一种参保单位识别方法的流程示意图;图2为本申请实施例提供的一种参保单位识别装置的结构示意图;图3为本申请实施例提供的一种电子设备的结构示意图。具体实施方式为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。下面对本申请实施例进行详细介绍。参保单位是指报告期内己在统筹范围内办理了社会保险登记手续的各类单位。即使是非独立法人单位,如分支机构和办事处,也是可以办理社保登记开户的。实际办理中需要上级授权委托书。然而,总有一些参保单位通过各种各样的手段来骗取医保。基于此,本申请实施例提供了一种参保单位识别方法装置及相关产品,可提高识别可疑参保单位的准确率。请参照图1,本申请实施例提供一种参保单位识别方法的流程示意图。该参保单位识别方法应用于电子设备。本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备userequipment,UE,移动台mobilestation,MS,终端设备terminaldevice等等。为方便描述,上面提到的设备统称为电子设备。具体的,如图1所示,一种参保单位识别方法,应用于电子设备,其中:S101:从预设数据库中获取目标参保单位的目标基本信息集。在本申请实施例中,参保单位的基本信息集包括但不限于以下一项:参保人数、就诊人数、参保成员的年龄集、就诊机构集、诊断信息集、开药信息集。目标参保单位为待识别是否为骗保单位的医保单位,目标基本信息集为目标参保单位对应的基本信息集。预设数据库可以预先存储于电子设备中,或者,存储在云端服务器中,电子设备通过访问云端服务器获取该预设数据库。该预设数据库可根据医保服务平台对应的存储数据得到,也可根据可访问医保服务平台的第三方应用所登录的参保成员的数据得到,可包括所有的参保单位,也可包括参保时长超过一个指定时长的参保单位,还可包括参考单位类型与目标参保单位一致的参保单位,在此不做限定。该预设数据库中以参保单位的标识信息对该参保单位的存储信息进行存储,该标识信息可以是单位代码、工商备注号码等,参保成员对应的标识信息可以是姓名、身份证号、社保账号、联系电话等。该存储信息可包括基本信息集和骗保结果,还可包括报销记录、缴费记录等,在此不做限定。本申请对于获取预设数据库的方法不做限定,在一种实现方式中,所述方法还包括:确定所述目标参保单位的参保地区;确定所述参保地区对应的目标数据库,所述目标数据库包括多个第一参保单位;获取所述多个第一参保单位中每一参保单位的参保参数以得到多个参保参数;从所述多个第一参保单位中选取参保参数满足预设条件的参保单位以得到多个第二参保单位;根据所述多个第二参保单位中每一参保单位对应的存储信息以得到所述预设数据库。其中,参保地区为目标参保单位注册的地区;参保参数包括但不限于以下一项:参保时长、参保人数、参保单位类型。对于预设条件不做限定,可以是参保时长大于指定时长,其中,指定时长可以为一年、2年等较长的时间;也可以是参保人数大于指定人数,其中,指定人数可以改参保地区对应的参保总人数的万分之一;也可以是与目标参保单位的参保单位类型一致的单位等等。在一种实现方式中,所述多个第一参保单位包括参考参保单位,所述方法还包括:当所述参保参保单位的参保时长大于指定时长,且参保人数大于指定人数,以及参保单位类型与所述目标参保单位的参保单位类型一致时,确定所述参考参保单位满足所述预设条件。也就是说,以多个第一参保单位中的参考参保单位为例,当参考参保单位的参保时长、参保人数和参保单位类型均满足对应要求时,确定该参考参保单位满足预设条件,即该参考参保单位为第二参保单位。可以理解,先确定所述目标参保单位的参保地区和该参保地区对应的目标数据库,再获取所述目标数据库中对应的各个第一参保单位的参保参数以得到多个参保参数,然后从所述多个第一参保单位中选取参保参数满足预设条件的参保单位以得到多个第二参保单位,如此,根据所述多个第二参保单位中每一参保单位对应的存储信息以得到所述预设数据库。也就是说,贴近目标参保单位的参保地区选取参保参数满足预设条件的参保单位以得到多个第二参保单位,再由该各个第二参保单位对应的存储信息组成预设数据库,便于提高根据预设数据库建立识别模型的准确性。S102:根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集。在本申请实施例中,预设特征维度包括开取药品与诊断信息之间的关联关系、就诊比例、参保成员对应的群体、就诊机构分布、就诊时间分布等,在此不做限定。具体的,就诊比例为就诊人数与参保人数之间的比值,进一步的可包括各个年龄段中就诊人数与参保人数之间的比值;参保成员对应的群体包括以年龄段、学校、学历、专业、职业等分类得到的群体;就诊机构分布包括各个就诊机构的就诊人数之比、集中开药地点、异常就诊机构等;就诊时间分布包括集中开药时段、异常就诊时间等;开取药品与诊断信息之间的关联关系包括合理关系和异常关系等。本申请对于获取预设特征维度的方法不做限定,在一种实现方式中,所述方法还包括:从所述预设数据库中查找骗保结果为骗保单位的参保单位以得到多个参考参保单位;获取所述多个参考参保单位中每一参保单位对应的基本信息集以得到多个参考基本信息集;获取所述多个参考基本信息集对应的特征信息以得到多个特征信息;对所述多个特征信息进行分类以得到多类特征信息集;统计所述多类特征信息集中每一类特征信息的数量以得到多个数量;确定所述多个数量中大于第二阈值的数量对应的特征信息集的类型为所述预设特征维度。在本申请实施例中,骗保结果用于指示该参保单位是否为骗保单位,对于其形式不做限定,可以以0表示为非骗保单位,以1表示为骗保单位;也可以以骗保概率的形式存在,当大于第一阈值时,确定为骗保单位,当小于或等于第一阈值时,确定为非骗保单位;或者,当骗保概率小于或等于第一阈值,且大于第三阈值时,确定为待识别单位,即在预设时长内对该待识别单位进行观察,以确定是否为骗保单元,而当骗保概率小于或等于第三阈值时,确定为非骗保单位。本申请对于第一阈值、第二阈值和第三阈值不做限定,第一阈值和第三阈值用于确定是否骗保单元,第二阈值可以是多类特征信息对应的多个数量的平均值,或者是各个数量进行加权平均。可以理解,从预设数据库中查找骗保结果为骗保单位对应的多个第三参保单位,再获取各个第三参保单位的基本信息集以得到多个参考基本信息集,再由多个参考基本信息集确定多个特征信息,对多个特征信息进行分类以得到多类特征信息集,并确定每一类特征信息对应的参保单位的数量,然后,从多类特征信息中选取大于第二阈值的特征信息,由该类特征信息对应的类型确定预设特征维度,如此,从大数据的方向选取其中符合骗保单位的基本信息,并进行分析,可提高预设特征维度的准确性,便于提高确定目标参保单位是否为骗保单位的准确性。在本申请实施例中,目标特征信息集中包括目标基本信息集与各个预设特征维度之间对应的目标特征信息,目标特征信息集包括多个目标特征信息,每一目标特征信息对应一个预设特征维度。可以理解,根据目标基本信息集,确定与各个预设特征维度对应的特征信息以得到目标特征信息集。也就是说,由目标基本信息和多个预设特征维度确定目标特征信息,即确定对应预设特征维度对应的特征值,可提高计算效率和计算的准确性,且该目标特征信息表示该目标参保单位对应的特征信息,从而便于提高确定该目标参保单位的骗保结果的准确性。本申请对于如何确定目标特征信息的方法不做限定,所述目标参保单位包括多个目标参保成员,在一种实现方式中,根据所述就诊人数和所述参保人数之间的第一比值确定所述就诊比例;将所述多个目标参保成员按照年龄、学校、学历、专业、职业、就诊机构进行分类以得到多个目标参保成员对应的群体;对所述多个目标参保成员的就诊机构进行分析以得到就诊机构分布;对所述多个目标参保成员的就诊时间进行分析以得到就诊时间分布;对所述多个目标参保成员的诊断信息和开药信息进行分析以得到开取药品与诊断信息之间的关联关系。可以理解,分别确定就诊比例、参保成员对应的群体、就诊机构分部、就诊时间分部,开取药品与诊断信息之间的关联关系,如此,可依据不同的特征信息识别目标参保单位是否为骗保单位。进一步的,在一种实现方式中,获取所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值以得到多个目标比值;根据所述多个目标比值确定所述就诊机构集中的集中就诊机构;确定所述诊断信息集中与所述集中就诊机构对应的多个目标诊断信息;确定所述开药信息集中与所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息;确定所述多个目标诊断信息中每一目标诊断信息对应的就诊对象的指定就诊机构以得到多个指定就诊机构;确定所述集中就诊机构和所述多个指定就诊机构中每一指定就诊机构之间的距离以得到多个距离;根据所述多个距离确定所述集中就诊机构的第一合理值;根据所述多个目标开药信息和所述多个目标诊断信息确定开取的异常药品;确定所述异常药品的数量或金额;根据所述数量或所述金额确定所述集中就诊机构的第二合理值;根据所述第一合理值和所述第二合理值确定所述开取药品与诊断信息之间的关联关系。其中,集中就诊机构为目标比值大于一个阈值的就诊机构;指定就诊机构为该就诊对象对应的区域所分配的就诊机构,例如:就诊对象所在的家庭地址位于南岸区,则指定就诊机构为南岸区人民医院。进一步的,可根据诊断信息对应的挂号种类确定该区域对应的多个医院,再由各个医院和家庭地址之间的距离确定指定就诊机构。异常药品为诊断信息与开取药品之间的关联性较小的药品,可根据诊断信息对应的药品类型和开取药品的药品类型之间的关联值,当该关联值小于一阈值时,确定异常药品。例如:就诊信息对应胃病类药品,而开取药品为滴眼液,则确定滴眼液为异常药品。可以理解,获取所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值以得到多个目标比值,再根据多个目标比值从所述就诊机构集中确定集中就诊机构,再从所述诊断信息集中获取所述集中就诊机构对应的多个目标诊断信息,从所述开药信息集中获取所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息,然后获取目标诊断信息对应的指定就诊机构与集中就诊机构之间的距离,由距离确定该集中就诊机构的第一合理值,再获取目标开药信息对应的开取药品中的异常药品的数量或金额,由数量或金额确定集中集中就诊机构的第二合理值,最后由第一合理值和第二合理值确定开取药品与诊断信息之间的关联关系,如此,可根据开取药品与诊断信息之间的关联关系确定目标参保单位是否异常,经过集中就诊机构对应的第一合理值和第二合理值确定其关联关系,可进一步提高确定关联关系的准确性。S103:将所述目标特征信息集输入预先建立的识别模型以得到所述目标参保单位的骗保概率。在本申请实施例中,识别模型用于识别待验证的参保单位是否为骗保单位,是经过大量的数据分析训练得到识别模型,对于识别模型的建立方法不做限定。在一种实现方式中,所述方法还包括:从所述预设数据库中确定训练参保单位集和验证参保单位集;根据所述训练参保单位集和所述验证参保单位集中每一参保单位对应的基本信息集,分别确定与所述多个预设特征维度中每一预设特征维度对应的特征信息得到所述训练参保单位集和所述验证参保单位集中每一参保单位对应的特征信息集;根据所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类以得到待验证模型;根据所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练以得到所述识别模型。在本申请实施例中,训练参保单位集包括多个训练参考单位,验证参保单位集包括多个验证参保单位,训练参保单位集和验证参保单位集中每一参保单位包括该参保单位对应的基本信息集和骗保信息。对于获取训练参保单位集和验证参保单位集中每一参保单位对应的特征信息集可参照目标参保单位获取目标特征信息的方法,在此不再赘述。在本申请实施例中,对于如何对所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类得到待验证模型的方法不做限定,可采用逻辑回归或者决策树算法进行分类,从而得到待验证模型。简单来说,待验证模型相当于一个函数,每一个训练特征信息为一个常数,每一个训练特征信息乘以一个参数可得到对应的骗保结果。在本申请实施例中,对于根据所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练得到所述识别模型的方法不做限定,可采用神经网络中常用的训练方法,例如:梯度下降法Gradientdescent、牛顿算法Newton’smethod、共轭梯度法Conjugategradient、准牛顿法Quasi-Newtonmethod、衰减的最小平方法Levenberg-Marquardt算法等。以梯度下降法举例来说,将验证数据输入待验证模型得到一个骗保结果,将该骗保结果与该验证数据对应的验证结果进行匹配,若匹配成功,则输入下一个验证数据,否则,根据该匹配得到误差函数进行反向运算,从而调整待验证模型,并在最后一个验证数据匹配成功或反向运算结束之后得到识别模型,从而对待验证模型进行验证,提高了识别模型的准确性。可以理解,从预设数据库中确定训练参保单位集和验证参保单位集,再根据所述训练参保单位集和所述验证参保单位集中每一参保单位对应的基本信息集分别确定与所述多个预设特征维度中每一预设特征维度对应的特征信息得到所述训练参保单位集和所述验证参保单位集中每一参保单位对应的特征信息集,根据所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类得到待验证模型,根据所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果对所述待验证模型进行训练得到所述识别模型。即本申请可以通过训练和验证方法得到识别模型,提高了根据该识别模型识别目标参保单位是否为骗保单位的准确性,便于提高风险识别能力。本申请对于确定训练参保单位集和验证参保单位集的方法不做限定,在一种实现方式中,所述根据预设数据库确定训练参保单位集和验证参保单位集包括:从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位;确定所述多个关联参保单位中每一关联参保单位的标识信息以得到多个标识信息;按照预设比例将所述多个关联参保单位进行分类得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;根据所述多个标识信息,从所述预设数据库中确定与所述多个训练参保单位和所述多个验证参保单位对应的存储信息以得到所述训练参保单位集和所述验证参保单位集。在本申请实施例中,关联参保单位可以是与目标参保单位中的目标参保成员关联的参保成员例如:配偶、亲属、朋友等所缴纳医保的参保单位,也可以是与该目标参保成员具有类似身份信息的参保成员所缴纳医保的参保单位,还可以是与目标参保单位的法人代表或其他负责人所在的其他单位等等。本申请对于确定关联参保单位的方法不做限定,可从预设数据库中输入的基本信息进行确定,也可从第三方应用上与目标参保成员之间的联系信息进行确定等,其中,第三方应用可以是即时聊天应用、邮件应用等,与此对应的联系信息可以是文字、语音、图像或邮件等,本申请均在此不做限定。在一种实现方式中,所述目标参保单位包括多个目标参保成员,所述从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位包括:从所述预设数据库中确定所述多个目标参保成员中每一目标参保成员对应的身份信息以得到多个身份信息;根据所述多个身份信息确定多个关联参保成员;根据所述预设数据库确定与所述多个关联参保成员中每一关联参保成员所在的参保单位,以得到所述多个关联参保单位。其中:身份信息包括该目标参保成员的年龄、地域、兴趣等,还可包括目标参保成员的配偶、亲属等联系人。每一身份信息对应一个目标参保成员,本申请对于根据身份信息确定关联参保成员的方法不做限定,可以根据年龄、地域、兴趣、联系人等各个维度查找关联参考成员。可以理解,在预设数据库中获取各个目标参保成员对应的身份信息,并根据各个目标参保成员的身份信息确定多个关联参保成员,再由各个关联参保成员所在的参保单位作为关联参保单位,即可根据该关联参保单位对目标参保单位进行识别,提高了识别参保单位是否为骗保单位的准确性。本申请对于预设比例不做限定,例如:训练参保单位集和验证参保单位集中参保单位的数量之比为7:3。可以理解,从预设数据库中确定与目标参保单位关联的多个关联参保单位,再确定各个关联参保单位的标识信息,按照预设比例将多个关联参保单位分为训练参保单位集和验证参保单位集,如此,可采用与目标参保单位关联的关联参保单位进行训练和验证,提高了识别模型的准确性,便于提高确定目标参保单位是否为骗保单位的准确性。S104:当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。在本申请中,骗保概率的取值范围为[0,1]。第一阈值不做限定,可以为0.6。可以理解,将目标特征信息集输入至识别模型以得到目标参保单位的骗保概率,再由该骗保概率确定目标参保单位是否为骗保单位,可提高识别骗保单位的准确性。在如图1所示的参保单位识别方法中,从预设数据库中获取目标参保单位的目标基本信息,根据该目标基本信息确定与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,将该目标特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。如此,根据一个预先建立的识别模型和目标参保单位的特征信息对该目标参保单位进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。与图1的实施例一致,请参照图2,图2是本申请实施例提供的一种参保单位识别装置的结构示意图,所述装置应用于电子设备。如图2所示,上述参保单位识别装置200包括:获取单元201用于从预设数据库中获取目标参保单位的目标基本信息集;确定单元202用于根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集;识别单元203用于将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;所述确定单元202还用于当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。可以理解,从预设数据库中获取目标参保单位的目标基本信息,根据该目标基本信息确定与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,将该目标特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。如此,根据一个预先建立的识别模型和目标参保单位的特征信息对该目标参保单位进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。在一个可能的示例中,所述目标基本信息集包括所述目标参保单位的参保人数、就诊人数、就诊机构集、诊断信息集、开药信息集,所述预设特征维度包括开取药品与诊断信息之间的关联关系,在所述根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集方面,所述确定单元202具体用于确定所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值,以得到多个目标比值;根据所述多个目标比值确定所述就诊机构集中的集中就诊机构;确定所述诊断信息集中与所述集中就诊机构对应的多个目标诊断信息;确定所述开药信息集中与所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息;确定所述多个目标诊断信息中每一目标诊断信息对应的就诊对象的指定就诊机构以得到多个指定就诊机构;确定所述集中就诊机构和所述多个指定就诊机构中每一指定就诊机构之间的距离以得到多个距离;根据所述多个距离确定所述集中就诊机构的第一合理值;根据所述多个目标开药信息和所述多个目标诊断信息确定开取的异常药品;确定所述异常药品的数量或金额;根据所述数量或所述金额确定所述集中就诊机构的第二合理值;根据所述第一合理值和所述第二合理值确定所述开取药品与诊断信息之间的关联关系。在一个可能的示例中,所述确定单元202用于从所述预设数据库中确定训练参保单位集和验证参保单位集,所述训练参保单位集和所述验证参保单位集中每一参保单位包括对应的基本信息集和骗保结果;根据所述训练参保单位集和所述验证参保单位集中每一参保单位对应的基本信息集,分别确定与所述多个预设特征维度中每一预设特征维度对应的特征信息,以得到所述训练参保单位集和所述验证参保单位集中每一参保单位对应的特征信息集;所述装置200还包括:训练单元204用于根据所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类,以得到待验证模型;验证单元205用于根据所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练,以得到所述识别模型。在一个可能的示例中,在所述从预设数据库中确定训练参保单位集和验证参保单位集方面,所述确定单元202具体用于从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位;确定所述多个关联参保单位中每一关联参保单位的标识信息,以得到多个标识信息;按照预设比例将所述多个关联参保单位进行分类,以得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;根据所述多个标识信息,从所述预设数据库中确定与所述多个训练参保单位和所述多个验证参保单位对应的存储信息,以得到所述训练参保单位集和所述验证参保单位集。在一个可能的示例中,所述目标参保单位包括多个目标参保成员,在所述从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位方面,所述确定单元202具体用于从所述预设数据库中确定所述多个目标参保成员中每一目标参保成员对应的身份信息,以得到多个身份信息;根据所述多个身份信息确定多个关联参保成员;根据所述预设数据库确定与所述多个关联参保成员中每一关联参保成员所在的参保单位,以得到所述多个关联参保单位。在一个可能的示例中,所述确定单元202还用于确定所述目标参保单位的参保地区;确定所述参保地区对应的目标数据库,所述目标数据库包括多个第一参保单位;所述获取单元201还用于获取所述多个第一参保单位中每一参保单位的参保参数,以得到多个参保参数;所述装置200还包括:选取单元206用于从所述多个第一参保单位中选取参保参数满足预设条件的参保单位,以得到多个第二参保单位;根据所述多个第二参保单位中每一参保单位对应的存储信息,以得到所述预设数据库。在一个可能的示例中,所述获取单元201还用于从所述预设数据库中查找骗保结果为骗保单位的参保单位,以得到多个第三参保单位;获取所述多个第三参保单位中每一参保单位对应的基本信息集,以得到多个参考基本信息集;获取所述多个参考基本信息集对应的特征信息,以得到多个特征信息;对所述多个特征信息进行分类,以得到多类特征信息集;所述确定单元202还用于统计所述多类特征信息集中每一类特征信息的数量,以得到多个数量;确定所述多个数量中大于第二阈值的数量对应的特征信息集的类型为所述预设特征维度。与图1的实施例一致,请参照图3,图3是本申请实施例提供的一种电子设备的结构示意图。如图3所示,该电子设备300包括处理器310、存储器320、通信接口330以及一个或多个程序340,其中,上述一个或多个程序340被存储在上述存储器320中,并且被配置由上述处理器310执行,上述程序340包括用于执行以下步骤的指令:从预设数据库中获取目标参保单位的目标基本信息集;根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集;将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。可以理解,从预设数据库中获取目标参保单位的目标基本信息,根据该目标基本信息确定与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,将该目标特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。如此,根据一个预先建立的识别模型和目标参保单位的特征信息对该目标参保单位进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。在一个可能的示例中,所述目标基本信息集包括所述目标参保单位的参保人数、就诊人数、就诊机构集、诊断信息集、开药信息集,所述预设特征维度包括开取药品与诊断信息之间的关联关系,在所述根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集方面,所述程序340具体用于执行以下步骤的指令:确定所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值,以得到多个目标比值;根据所述多个目标比值确定所述就诊机构集中的集中就诊机构;确定所述诊断信息集中与所述集中就诊机构对应的多个目标诊断信息;确定所述开药信息集中与所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息;确定所述多个目标诊断信息中每一目标诊断信息对应的就诊对象的指定就诊机构以得到多个指定就诊机构;确定所述集中就诊机构和所述多个指定就诊机构中每一指定就诊机构之间的距离以得到多个距离;根据所述多个距离确定所述集中就诊机构的第一合理值;根据所述多个目标开药信息和所述多个目标诊断信息确定开取的异常药品;确定所述异常药品的数量或金额;根据所述数量或所述金额确定所述集中就诊机构的第二合理值;根据所述第一合理值和所述第二合理值确定所述开取药品与诊断信息之间的关联关系。在一个可能的示例中,所述程序340还用于执行以下步骤的指令:从所述预设数据库中确定训练参保单位集和验证参保单位集,所述训练参保单位集和所述验证参保单位集中每一参保单位包括对应的基本信息集和骗保结果;根据所述训练参保单位集和所述验证参保单位集中每一参保单位对应的基本信息集,分别确定与所述多个预设特征维度中每一预设特征维度对应的特征信息,以得到所述训练参保单位集和所述验证参保单位集中每一参保单位对应的特征信息集;根据所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类,以得到待验证模型;根据所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练,以得到所述识别模型。在一个可能的示例中,在所述从预设数据库中确定训练参保单位集和验证参保单位集方面,所述程序340具体用于执行以下步骤的指令:从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位;确定所述多个关联参保单位中每一关联参保单位的标识信息,以得到多个标识信息;按照预设比例将所述多个关联参保单位进行分类,以得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;根据所述多个标识信息,从所述预设数据库中确定与所述多个训练参保单位和所述多个验证参保单位对应的存储信息,以得到所述训练参保单位集和所述验证参保单位集。在一个可能的示例中,所述目标参保单位包括多个目标参保成员,在所述从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位方面,所述程序340具体用于执行以下步骤的指令:从所述预设数据库中确定所述多个目标参保成员中每一目标参保成员对应的身份信息,以得到多个身份信息;根据所述多个身份信息确定多个关联参保成员;根据所述预设数据库确定与所述多个关联参保成员中每一关联参保成员所在的参保单位,以得到所述多个关联参保单位。在一个可能的示例中,所述程序340还用于执行以下步骤的指令:确定所述目标参保单位的参保地区;确定所述参保地区对应的目标数据库,所述目标数据库包括多个第一参保单位;获取所述多个第一参保单位中每一参保单位的参保参数,以得到多个参保参数;从所述多个第一参保单位中选取参保参数满足预设条件的参保单位,以得到多个第二参保单位;根据所述多个第二参保单位中每一参保单位对应的存储信息,以得到所述预设数据库。在一个可能的示例中,所述程序340还用于执行以下步骤的指令:从所述预设数据库中查找骗保结果为骗保单位的参保单位,以得到多个第三参保单位;获取所述多个第三参保单位中每一参保单位对应的基本信息集,以得到多个参考基本信息集;获取所述多个参考基本信息集对应的特征信息,以得到多个特征信息;对所述多个特征信息进行分类,以得到多类特征信息集;统计所述多类特征信息集中每一类特征信息的数量,以得到多个数量;确定所述多个数量中大于第二阈值的数量对应的特征信息集的类型为所述预设特征维度。本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于存储计算机程序,该计算机程序使得计算机执行如方法实施例中记载的任一方法的部分或全部步骤,计算机包括电子设备。本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备可为个人计算机、服务器或者网络设备等执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器read-onlymemory,ROM、随机存取存储器randomaccessmemory,RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

权利要求:1.一种参保单位识别方法,其特征在于,包括:从预设数据库中获取目标参保单位的目标基本信息集;根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集;将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。2.根据权利要求1所述的方法,其特征在于,所述目标基本信息集包括所述目标参保单位的参保人数、就诊人数、就诊机构集、诊断信息集、开药信息集,所述预设特征维度包括开取药品与诊断信息之间的关联关系,所述根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集,包括:确定所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值,以得到多个目标比值;根据所述多个目标比值确定所述就诊机构集中的集中就诊机构;确定所述诊断信息集中与所述集中就诊机构对应的多个目标诊断信息;确定所述开药信息集中与所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息;确定所述多个目标诊断信息中每一目标诊断信息对应的就诊对象的指定就诊机构以得到多个指定就诊机构;确定所述集中就诊机构和所述多个指定就诊机构中每一指定就诊机构之间的距离以得到多个距离;根据所述多个距离确定所述集中就诊机构的第一合理值;根据所述多个目标开药信息和所述多个目标诊断信息确定开取的异常药品;确定所述异常药品的数量或金额;根据所述数量或所述金额确定所述集中就诊机构的第二合理值;根据所述第一合理值和所述第二合理值确定所述开取药品与诊断信息之间的关联关系。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:从所述预设数据库中确定训练参保单位集和验证参保单位集,所述训练参保单位集和所述验证参保单位集中每一参保单位包括对应的基本信息集和骗保结果;根据所述训练参保单位集和所述验证参保单位集中每一参保单位对应的基本信息集,分别确定与所述多个预设特征维度中每一预设特征维度对应的特征信息,以得到所述训练参保单位集和所述验证参保单位集中每一参保单位对应的特征信息集;根据所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类,以得到待验证模型;根据所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练,以得到所述识别模型。4.根据权利要求3所述的方法,其特征在于,所述从预设数据库中确定训练参保单位集和验证参保单位集,包括:从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位;确定所述多个关联参保单位中每一关联参保单位的标识信息,以得到多个标识信息;按照预设比例将所述多个关联参保单位进行分类,以得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;根据所述多个标识信息,从所述预设数据库中确定与所述多个训练参保单位和所述多个验证参保单位对应的存储信息,以得到所述训练参保单位集和所述验证参保单位集。5.根据权利要求4所述的方法,其特征在于,所述目标参保单位包括多个目标参保成员,所述从所述预设数据库中确定与所述目标参保单位关联的多个关联参保单位,包括:从所述预设数据库中确定所述多个目标参保成员中每一目标参保成员对应的身份信息,以得到多个身份信息;根据所述多个身份信息确定多个关联参保成员;根据所述预设数据库确定与所述多个关联参保成员中每一关联参保成员所在的参保单位,以得到所述多个关联参保单位。6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:确定所述目标参保单位的参保地区;确定所述参保地区对应的目标数据库,所述目标数据库包括多个第一参保单位;获取所述多个第一参保单位中每一参保单位的参保参数,以得到多个参保参数,所述参保参数包括参保时长、参保人数、参保单位类型中的任一项或多项;从所述多个第一参保单位中选取参保参数满足预设条件的参保单位,以得到多个第二参保单位;根据所述多个第二参保单位中每一参保单位对应的存储信息,以得到所述预设数据库。7.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:从所述预设数据库中查找骗保结果为骗保单位的参保单位,以得到多个第三参保单位;获取所述多个第三参保单位中每一参保单位对应的基本信息集,以得到多个参考基本信息集;获取所述多个参考基本信息集对应的特征信息,以得到多个特征信息;对所述多个特征信息进行分类,以得到多类特征信息集;统计所述多类特征信息集中每一类特征信息的数量,以得到多个数量;确定所述多个数量中大于第二阈值的数量对应的特征信息集的类型为所述预设特征维度。8.一种参保单位识别装置,其特征在于,包括:获取单元,用于从预设数据库中获取目标参保单位的目标基本信息集;确定单元,用于根据所述目标基本信息集,确定与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集;识别单元,用于将所述目标特征信息集输入预先建立的识别模型,以得到所述目标参保单位的骗保概率;所述确定单元,还用于当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。9.一种电子设备,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-7任一项方法中的步骤的指令。10.一种计算机可读存储介质,其特征在于,其用于存储计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。

百度查询: 平安医疗健康管理股份有限公司 参保单位识别方法及相关产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。