买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南湖实验室
摘要:本发明涉及信息安全技术领域,尤其涉及一种面向数据开放的高性能个人信息脱敏方法与系统。该方法包括通过待脱敏数据获取,确认需要识别的个人信息类型及其识别规则,并确认对应的个人信息类型在进行脱敏处理时的脱敏策略,个人信息识别与定位和对识别到的承载个人信息的字符进行自适应脱敏处理,并根据字符定位在副本数据表中完成替换。通过本发明的脱敏方法和系统实现的面向数据开放的个人信息脱敏处理,可兼顾个人信息保护和数据开放场景下数据的真实性和可用性。
主权项:1.一种面向数据开放的高性能个人信息脱敏方法,其特征在于:包括如下步骤:S1待脱敏数据获取:接入数据源,从数据源中获取待脱敏的原始数据表;S2策略设定:包含设定个人信息类型及识别规则和设定个人信息脱敏规则两个部分,每个部分的设定均含有底线策略和策略自定义两个层级,所述设定个人信息类型及识别规则包括设定需要识别的个人信息类型及其对应的识别规则,后续的处理步骤将基于设定的识别规则所识别到的个人信息执行,所述设定个人信息脱敏规则包括对识别到的各类个人信息设定不同脱敏处理时所需要保留的信息粒度和脱敏形式;S3个人信息识别与定位:按照已确认策略中设定的各类个人信息类型及识别规则,对待脱敏的原始数据表进行字符层级的检测识别和定位,具体包括:S301创建待脱敏的原始数据表的副本数据表;S302对待脱敏的原始数据表按照字段进行拆分,再对字段内容依照识别策略对字段内容下的单元格的内容进行字符层级的检测识别,获取每一字段内容下每一单元格中隐藏的承载个人信息的字符;S303将具体识别到的承载个人信息的字符,记录其所在的记录行索引、字段索引、其所属的信息类型以及所在的单元格的值的原文,写入指定数据库;S4对识别到的承载个人信息的字符进行自适应脱敏处理:对记录的具体识别到的承载个人信息的字符,按照已确认策略中设定的个人信息脱敏规则自适应地进行字符层级的脱敏处理,具体包括:S401、依据识别到的承载个人信息的字符所属的个人信息类型,从已确认策略中设定的个人信息脱敏策略集中选择该个人信息类型对应的脱敏策略;S402、对承载个人信息的字符依照对应的脱敏策略所设定的需要保留的信息粒度和进行遮掩或替换的形式进行处理,将脱敏处理后的字符根据已记录的个人信息定位,定位至原始数据表中承载该个人信息的字符所属的位置,并在待脱敏的原始数据表的副本数据表中将该承载个人信息的字符替换为脱敏处理后的字符;所述步骤S2中,所述个人信息类型及识别规则设定部分的底线策略层级包括基于数据开放的场景特点和个人信息保护要求罗列直接标识性个人信息,针对直接标识性个人信息类型编写特定的识别规则,设计具有个人信息保护底线思维的基础个人信息类型及识别规则,实现对承载个人信息的字符进行识别,所述个人信息脱敏规则设定部分的底线策略层级包括对于已设定的基础个人信息类型,针对性设计具有个人信息保护底线思维的基础的个人信息脱敏规则,对各个人信息类型在保留其数据结构特征和数据统计特征的同时移除信息的敏感性;所述个人信息类型及识别规则设定部分的策略自定义层级在底线策略的基础上,通过增删、编辑或导入相关信息类型的识别规则,自定义扩大、缩小以及调整需要进行识别及后续脱敏处理的个人信息类型,所述个人信息脱敏规则设定部分的策略自定义层级在底线策略的基础上,选定需要进行脱敏处理的个人信息类型,设定所需要保留的信息粒度和脱敏形式。
全文数据:
权利要求:
百度查询: 南湖实验室 面向数据开放的高性能个人信息脱敏方法与系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。