一种基于深度学习技术的敏感信息识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：闪捷信息科技有限公司

摘要：本发明提供一种基于深度学习技术的敏感信息识别方法，涉及数据识别技术领域，包括以下步骤：获取训练数据集；分别对图像数据、全中文数据集和非全中文数据集训练得到第一、第二和第三分类模型；接受待预测的数据；分别根据待预测的数据的类型输入至第一、第二和第三分类模型，得到标签；获取所有标签，对结构化数据，则统计每个字段下实例标签最多的类别作为该字段的类别；对非结构化数据，则将中文分词字符的类别进行敏感信息统计。本发明合理有效，可以通过对原始数据进行特征工程，将数据集输入到对应的分类模型进行训练，得到不同的分类模型，根据待识别的敏感数据类型得到分类标签，对不同类型的数据进行识别，识别准确率高，保护性好。

主权项：1.一种基于深度学习技术的敏感信息识别方法，其特征在于，包括以下步骤：S1：获取训练数据集；S2：判断训练数据集是否为图像数据，若是则使用深度学习模型进行训练，得到第一分类模型，并执行步骤S4；反之则执行步骤S3；S3：判断训练数据集是否为全中文数据集，若是则使用深度学习模型进行训练，得到第二分类模型，并执行步骤S4；反之则使用机器学习模型进行训练，得到第三分类模型，并执行步骤S4；S4：接收待预测的数据；S5：判断待预测的数据是否为图像数据，若是，则将待预测的数据输入至第一分类模型，将分类结果作为图像的标签；反之则执行步骤S6；S6：判断待预测的数据是否为结构化数据；若是则将每个字段的实例进行提取，执行步骤S7；反之则提取非结构化字符，进行中文分词，执行步骤S7；S7：判断获取的字段实例或者中文分词是否为全中文数据；若是则将字段实例或者中文分词输入至第二分类模型，得到所有字段实例或者中文分词的标签；反之则将字段实例或者中文分词输入至第三分类模型，得到所有字段实例或者中文分词的标签；S8：获取所有标签，若待预测的数据为图像数据，将每一张图像的分类结果作为该图像的标签，并判断其是否为敏感图像信息；若待预测的数据为结构化数据，则统计每个字段下实例标签最多的类别作为该字段的类别，并判断其是否为敏感字段信息；若待预测的数据为非结构化数据，则将中文分词字符的类别进行敏感信息统计，并判断其是否为敏感字符信息；执行步骤S2时，对图像数据的训练步骤具体包括：S21：对图像进行增广；S22：将图像变换到同样的大小，并进行归一化处理；S23：将处理好的图像输入到resnet模型进行训练，得到第一分类模型；执行步骤S3时，对全中文数据集的训练步骤具体包括：S311：将数据集处理成字段内容和标签两列；S312：根据字符编码字典，将字段内容转换为向量，并把标签进行独热编码；S313：将处理好的数据送到bert模型中进行训练，得到第二分类模型；执行步骤S3时，对非全中文数据集的训练步骤具体包括：S321：提取非中文数据集的自定义特征；S322：对特征进行预处理，包括归一化和分箱；S323：将处理好的数据输入到随机森林中进行训练，得到第三分类模型。

全文数据：

权利要求：

百度查询：闪捷信息科技有限公司一种基于深度学习技术的敏感信息识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：显示设备

下一篇：一种建筑工程结构缝隙灌浆装置

相关技术

显示设备

一种建筑工程结构缝隙灌浆装置

一种基于多源数据的换电柜电池智能回收管理方法及系统

一种基于鱼、鸭综合控制水体满江红的方法

一种宽组分区间的高性能压电陶瓷及其制备方法

背光模组及显示装置

半固态电解质膜及其制备方法、二次电池

一种纯水中超快激光烧蚀制备高活性纳米氧化银析氢材料的方法

一种肽功能化纳米酶及其制备方法和应用

一种智能围棋教学系统

温度控制方法、装置、系统及计算机设备

一种考虑可靠性及经济性的配电网承载力精细化评估方法

技术相关技术

一种报警技术误报甄别方法_浙江猎人特卫安保集团有限公司_202311540103.2

基于EIT技术的重症患者监测方法及系统_中山市人民医院_202410902685.2

用于管理不连续接收定时器的技术_苹果公司_202280088508.4

用于形成相机的悬架组件的技术_苹果公司_202110924334.8

一种基于超导线的磁体编织技术_华北电力大学_202410565460.2

生物技术开发设备用快速消毒装置_陕西悦沐伦安科技有限公司_202323463976.6

多功能破拆救援技术训练装置_中国人民警察大学_202010438816.8

一种基于LDS技术的智能穿戴装置_苏州晓屿科技有限公司_202420511646.5

物理对象边界检测技术和系统_电子湾有限公司_201980032813.X

基于物联网技术的金融仓监管方法_浪潮智慧供应链科技(山东)有限公司_202410968947.5

敏感相关技术

一种能用于敏感肌的湿巾_稳健医疗(嘉鱼)有限公司_202410846019.1

一种居民敏感用户停电管理监测装置_广西电网有限责任公司崇左凭祥供电局_202210033641.1

一种温度敏感变色指示装置_江苏集萃智能液晶科技有限公司_202111107446.0

湿度敏感型雄性不育水稻材料S14119的制备及应用_中国科学院植物研究所_202311396400.4

敏感词过滤方法、装置、计算机设备和可读存储介质_杭州电魂网络科技股份有限公司_202011074973.1

一种核电厂关键敏感设备脱敏优先级确定方法_核电运行研究(上海)有限公司_202310289133.4

平面工艺的敏感区沉积能量叠层仿真标定方法_北京微电子技术研究所_202410377527.X

敏感数据的审计方法、装置及电子设备_阳光保险集团股份有限公司_202410717431.3

整车颤振敏感度评价方法、系统、可读存储介质及设备_麦格纳动力总成(江西)有限公司_202410775377.8

基于小电导机械力敏感性通道的生物埃米孔系统_四川大学_202210758241.7

信息相关技术

信息处理装置、信息处理方法和信息处理程序_索尼集团公司_202280091303.1

信息处理装置、信息处理方法、程序以及信息处理系统_日铁系统集成株式会社_202280091698.5

距离信息取得装置、距离信息取得方法及程序_松下知识产权经营株式会社_201980048155.3

信息处理装置、信息处理方法及程序_索尼集团公司_202380021699.7

信息处理设备、信息处理方法和程序_索尼集团公司_202380021694.4

信息提供装置、信息提供方法及存储介质_本田技研工业株式会社_202010239938.4

生物信息测量装置_提爱思科技股份有限公司_202110213222.1

信息管理系统_丰田自动车株式会社_202410068116.2

水利信息监测系统_安徽研控工业自动化有限公司_202411092690.8

信息处理装置、信息处理方法、记录介质以及信息处理系统_株式会社东芝_202311109872.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度学习技术的敏感信息识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务