首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

自动检测自由文本中的个人信息 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国际商业机器公司

摘要:本发明涉及自动检测自由文本中的个人信息,包括:对数字文本文档自动应用命名实体识别NER算法,以检测出现在数字文本文档中的命名实体,其中命名实体选自由以下各项组成的组:至少一个个人类型实体,以及至少一个非个人类型实体;通过对包含检测到的命名实体的数字文本文档的句子应用词性POS标记算法和依赖性解析算法,自动检测命名实体之间的至少一种关系;自动估计命名实体之间的至少一种关系是否表示个人信息;以及自动发出估计结果的通知。

主权项:1.一种用于自动检测自由文本中的个人信息的方法,包括操作至少一个硬件处理器以:自动将命名实体识别NER算法应用于数字文本文档,以检测出现在所述数字文本文档中的命名实体,其中所述命名实体选自由以下各项组成的组:至少一个个人类型实体,以及至少一个非个人类型实体;通过对包含检测到的命名实体的所述数字文本文档的句子应用词性POS标记算法和依赖项解析算法,自动检测所述命名实体之间的至少一种关系,其中所述自动检测所述命名实体之间的至少一个关系还包括:利用所应用的依赖性解析算法的结果来确定将每个句子中的每两个命名实体连接起来的依赖性路径;选择位于依赖性路径内的文本表达;以及将每个所述文本表达与从预定义的一组关系类型中选择的关系类型相关联;自动估计所述命名实体之间的至少一种关系是否表示个人信息,其中所述自动估计包括:基于以下内容来计算所述数字文本文档的隐私分数或所述至少一个个人类型实体中的每一个的隐私分数:与所述关系类型相关联的第一组预定义分数,其中第一组的每个分数指示相应的关系类型是个人信息的一部分的可能性;以及与所述命名实体相关联的第二组预定义分数,其中第二组的每个分数指示相应的命名实体是个人信息的一部分的可能性;以及自动发出估计结果的通知。

全文数据:

权利要求:

百度查询: 国际商业机器公司 自动检测自由文本中的个人信息

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。