买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:飞狐信息技术(天津)有限公司
摘要:本申请公开了一种敏感词处理方法、装置、设备和存储介质,用于数据处理技术领域。获取待过滤文本中多个候选敏感词、以及待过滤文本中每个候选敏感词的位置信息;通过多个候选敏感词、多个候选敏感词对应的多个位置信息,确定多个候选敏感词之间的包含关系;基于包含关系合并多个候选敏感词得到目标敏感词;过滤待过滤文本中目标敏感词得到已过滤文本。通过待过滤文本中每个候选敏感词的位置信息,能够考虑待过滤文本中多个候选敏感词之间的包含关系,实现多个候选敏感词合并以得到目标敏感词;过滤待过滤文本中目标敏感词,能够减少敏感词重复过滤操作,避免出现敏感词重复过滤的问题,在保障敏感词的过滤效果的基础上,提升敏感词的过滤效率。
主权项:1.一种敏感词处理方法,其特征在于,包括:获取待过滤文本中多个候选敏感词、以及所述待过滤文本中每个所述候选敏感词的位置信息;根据多个所述候选敏感词、多个所述候选敏感词对应的多个位置信息,确定多个所述候选敏感词之间的包含关系;根据所述包含关系对多个所述候选敏感词进行敏感词合并,获得目标敏感词;对所述待过滤文本中所述目标敏感词进行敏感词过滤,获得已过滤文本。
全文数据:
权利要求:
百度查询: 飞狐信息技术(天津)有限公司 一种敏感词处理方法、装置、设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。