首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】敏感词的识别和替换方法及其装置_四川易景智能终端有限公司_202410418406.5 

申请/专利权人:四川易景智能终端有限公司

申请日:2024-04-09

公开(公告)日:2024-06-21

公开(公告)号:CN118013963B

主分类号:G06F40/284

分类号:G06F40/284;G06F40/30;G06F40/166;G06F40/151

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要:本公开提出了一种敏感词的识别和替换方法及其装置,涉及自然语言处理技术领域。该方法包括:获取待处理文本,对待处理文本进行词语切分和命名实体识别,获取多个候选词语;采用基于词嵌入特征的第一深度学习模型对候选词语进行识别,判断候选词语中是否存在敏感词;响应于候选词语中存在敏感词,对敏感词进行词性标注和情感分析,获取敏感词的词性类型和情感类型;基于待处理文本、敏感词的词性类型和情感类型,从预设替换词库中确定目标替换词,并基于目标替换词对敏感词进行替换,获取替换敏感词之后的目标文本。本公开可以提高敏感词的识别和替换的灵活性,通过深度的语义理解,处理复杂的文本,提升敏感词过滤的准确性。

主权项:1.一种敏感词的识别和替换方法,其特征在于,包括:获取待处理文本,对所述待处理文本进行词语切分和命名实体识别,获取多个候选词语;采用基于词嵌入特征的第一深度学习模型对所述候选词语进行识别,判断所述候选词语中是否存在敏感词;响应于所述候选词语中存在敏感词,对所述敏感词进行词性标注和情感分析,获取所述敏感词的词性类型和情感类型;基于所述待处理文本、所述敏感词的词性类型和情感类型,从预设替换词库中确定目标替换词,并基于所述目标替换词对所述敏感词进行替换,获取替换敏感词之后的目标文本;其中,所述对所述敏感词进行词性标注和情感分析,获取所述敏感词的词性类型和情感类型,包括:基于预设的自然语言处理工具对所述敏感词进行词性标注,获取所述敏感词的词性类型,所述词性类型至少包括动词、名词、形容词中的一项或几项;基于预设的第二深度学习模型对所述敏感词进行情感分析,获取所述敏感词的情感类型,所述情感类型包括积极类型、中立类型、消极类型中的一项或几项。

全文数据:

权利要求:

百度查询: 四川易景智能终端有限公司 敏感词的识别和替换方法及其装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。