买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于信息增强实现两步中文事件精准检测的方法、装置、处理器及其计算机可读存储介质_公安部第三研究所_202111528511.7 

申请/专利权人:公安部第三研究所

申请日:2021-12-14

公开(公告)日:2024-04-23

公开(公告)号:CN114239566B

主分类号:G06F40/284

分类号:G06F40/284;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2022.04.12#实质审查的生效;2022.03.25#公开

摘要:本发明涉及一种基于信息增强实现两步中文事件精准检测的方法,其中,该方法包括:输入包含中文的事件句和事件句文档进行分词处理;对事件句中的每一个字符进行多粒度事件信息混合表示的处理;将每一个字符的最终表征用于构建残差型门限空洞卷积网络;采用首尾双指针的标注策略对所有中文事件中的触发词进行识别处理;利用所述的事件句和事件句文档构建包含实体‑主体‑候选触发词的交互图模型;使用Softmax层预测事件触发词的事件类别分布特征,并通过概率分布计算出各个触发词所属的事件类别。本发明还涉及一种相应的装置、处理器及其存储介质。采用了本发明的该基于信息增强实现两步中文事件精准检测的方法,显著地提高了事件触发词分类的准确率。

主权项:1.一种基于信息增强实现两步中文事件精准检测的方法,其特征在于,所述的方法包括以下步骤:1输入包含中文的事件句和事件句文档进行分词处理;2对事件句中的每一个字符进行多粒度事件信息混合表示的处理,以获取每一个字符融合后的最终表征;3将每一个字符的最终表征用于进行多层带扰动的残差型门限空洞卷积网络的构建,以进行后续中文事件的检测;4采用首尾双指针的标注策略对所有中文事件中的触发词进行识别处理;5利用所述的事件句和事件句文档构建包含实体-主体-候选触发词的交互图模型;6针对上述处理过程使用Softmax层预测事件触发词的事件类别分布特征,并通过概率分布计算出各个触发词所属的事件类别;步骤2具体包括以下步骤:2.1对于中文事件句中的每一个字符,从字词训练向量模型中查找事件句中每一个字符对应的字符表征;2.2采用全词切分的方式获取事件句中每一个字符对应的全词语表征;2.3根据下列公式计算事件句中每一个字符对应的位置表征,以提高整体事件句信息表征对字符位置的感知和敏感度: 其中,i为事件句中的第i个字符,dpe为位置表征的维度,PEi,2k为位置表征第2k个元素的数值,PEi,2k+1为位置表征第2k+1个元素的数值,2.4将每一个字符对应的字符表征、全词语表征以及位置表征累加获取该字符的最终表征;步骤2.2具体包括以下步骤:2.2.1在预训练模型中查找每一个字符对应的所有的词语表征WEik;2.2.2并根据下列公式计算当前该字符对应的所有词语表征的平均值,将其作为该字符最终的全词语表征: 其中,i为事件句中的第i个字符,k为当前字符的第k个全词语表征,K为当前字符的全词语表征总数。

全文数据:

权利要求:

百度查询: 公安部第三研究所 基于信息增强实现两步中文事件精准检测的方法、装置、处理器及其计算机可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。