Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜国网湖北省电力有限公司电力科学研究院;国网湖北省电力有限公司;国网湖北省电力有限公司神农架供电公司刘鸣柳获国家专利权

恭喜国网湖北省电力有限公司电力科学研究院;国网湖北省电力有限公司;国网湖北省电力有限公司神农架供电公司刘鸣柳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜国网湖北省电力有限公司电力科学研究院;国网湖北省电力有限公司;国网湖北省电力有限公司神农架供电公司申请的专利一种面向公开信息源的灾害事件自动提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115221383B

龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210805228.2,技术领域涉及:G06F16/951;该发明授权一种面向公开信息源的灾害事件自动提取方法是由刘鸣柳;饶玮;崔一铂;邢杰;唐泽洋;朱银军;刘曼佳;万磊;王文烁;黄杰;靳经;凌在汛;蔡万里设计研发完成,并于2022-07-08向国家知识产权局提交的专利申请。

一种面向公开信息源的灾害事件自动提取方法在说明书摘要公布了:本发明提供一种面向公开信息源的灾害事件自动提取方法,包括:利用混合灾害爬虫爬取互联网中的灾害相关网页,基于爬行深度自适应控制策略实现灾害主题页面的爬取优化;网页预处理,对爬取的网页进行标签类型识别,提取事件描述文本;事件实体提取,对所提取的事件描述文本进行分词处理,通过对词性、停顿词、实体关键词的识别和解析,构建事件实体特征向量;依据所构建的事件实体特征向量对文本类型进行分类,根据灾害事件与描述属性的对应关系,生成灾害信息图谱。本发明可以利用公开的互联网网页资源进行灾害事件的信息挖掘,有效拓展了灾害事件的信息获取渠道及智能获取水平,对于建立灾害数据库及灾害预警技术研究等具有重要价值。

本发明授权一种面向公开信息源的灾害事件自动提取方法在权利要求书中公布了:1.一种面向网页公开文本信息的灾害事件提取方法,其特征在于包括以下步骤:步骤1:利用混合灾害爬虫爬取互联网中的灾害相关网页,基于爬行深度自适应控制策略实现灾害主题页面的爬取优化;步骤2:网页预处理,对步骤1中爬取的网页进行标签类型识别,提取事件描述文本;步骤3:事件实体提取,对步骤2所提取的事件描述文本进行分词处理,通过对词性、停顿词、实体关键词的识别和解析,构建事件实体特征向量;步骤4:依据步骤3所构建的事件实体特征向量对文本类型进行分类,根据灾害事件与描述属性的对应关系,生成灾害信息图谱;步骤2中的事件描述文本在步骤3中转换为一组事件实体特征向量,其中每个事件实体特征向量对应一项描述性实体词组,具体来说,事件实体特征向量的模型为一个六元组,记为,各元素依次代表对应词组的词频、位置、权值、实体属性、时态及空间描述粒度;步骤3中构建事件实体特征向量,具体包括:首先从步骤2的事件描述文本中提取出一组描述性实体词组,其具体过程包括:对事件描述文本进行字符串分词处理,并依据词性、停顿词标注、灾害主题词库、字符串位置来对分词进行语义解析,合并关联词组以加强事件的描述准确度,合并后的词组总数记为;接着,将词组按“时间T”、“地点L”、“状态S”和“事件类型E”进行属性归类,对各类属性下的描述性实体词组进行语义相似性分析,对相似词组再次合并,得到描述性实体词组,其中分别代表合并处理后四类属性的描述性实体词组的保留数量;然后,依据事件实体特征向量的模型来为每项词组构建一条特征向量进行描述,假设词组自合并而来,则该项词组的事件实体特征向量记为,各维度特征项的计算方法如下: 的词频计算公式为: ;其中,表示在该网页文本中出现的词频;特征向量中的位置元素仅表示对应词组在文本中首次出现时的位置,经过归一化处理记录如下: ;其中,分别表示的起止位置,代表该网页中字符串的总长度;权重主要依据标签级别进行计算,记事件描述文档中的文本标签共有级属性,且第1,2,...,N级标签的权值分别为,...,,排列顺序从大到小,对词组而言,记其标签级别为,则对应的标签权值为: ;其中,取其合并子集词组中权值的最大值为其权值,即,的实体属性为P,共包括T,L,S,E四类,有: ;时态表达相对事件发生时间而言,对于时间类实体,将其分为过去、进行和将来三种类别,其他实体的时态记为空,如下: ;对于文档中出现的地点类词组,依据国家行政区划对其描述粒度进行区分,共包括省、地、县、乡、村五级,其他词组的空间粒度记为空,如下: 。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网湖北省电力有限公司电力科学研究院;国网湖北省电力有限公司;国网湖北省电力有限公司神农架供电公司,其通讯地址为:430077 湖北省武汉市洪山区徐东大街227号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。