Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜辽宁大学李冬获国家专利权

恭喜辽宁大学李冬获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜辽宁大学申请的专利面向金融领域事件抽取的篇章级长文本数据预处理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113987111B

龙图腾网通过国家知识产权局官网在2025-03-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111403771.1,技术领域涉及:G06F16/31;该发明授权面向金融领域事件抽取的篇章级长文本数据预处理方法及系统是由李冬;雷智磊;纪婉婷;宋宝燕;单晓欢;王俊陆设计研发完成,并于2021-11-24向国家知识产权局提交的专利申请。

面向金融领域事件抽取的篇章级长文本数据预处理方法及系统在说明书摘要公布了:本发明涉及面向金融领域事件抽取的篇章级长文本数据预处理方法及系统,属于大数据与人工智能技术领域,该方法包括以下步骤:1选取金融事件的类型,并根据不同的金融事件类型定义事件元素;2从互联网上公开数据源获取各类金融事件的篇章级长文本类数据,并对文本类数据进行清洗,将清洗后数据格式转换成JSON格式,保存到MongoDB数据库;3根据不同的金融事件类型进行触发词设定,通过设定的触发词筛选出包含目标金融事件的文本;4对筛选后的长文本进行数据标注,形成可以训练事件抽取模型的数据集;5运用构造的数据集训练事件抽取模型,得到的事件抽取结果并检验数据集的效果。本发明通过上述方法,提供了一种发现包含设定类型事件的文本,减少数据标注的成本,为事件抽取提供优质数据集的数据预处理方法及系统。

本发明授权面向金融领域事件抽取的篇章级长文本数据预处理方法及系统在权利要求书中公布了:1.面向金融领域事件抽取的篇章级长文本数据预处理方法,其特征在于,包括以下步骤:1)选取金融事件类型,并根据不同的金融事件类型定义事件要素;2)从互联网上公开数据源获取各类金融事件的篇章级长文本类数据,并对文本类数据进行清洗,将清洗后数据格式转换成JSON格式,保存到MongoDB数据库;3)根据不同的金融事件类型进行触发词设定,通过设定的触发词筛选出包含目标金融事件的文本;4)对筛选后的文本进行数据标注,形成可以训练事件抽取模型的数据集;运用构造的数据集训练事件抽取模型,得到的事件抽取结果并检验数据集的效果;所述的步骤4)对筛选后的文本进行数据标注,形成可以训练事件抽取模型的数据集的过程如下:4.1)由于数据标注的需要,构建可以对金融文本类数据进行标注的数据标注平台;4.2)根据不同金融事件类型,在数据标注平台中构建不同的模块,每一个模块中包含对应金融事件类型所定义的事件要素;4.3)将触发后的类型相同的金融文本数据导入到相对应的金融事件类型模块中;4.4)对导入的文本数据进行标注,标注出该模块下定义的事件要素的具体内容;4.5)将标注后的数据结果导出,形成训练事件抽取模型的数据集。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人辽宁大学,其通讯地址为:110000 辽宁省沈阳市沈北新区道义南大街58号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。