神州医疗科技股份有限公司宋佳祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉神州医疗科技股份有限公司申请的专利一种基于关系抽取模型的样本优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114996472B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210581933.9,技术领域涉及:G06F16/36;该发明授权一种基于关系抽取模型的样本优化方法及系统是由宋佳祥;杨雅婷;许娟;朱宁;白焜太;刘硕设计研发完成,并于2022-05-26向国家知识产权局提交的专利申请。
本一种基于关系抽取模型的样本优化方法及系统在说明书摘要公布了:从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
本发明授权一种基于关系抽取模型的样本优化方法及系统在权利要求书中公布了:1.一种基于关系抽取模型的样本优化方法,其特征在于,包括如下步骤:步骤S1:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;步骤S2:构建已知实体的关系列表,即针对每两个已知实体进行排列组合,得到所有已知实体对,将所有已知实体对以及已知实体对之间的关系保存到关系列表中;步骤S3:根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;步骤S4:在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,即针对任一样本中每两个已标记实体进行排列组合,若负样本超出设定阈值,则阻止已标记实体与其他已标记实体进行组合,得到已标记实体之间的排列组合以及对应关系类型;所述在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,包括如下步骤:步骤S4.1:在任一样本中,针对任一样本中每两个已标记实体对进行排列组合;步骤S4.2:当已标记实体与实体进行排列组合时,识别二者之间在所述任一样本中是否存在关系;步骤S4.3:如果存在关系,则将该已标记实体之间的排列组合以及对应关系类型保存为正样本;步骤S4.4:如果不存在关系,判断此时在所述任一样本中负样本数量是否超过设定阈值;步骤S4.5:若超过设定阈值,则阻止所述该已标记实体与其他已标记实体进行组合;步骤S4.6:若未超过设定阈值,则允许所述已标记实体继续与其他已标记实体进行组合,并将该已标记实体之间的排列组合以及对应关系类型保存为负样本;步骤S5:直到新的训练样本集中的所有样本均经过步骤S4的阈值处理,得到最终的输入样本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人神州医疗科技股份有限公司,其通讯地址为:100080 北京市海淀区北四环西路66号16层1901室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。