买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州古珀医疗科技有限公司
摘要:本发明公开了一种离院医嘱信息提取和标准化方法和装置,包括:基于种子术语从离院医嘱文本中匹配并标注初始实体术语作为提取式样本;构建包含提取式模型和生成式模型的训练框架,并迭代进行以下实现提取任务的交替增强训练过程;基于多轮对话机制对经过交替增强训练后的生成式模型进行标准化任务的多轮对话增强训练;利用经过多轮对话增强训练后的生成式模型采用多轮对话方式进行离院医嘱信息的提取和标准化,这样通过交替式增强训练来提高生成式模块提取实体术语的准确性,通过多轮对话机制训练来提高生成式模块标准化处理的准确性和效率。
主权项:1.一种离院医嘱信息提取和标准化方法,其特征在于,包括以下步骤:基于种子术语从离院医嘱文本中匹配并标注初始实体术语作为提取式样本;构建包含提取式模型和生成式模型的训练框架,并迭代进行以下提取任务的交替增强训练过程:利用提取式样本训练提取式模型,并利用训练后的提取式模型从离院医嘱文本中提取实体术语作为生成式样本,利用生成式样本训练生成式模型,并利用训练后的生成式模型从离院医嘱文本中提取实体术语作为下一轮的提取式样本;基于多轮对话机制对经过交替增强训练后的生成式模型进行标准化任务的多轮对话增强训练,包括:利用生成式模型从离院医嘱文本提取待标准化实体术语,并为待标准化实体术语匹配候选标准实体术语,将待标准化实体术语、候选标准实体术语、以及离院医嘱文本输入至生成式模型进行标准化处理得到标准化实体术语,并构建损失函数来训练生成式模型;其中,在基于多轮对话机制进行多轮对话增强训练时,为待标准化实体术语、候选标准实体术语、离院医嘱文本、以及标准化实体术语均添加用于标识的唯一token字符,以为构建损失函数时准确选择待标准化实体术语和标准化实体术语,基于提取的待标准化实体术语与待标准化实体术语真值来构建交叉熵损失,同时基于生成的标准化实体术语与标准化实体术语真值来构建交叉熵损失,基于两个交叉熵损失来训练生成式模型;利用经过多轮对话增强训练后的生成式模型采用多轮对话方式进行离院医嘱信息的提取和标准化。
全文数据:
权利要求:
百度查询: 杭州古珀医疗科技有限公司 一种离院医嘱信息提取和标准化方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。