申请/专利权人:中国科学技术大学
申请日:2024-01-22
公开(公告)日:2024-06-07
公开(公告)号:CN118155785A
主分类号:G16H10/60
分类号:G16H10/60;G16H50/70;G06N5/04;G06N5/025;G06N3/045
优先权:
专利状态码:在审-公开
法律状态:2024.06.07#公开
摘要:本发明提供了一种面向医患自由对话的电子病历自动生成方法及装置,其方法包括:对公开的中文医患对话数据集进行病历标注,生成用于医学知识嵌入的预训练数据集;对医院收集的医患对话文本进行病历标注,得到与真实医学场景对齐的微调数据集;搭建基于中文语料预训练模型的开源大语言模型,并在医疗知识预训练数据集上进行二次预训练,得到嵌入医学知识的大语言模型;利用真实场景医患对话到病历的数据进行大语言模型微调训练;将病历生成提示连同医患对话文本一起输入训练后的大语言模型,进行电子病历生成,得到基于医患对话内容的病历生成结果。本发明减轻医生手动录入的负担,提高工作效率,提高诊断效果,生成更加准确和专业的电子病历。
主权项:1.一种面向医患自由对话的电子病历自动生成方法,其特征在于,所述方法包括以下步骤:步骤101:利用ChatGPT模型对公开的中文医患对话数据集进行病历标注再经由专业医生审核修改,生成用于医学知识嵌入的预训练数据集;步骤102:在医院收集日常医患对话文本,再对该对话文本标注真实场景医生写的病历文本,得到对话文本与真实医学场景对齐的微调数据集;步骤103:搭建基于中文语料预训练模型的开源大语言模型,并利用步骤101得到的预训练数据集对开源大语言模型进行二次预训练,得到嵌入医学知识的大语言模型;步骤104:根据步骤103得到的嵌入医学知识的大语言模型,利用步骤102的微调数据集对嵌入医学知识的大语言模型进行微调训练;步骤105:获取真实场景的医患对话文本,将病历生成指令连同对话文本一起输入微调训练后的大语言模型,大语言模型进行电子病历生成,得到基于医患对话内容的病历生成结果。
全文数据:
权利要求:
百度查询: 中国科学技术大学 一种面向医患自由对话的电子病历自动生成方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。