恭喜宁波博登智能科技有限公司赵捷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜宁波博登智能科技有限公司申请的专利一种基于角色驱动的医疗文本数据合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119646164B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510162116.3,技术领域涉及:G06F16/3329;该发明授权一种基于角色驱动的医疗文本数据合成方法是由赵捷;邬松渊设计研发完成,并于2025-02-14向国家知识产权局提交的专利申请。
本一种基于角色驱动的医疗文本数据合成方法在说明书摘要公布了:本发明公开了一种基于角色驱动的医疗文本数据合成方法,涉及文本数据合成和人工智能技术领域,包括以下步骤:S100、原始问题生成;S200、原始问题筛选;S300、医疗文本数据合成。本发明角色描述和兴趣内容生成,增强了对不同医疗角色需求的适应性,利用文本编码模型和向量数据库,实现语义去重和相关性评估,去除语义重复的内容,利用大语言模型精确评估相关性,提高数据质量和多样性,通过变体问题和答案生成,丰富了医疗文本数据的多样性和实用性。本发明提高了医疗文本数据的个性化与针对性,增强了医疗文本数据的质量与去重效率,丰富了问题类型,优化了生成内容,全面覆盖了医疗文本数据的各种信息需求。
本发明授权一种基于角色驱动的医疗文本数据合成方法在权利要求书中公布了:1.一种基于角色驱动的医疗文本数据合成方法,其特征在于,包括如下步骤:S100、原始问题生成,解析收集的医疗信息文档,提取关键信息片段,根据预设医疗角色的职业和关注点,生成角色描述,基于所述角色描述对所述关键信息片段生成原始兴趣内容并进行语义去重,生成兴趣内容并进行分类,使用大语言模型生成原始问题;包括:S110、医疗信息文档解析,使用文档解析器拆分所述收集的医疗信息文档,提取关键信息片段;S120、兴趣内容生成,根据预设医疗角色的职业和关注点,生成角色描述,基于所述角色描述对所述关键信息片段生成原始兴趣内容;S130、兴趣内容语义去重,使用文本编码模型和向量数据库对所述原始兴趣内容进行编码并去除语义重复的内容,获得去重后的原始兴趣内容,得到兴趣内容并保存到所述向量数据库;S140、兴趣内容分类,根据预设的问题类型,结合问题类型分类提示词,使用所述大语言模型对所述兴趣内容进行分类;S150、原始问题生成,根据所述兴趣内容分类和所述角色描述,结合原始问题生成提示词,使用所述大语言模型生成原始问题;S200、原始问题筛选,对所述原始问题进行语义去重,获得原始生成问题,对所述原始生成问题与所述兴趣内容进行相关性评估和筛选,得到生成问题,利用所述大语言模型对所述生成问题进行改写并进行泛化性问题筛选,得到针对性生成问题;S300、医疗文本数据合成,通过所述角色描述,利用所述大语言模型对所述针对性生成问题和所述兴趣内容进行改写,生成变体问答,利用所述大语言模型和重排序模型,对所述变体问答进行评分和筛选,合成医疗文本数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人宁波博登智能科技有限公司,其通讯地址为:315100 浙江省宁波市高新区宁波新材料创新中心东区2幢22号5-1-1室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。