买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中南大学湘雅医院
摘要:本发明公开了基于大模型的医疗科研数据交互式引导索引方法及系统。该基于大模型的医疗科研数据交互式引导索引方法,包括以下步骤:数据特征提取;模型构建;交互索引。本发明通过对收集的初始历史医疗科研数据进行预处理获取历史医疗科研数据,然后提取历史医疗科研数据的数据特征得到历史医疗科研数据特征,接着根据获取的历史医疗科研数据特征构建医疗科研数据索引模型,最后获取实时待查询内容并利用自然语言处理方法将实时待查询内容通过对话式界面与医疗科研数据索引模型进行交互得到交互结果并反馈给预设人员,达到了提高医疗科研数据交互式查找速率的效果,解决了现有技术中存在医疗科研数据交互式查找速率低的问题。
主权项:1.基于大模型的医疗科研数据交互式引导索引方法,其特征在于,包括以下步骤:S1,对收集的初始历史医疗科研数据进行预处理获取历史医疗科研数据,提取历史医疗科研数据的数据特征得到历史医疗科研数据特征,所述历史医疗科研数据特征表示历史医疗科研数据中具有索引功能的特征;S2,根据获取的历史医疗科研数据特征构建医疗科研数据索引模型,所述医疗科研数据索引模型用于对预设人员在预设时间段内的实时医疗科研数据进行数据挖掘和定位;S3,获取实时待查询内容并利用自然语言处理方法将实时待查询内容通过对话式界面与医疗科研数据索引模型进行交互得到交互结果并反馈给预设人员;所述将实时待查询内容通过对话式界面与医疗科研数据索引模型进行交互的具体步骤如下:将获取的实时待查询内容通过对话式界面输入至解析单元,所述实时待查询内容包括文本内容和语音内容,所述解析单元用于对实时待查询内容进行解析;利用自然语言处理方法对预设人员的实时待查询内容进行解析获取解析结果,并将解析结果发送给医疗科研数据索引模型;通过医疗科研数据索引模型对解析结果进行数据索引得到索引结果,所述索引结果包括文本索引结果和语音索引结果;将索引结果与相对应的阈值进行对比分析获取引导索引综合指数,若引导索引综合指数满足对应阈值,则将引导索引综合指数所对应的索引结果发送给对话式界面,否则重新进行数据索引,所述引导索引综合指数用于综合描述文本数值型匹配结果和语音数值型匹配结果的准确度;所述引导索引综合指数的具体获取方法如下:获取实时待查询内容的文本数值型匹配结果和语音数值型匹配结果相对应的文本数值型匹配指数和语音数值型匹配指数,并获取相对应的阈值和参考偏差,所述文本数值型匹配指数用于描述文本数值型与预设文本数值型的偏差,所述语音数值型匹配指数用于描述语音数值型与预设语音数值型的偏差;根据获取的数据计算实时待查询内容的引导索引综合指数,所述引导索引综合指数采用以下公式计算: 式中,e表示自然常数,f表示实时待查询内容的编号,f=1,2,...,F,F为实时待查询内容的总数量,SYf为第f个实时待查询内容的引导索引综合指数,WBf为第f个实时待查询内容的文本数值型匹配指数,WB0为文本数值型匹配指数的阈值,ΔWB为文本数值型匹配指数的参考偏差,YYf为第f个实时待查询内容的语音数值型匹配指数,YY0为语音数值型匹配指数的阈值,ΔYY为语音数值型匹配指数的参考偏差,μ0为文本数值型匹配指数的参考相对偏差;所述文本数值型匹配指数的具体获取方法如下:获取实时待查询内容的文本位置向量和文本密度;利用主成分分析方法获取文本权重并结合获取的文本位置向量和文本密度计算文本数值型匹配指数,所述文本权重包括位置向量权重和密度权重,所述位置向量权重用于描述文本位置向量相对于文本数值型匹配指数的影响程度,所述密度权重用于描述文本密度相对于文本数值型匹配指数的影响程度;所述文本数值型匹配指数采用以下公式计算: 式中,f.d表示第f个实时待查询内容的文本内容编号,f.d=f.1,f.2,...,f.D,f.D表示第f个实时待查询内容的文本内容的总数量,为第f个实时待查询内容的第f.d个文本内容的文本位置向量,为第f个实时待查询内容的第f.d个文本内容的参考文本位置向量,ρf为第f个实时待查询内容的文本密度,ρ0为参考文本密度,Δρ为参考文本密度偏差,a1为位置向量权重,a2为密度权重,α0为文本位置向量的参考相对偏差;所述语音数值型匹配指数的具体获取方法如下:获取实时待查询内容的语音信号系数,所述语音信号系数包括语音频率系数、语音幅度系数、语音短时能量系数和语音过零率系数,所述语音频率系数表示实时待查询内容的语音频率与对应阈值之差和对应阈值的比值,所述语音幅度系数表示实时待查询内容的语音幅度与对应阈值之差和对应阈值的比值,所述语音短时能量系数表示实时待查询内容的语音短时能量与对应阈值之差和对应阈值的比值,所述语音过零率系数表示实时待查询内容的语音过零率与对应阈值之差和对应阈值的比值;根据递阶层次结构构造判断矩阵,并利用数学方法对语音信号系数进行层次排序获取语音权重,所述层次排序用于描述判断矩阵中语音信号系数对于语音数值型匹配指数的权重,所述语音权重包括第一权重、第二权重、第三权重和第四权重;根据获取的语音信号系数和语音权重获取语音数值型匹配指数;所述语音数值型匹配指数采用以下公式计算: 式中,Vf为第f个实时待查询内容的语音频率系数,Af为第f个实时待查询内容的语音幅度系数,Ef为第f个实时待查询内容的语音短时能量系数,Pf为第f个实时待查询内容的语音过零率系数,b1为第一权重,b2为第二权重,b3为第三权重,b4为第四权重,β0为语音短时能量系数的阈值。
全文数据:
权利要求:
百度查询: 中南大学湘雅医院 基于大模型的医疗科研数据交互式引导索引方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。