首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于多源数据融合的智慧医疗数据智能管理方法_山东金卫软件技术有限公司_202410217537.7 

申请/专利权人:山东金卫软件技术有限公司

申请日:2024-02-28

公开(公告)日:2024-05-10

公开(公告)号:CN117789907B

主分类号:G16H10/60

分类号:G16H10/60;G16H50/70;G06F18/22;G06F18/23;G06F18/24;G06F18/25

优先权:

专利状态码:有效-授权

法律状态:2024.05.10#授权;2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明涉及病历数据管理技术领域,具体涉及一种基于多源数据融合的智慧医疗数据智能管理方法。首先获取多种病症的病历样本数据以及待管理病历数据,并使用词袋模型提取特征向量和特征词汇频次用于初始聚类。通过分析初始聚类簇中样本数量分布和特征词汇频次差异,确定特征词汇的参考价值。基于参考价值筛选出参考词汇后,以各参考词汇出现频次为依据再次进行聚类,得到聚类结果。分析此时聚类簇中不同病症样本数量,计算参考词汇对应的判错概率。最终结合参考词汇的参考价值与对应的判错概率,得到参考词汇的影响权重,并依据影响权重确定待管理病历数据所属的病症类型,提高了分类准确性和管理效率。

主权项:1.一种基于多源数据融合的智慧医疗数据智能管理方法,其特征在于,所述方法包括:获取多源病历数据,其中所述多源病历数据包括至少两种病症的病历样本数据以及待管理病历数据;基于词袋模型对所有的病历样本数据以及待管理病历数据进行融合分析,获取每个样本数据和待管理病历数据的特征向量以及每种特征词汇的出现频次;根据所有样本数据的特征向量之间的差异情况,以及每种特征词汇的出现频次之间的差异情况对所有样本数据进行聚类分析,得到初始聚类簇;根据各个初始聚类簇中不同病症的样本数据的数量分布情况,以及初始聚类簇中的样本数据在同种特征词汇下的出现频次的差异情况,得到每种特征词汇对样本数据分类的参考价值;根据所有特征词汇的参考价值筛选参考词汇;任选一种参考词汇作为待分析词汇,根据所有样本数据的待分析词汇的出现频次对所有样本数据进行聚类分析,得到待分析聚类簇;根据各个待分析聚类簇中不同病症的样本数据的数量分布情况,计算待分析词汇对应的判错概率;根据待分析词汇对应的判错概率以及待分析词汇的参考价值,获得待分析词汇的影响权重;根据待管理病历数据与标准病历数据在每种参考词汇下出现频次以及每种参考词汇对应的影响权重,对待管理病历数据进行归类管理;所述初始聚类簇的获取方法包括:根据所有样本数据的特征向量之间的差异情况以及每种特征词汇的出现频次之间的差异情况,获得每个样本数据的区别特征值;根据所有样本数据的区别特征值对所有样本数据进行层次聚类,得到所有初始聚类簇,其中,层次聚类采用凝聚层次聚类;所述区别特征值的获取方法包括:任选一个样本数据作为待测样本数据,将除待测样本数据外的其他样本数据作为对比样本数据;在待测样本数据和每个对比样本数据中,将出现频次均大于预设常数的同种特征词汇作为目标词汇,并计算所有种类的目标词汇在待测样本数据和每个对比样本数据中的出现频次差异的均值,作为待测样本数据与每个对比样本数据的差异因子;将待测样本数据与每个对比样本数据的特征向量的余弦相似度进行负相关映射后的值,与待测样本数据与每个对比样本数据的差异因子相乘后的值进行归一化操作,得到待测样本数据与每个对比样本数据的区别因子;将待测样本数据与所有对比样本数据的区别因子的均值作为待测样本数据的区别特征值;所述每种特征词汇对样本数据分类的参考价值的获取方法包括:在每个初始聚类簇中,统计每类病症的样本数据数量,根据每类病症的样本数量与初始聚类簇中剩余样本数据数量获得每类病症的样本数据对应的相对数量占比,所述相对数量占比与每类病症的样本数据数量呈正相关,所述相对数量占比与剩余样本数据数量呈负相关;将所有种类病症的相对数量占比的和值进行归一化后的值作为每个初始聚类簇的分类效果值;将分类效果值小于预设效果阈值的初始聚类簇作为第一聚类簇,将分类效果值大于或等于预设效果阈值的初始聚类簇作为第二聚类簇;根据所有第一聚类簇的分类效果值、所有第一聚类簇中的样本数据在每种特征词汇下的出现频次的差异情况以及样本数据之间的区别因子,得到每种特征词汇对应的第一价值因子;根据所有第二聚类簇之间每种特征词汇的出现频次差异情况,得到每种特征词汇对应的第二价值因子;将每种特征词汇对应的第一价值因子和第二价值因子的和值进行归一化后的值,作为每种特征词汇对样本数据分类的参考价值;所述待分析词汇对应的判错概率的获取方法包括:在每个待分析聚类簇中,统计每类病症的样本数据数量,根据每类病症的样本数量与待分析聚类簇中剩余样本数据数量获得每类病症的样本数据对应的相对数值占比,所述相对数值占比与每类病症的样本数据数量呈负相关,所述相对数值占比与剩余样本数据数量呈正相关;将所有种类病症的相对数值占比进行累加后的值作为每个待分析聚类簇的判错因子;将所有待分析聚类簇的判错因子的和值作为待分析词汇对应的判错概率。

全文数据:

权利要求:

百度查询: 山东金卫软件技术有限公司 基于多源数据融合的智慧医疗数据智能管理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。