买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:顺通信息技术科技(大连)有限公司;哈尔滨医科大学附属第一医院
摘要:本发明涉及数据处理技术领域,具体涉及基于大数据的口腔癌病历数据分析方法,包括:采集若干患者的口腔癌病历数据,得到每个维度的若干指标数据;得到不同维度的数据优选程度;得到口腔癌病历数据的协方差矩阵、若干特征值及特征向量、以及所有的主成分和每个主成分的累计贡献率;得到每个主成分在每个维度的数据因子载荷量;得到每个维度的数据异常程度;得到每个维度的指标数据变化对治疗方案的影响程度;得到每个维度的数据重要性;得到患者之间的病历相似度;获得每个患者的若干参考口腔癌病历数据。本发明通过数据异常程度及其对治疗方案的影响计算数据的重要性,能够准确地得到不同维度数据的重要性。
主权项:1.基于大数据的口腔癌病历数据分析方法,其特征在于,该方法包括以下步骤:采集若干患者的口腔癌病历数据,得到每个维度的若干指标数据;根据不同维度的指标数据之间的相关性,得到不同维度的数据优选程度;根据所有患者的口腔癌病历数据,得到口腔癌病历数据的协方差矩阵、若干特征值及特征向量、以及所有的主成分和每个主成分的累计贡献率;根据每个主成分的累计贡献率,得到优选主成分;根据口腔癌病历数据的协方差矩阵、特征值及特征向量,得到每个主成分在每个维度的数据因子载荷量;根据每个主成分在每个维度的数据因子载荷量和每个维度的数据优选程度,得到每个优选主成分的异常程度;根据每个主成分在每个维度的数据因子载荷量和每个优选主成分的异常程度,得到每个维度的数据异常程度;根据每个维度的指标数据,得到除每个维度的指标数据外其它维度下患者的口腔癌病历数据的距离度量;根据患者的口腔癌病历数据的距离度量进行聚类,得到每个维度的所有参考聚类簇;根据每个维度的每个参考聚类簇中的指标数据,得到每个维度的指标数据变化对治疗方案的影响程度;根据每个维度的数据优选程度、数据异常程度和每个维度的指标数据变化对治疗方案的影响程度,得到每个维度的数据重要性;根据每个维度的数据重要性,得到患者之间的病历相似度;根据患者之间的病历相似度,获得每个患者的若干参考口腔癌病历数据;所述根据不同维度的指标数据之间的相关性,得到不同维度的数据优选程度,包括的具体步骤如下:将任意一个维度记为参考维度;获得参考维度与除参考维度外的每个维度的皮尔逊相关系数以及参考维度的峰度和偏度;根据参考维度与除参考维度外的每个维度的皮尔逊相关系数以及参考维度的峰度和偏度,得到每个维度的数据优选程度的具体计算公式如下: 其中,表示参考维度的数据优选程度,为维度总数量,表示除参考维度外的第个维度的次序值,为参考维度与第个维度的皮尔逊相关系数,为参考维度的指标数据的峰度,为参考维度的指标数据的偏度,为绝对值函数;所述根据口腔癌病历数据的协方差矩阵、特征值及特征向量,得到每个主成分在每个维度的数据因子载荷量,包括的具体计算公式为: 其中,表示第个主成分在第个维度的数据因子载荷量,为从大到小排序的第个特征值,为协方差矩阵的第行第列元素,为第个特征向量中第个元素。
全文数据:
权利要求:
百度查询: 顺通信息技术科技(大连)有限公司 哈尔滨医科大学附属第一医院 基于大数据的口腔癌病历数据分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。