首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种循证医学的中成药物临床数据整合分析方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京康众时代医药科技集团有限公司

摘要:本发明涉及医学数据分析领域,尤其涉及一种循证医学的中成药物临床数据整合分析方法,本发明通过设置若干属于不同医学领域的样本数据库,对目标文献进行筛选时通过拆解分析的方式将目标文献拆分为若干文本片段,识别各片段的语义倾向类别,以不同提取逻辑对文本片段进行提取,进而考虑文本片段语义模糊以及语义不明确的情况,并适应性调整提取逻辑,进而提高文献筛选的精度,保证文本片段语义模糊时的识别精度,减少遗漏关键特征,保证对文献筛选的可靠度。

主权项:1.一种循证医学的中成药物临床数据整合分析方法,其特征在于,包括:步骤S1,预先构建若干用以存储不同医学领域文本数据的样本数据库,其中,单个样本数据库仅存储单个医学领域的文本数据;步骤S2,选定目标关键词,对各目标文献进行拆解分析,包括,根据目标文献的标题关键词与各样本数据库的数据库关联度选取用以计算关联度的参照样本数据库;将目标文献拆分为若干文本片段,根据文本片段中各关键词与目标关键词关联度的平均值以及各关键词之间关联度的差异计算语义倾向分散系数,分析文本片段的语义倾向类别;步骤S3,根据文本片段的语义倾向类别选定对文本片段的提取方式,若所述文本片段为明确倾向类别,确定倾向关键词,根据倾向关键词与目标关键词的关联度判定文本片段是否符合提取标准,以提取对应文本片段;若所述文本片段为模糊倾向类别,确定所述文本片段的邻接文本片段,根据各邻接文本片段的语义倾向类别选择表征关键词的提取方式,根据所述文本片段中各关键词与所提取表征关键词关联度确定模糊倾向关键词,基于所述模糊倾向关键词与目标关键词的关联度判定所述文本片段是否符合提取标准,以提取对应文本片段;步骤S4,记录并存储所提取的文本片段;所述步骤S2中,根据公式(1)计算语义倾向分散系数, 公式(1)中,C表示语义倾向分散系数,Ei表示第i个关键词与剩余关键词关联度的平均值,n表示关键词数量,Em表示各关键词与目标关键词关联度的平均值,Em0表示预设的关联度参照阈值,i为大于0的整数;所述步骤S2中,分析文本片段的语义倾向类别的过程包括,若所述语义倾向分散系数大于或等于预设的语义倾向对比阈值,则判定所述文本片段为明确倾向类别;若所述语义倾向分散系数小于预设的语义倾向对比阈值,则判定所述文本片段为模糊倾向类别;所述步骤S3中,确定倾向关键词的过程包括,逐个确定关键词与参照样本数据库中各关键词的最大关联度并降序排列,由数列首端选取预定数量的最大关联度,将对应关键词确定为倾向关键词;所述步骤S3中,根据各邻接文本片段的语义倾向类别选择表征关键词的提取方式,其中,若存在邻接文本片段属于明确倾向类别,则仅提取邻接文本片段中的倾向关键词作为表征关键词;若各邻接文本片段均不属于明确倾向类别,则获取邻接文本片段中各关键词间的关联度,提取最大关联度对应的各关键词作为表征关键词;所述步骤S3中确定模糊倾向关键词的过程包括,计算所述文本片段中各所述关键词与各表征关键词的关联度平均值并降序排列,提取数列首端的预定数量的关联度平均值,将对应的关键词确定为模糊倾向关键词。

全文数据:

权利要求:

百度查询: 北京康众时代医药科技集团有限公司 一种循证医学的中成药物临床数据整合分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。