首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种中医典籍知识库反馈修正方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京大经中医药信息技术有限公司

摘要:本发明提供了一种中医典籍知识库反馈修正方法及系统,涉及数据处理技术领域,包括:获取基于多本中医典籍构建的中医知识库,包括多个典籍词和多个知识词的映射关系,构建中医典籍词袋,对多个知识词进行聚类,获得多个样本病症的多个知识聚类结果,获取多个知识词向量簇,训练中医典籍识别器,对多个典籍词进行识别,并进行聚类,获取多个典籍词向量簇,计算获取多个匹配度,决策获取对多个知识聚类结果内的知识词进行修正的修正等级,进行反馈。本发明解决了传统的中医典籍知识库存在对于中医典籍中部分词的理解不准,导致知识库的准确率较低、质量较差的技术问题。

主权项:1.一种中医典籍知识库反馈修正方法,其特征在于,所述方法包括:获取基于多本中医典籍构建的中医知识库,所述中医知识库内包括多个典籍词和多个知识词的映射关系;基于所述中医知识库,构建中医典籍词袋;按照多个样本病症和多个样本症状集的索引关系,对多个知识词进行聚类,获得多个样本病症的多个知识聚类结果,并基于所述中医典籍词袋,获取多个知识词向量簇;训练中医典籍识别器,对所述多个典籍词进行识别,并按照多个样本病症和多个样本症状集的索引关系,进行聚类,获取多个样本病症的多个典籍词向量簇;根据所述多个典籍词向量簇和多个知识词向量簇,计算获取多个匹配度,其中,每个匹配度基于数量匹配度和向量匹配度计算;根据多个匹配度,决策获取对多个知识聚类结果内的知识词进行修正的修正等级,进行反馈;其中,训练中医典籍识别器,具体步骤包括:基于预设时间范围内的中医知识库调用数据,获取所述多个样本病症的知识词的调用次数;基于多个调用次数,分配对多个样本病症对应的典籍识别分支进行训练的多个训练资源,每个训练资源内包括典籍识别通道的训练数量;基于中医典籍翻译数据,按照所述多个样本病症,划分获取多个样本典籍词集合和多个样本知识词集合;分别采用所述多个样本典籍词集合和多个样本知识词集合作为训练数据,按照多个训练资源,训练获取多个典籍识别分支,获得所述中医典籍识别器;采用所述中医典籍识别器,对所述多个典籍词进行识别,获得多个识别结果集,选择每个识别结果集内出现频率最大的知识词,获得多个标准知识词;对多个标准知识词进行聚类,结合中医典籍词袋,获得多个典籍词向量簇;根据多个匹配度,决策获取对多个知识聚类结果内的知识词进行修正的修正等级,进行反馈,具体步骤包括:基于中医典籍知识库的修正数据记录,获取多个样本匹配度;基于每个样本匹配度与多个样本匹配度的均值的比值,评估获取多个样本修正等级;采用多个样本匹配度作为决策输入,采用多个样本修正等级作为决策输出,基于决策树,构建反馈修正分类器;采用所述反馈修正分类器,对所述多个匹配度进行决策分类,获得多个修正等级。

全文数据:

权利要求:

百度查询: 南京大经中医药信息技术有限公司 一种中医典籍知识库反馈修正方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。