首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种病历文本对应标签的获取系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:奇点智保(北京)科技有限公司

摘要:本发明涉及一种病历文本对应标签的获取系统,涉及文本处理技术领域,系统包括:目标病历文本获取模块用于获取目标病历文本列表,候选数据处理模块用于将目标病历文本列表输入至目标模型中,获取候选标签列表集和候选标签列表集对应的候选匹配度列表集,目标优先级获取模块用于根据候选匹配度列表集,获取目标病历文本列表对应的目标优先级列表,目标标签获取模块用于根据目标优先级列表,获取目标病历文本列表对应的目标标签,本发明利用模型获取病历文本对应的标签,对基于模型获取到的标签和标签对应的优先级对模型进行判断,从而采用不同的方式获取到病历文本对应的目标标签,提高了获取到目标标签的准确性。

主权项:1.一种病历文本对应标签的获取系统,其特征在于,所述系统包括:目标病历文本获取模块,用于获取目标病历文本列表L={L1,……,Lg,……,Lh},Lg为第g个目标病历文本,g=1……h,h为目标病历文本的数量,其中,所述目标病历文本为将待获取标签的原始病历文本按照预设分隔符进行拆分后获取到的病历文本;候选数据处理模块,用于将L输入至目标模型中,获取L对应的候选标签列表集P={P1,……,Pg,……,Ph}和P对应的候选匹配度列表集Q={Q1,……,Qg,……,Qh},其中,Pg={Pg1,……,Pgd,……,Pgv(g)},Qg={Qg1,……,Qgd,……,Qgv(g)},Pg为Lg对应的候选标签列表,Pgd为Lg对应的候选标签列表中第d个候选标签,Qgd为Pgd对应的候选匹配度,d=1……v(g),v(g)为Lg对应的候选标签列表中候选标签的数量,所述目标模型为将目标病历文本与预设标签列表中预设标签进行匹配的模型,所述候选标签为基于目标模型从预设标签列表中获取到的与目标病历文本相匹配的预设标签,所述候选匹配度为基于目标模型获取到的目标病历文本与预设标签之间的匹配程度,所述预设标签为对产生疾病的用户身体进行处理过程中过程节点对应的词;目标优先级获取模块,用于获取L对应的目标优先级列表L0={L01,……,L0g,……,L0h},L0g为Lg对应的目标优先级,其中,L0g符合如下条件: ;目标标签获取模块,用于获取L对应的目标标签列表R={R1,……,Rg,……,Rh},Rg为Lg对应的目标标签,其中,所述目标标签获取模块还包括:第一候选模块,用于确认当L0g≥E0时,获取Lg对应的目标标签Rg为Pgd,其中,Qgd为Qg中最大的候选匹配度,E0为预设的目标优先级阈值;第二候选模块,用于确认当L0g<E0时,对Lg进行处理以获取到Rg,其中,所述第二候选模块还包括:目标病历文本簇获取模块,用于获取目标病历文本簇列表H={H1,……,Hω,……,Hψ},Hω为第ω个目标病历文本簇,ω=1……ψ,ψ为目标病历文本簇的数量,其中,所述目标病历文本簇获取模块还包括:第一执行模块,用于获取样本病历文本向量集Y={Y1,……,Yε,……,Yz},Yε为第个样本病历文本向量,ε=1……z,z为样本病历文本向量的数量;第二执行模块,用于获取优选病历文本向量列表集G={G1,……,Gt,……,Gk1},Gt为第t个优选病历文本向量列表,t=1……k1,k1为优选病历文本向量列表的数量;第三执行模块,用于根据Y和G,获取Y对应的第一相似度列表集W1={W11,……,W1ε,……,W1z},W1ε={W1ε1,……,W1εt,……,W1εk1},W1εt为Yε与Gt之间的第一相似度;第四执行模块,用于基于W1,获取第一中间病历文本向量簇列表J1={J11,……,J1t,……,J1k1},其中,所述第四执行模块还包括:第一指定模块,用于执行当W1ε为W1中最小的第一相似度时,将Yε插入至Gt中;第二指定模块,用于根据Gt,获取G对应的第一中心点向量列表G1={G11,……,G1t,……,G1k1},G1t为Gt对应的第一中心点向量;第三指定模块,用于重复执行第一指定模块至第二指定模块所执行的步骤,获取J1t;第五执行模块,用于重复执行第一执行模块至第四执行模块所执行的步骤,获取第二中间病历文本向量簇集J={J1,……,Jα,……,Jβ},Jα={Jα1,……,Jαc,……,Jαkα},Jα为第α个第二中间病历文本向量簇列表,Jαc为第α个第二中间病历文本向量簇列表中的第c个第二中间病历文本向量簇,c=1……kα,kα为第α个第二中间病历文本向量簇列表中第二中间病历文本向量簇的数量,α=1……β,β为第二中间病历文本向量簇的数量;第六执行模块,用于根据J,获取H,其中,所述第六执行模块还包括:病历文本向量获取模块,用于获取Jαc中的第一指定病历文本向量KJαc和Jαc对应的第二指定病历文本向量列表LJαc={LJαc1,……,LJαcμ,……,LJαcζ},LJαcμ为Jαc对应的第μ个第二指定病历文本向量,μ=1……ζ,ζ为第二指定病历文本向量的数量;指定病历文本向量获取模块,用于获取Jαc对应的第三指定病历文本向量列表EJα={EJαc1,……,EJαcσ,……,EJαcρ},EJαcσ为Jαc对应的第σ个第三指定病历文本向量,σ=1……ρ,ρ为第三指定病历文本向量的数量;第一指定相似度获取模块,用于根据KJαc和LJαc,获取第一指定相似度列表FJαc={FJαc1,……,FJαcμ,……,FJαcζ},其中,FJαcμ为KJαc和LJαcμ之间的相似度;第二指定相似度获取模块,用于根据KJαc和EJα,获取第二指定相似度列表BJα={BJαc1,……,BJαcσ,……,BJαcρ},其中,BJαcσ为KJαc和EJασ之间的相似度;目标数据处理模块,用于根据FJαc和BJα,确认第二中间病历文本向量簇列表,其中,当FRJαc为最小值且FTJαc为最大值时,获取Jα对应的第二中间病历文本向量簇列表为H,其中,FRJαc=(FJαc1+……+FJαcμ+……+FJαcζ)ζ,FTJα=(BJαc1+……+BJαcσ+……+BJαcρ)ρ;目标关键词获取模块,用于获取H对应的目标关键词列表DH={DH1,……,DHω,……,DHψ},DHω为Hω对应的目标关键词;指定标签获取模块,用于根据DH和H,获取H对应的指定标签列表SH={SH1,……,SHω,……,SHψ},SHω为Hω对应的指定标签;目标相似度获取模块,用于根据H,获取Lg对应的目标相似度列表HLg={HLg1,……,HLgω,……,HLgψ},HLgω为Lg对应的向量与Hω对应的向量之间的相似度;目标数据获取模块,用于根据HLg,确定Rg,其中,当HLgω为HLg中最大的目标相似度时,获取Rg为SHω。

全文数据:

权利要求:

百度查询: 奇点智保(北京)科技有限公司 一种病历文本对应标签的获取系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。