买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华中科技大学
摘要:一种基于Rocchio算法的甲状腺超声特征肿瘤分级系统,属于自然语言处理下的文本分类领域,本发明利用Rocchio算法识别生物医学命名实体,再通过映射关系对甲状腺TI‑RADS分级进行匹配,从而对甲状腺肿瘤进行分级,起到辅助诊断的作用。医生在诊断甲状腺患者的过程中,可利用该系统自动导入甲状腺及颈部淋巴结彩超报告,通过训练好的Rocchio算法模型和已命名生物医学实体实现肿瘤分级功能,从而帮助医生快速深入了解患者甲状腺肿瘤细节,提高诊断水平。同时,桌面端系统所具备的稳定性对医疗临床每日大批数据的处理也具有一定的适用性。
主权项:1.一种基于Rocchio算法的甲状腺超声特征肿瘤分级系统,其特征在于:包括可自动识别医学实体名词的文本信息提取模块、将文本信息提取模块梳理后进行分级特征对比的信息匹配模块、根据比对结果输出彩超分级结果的诊断分析模块和将分级信息返回桌面端,显示所有结论的显示模块;所述文本信息提取模块的提取,包括如下步骤:S1、医学实体特征提取:使用PorterStemming算法对甲状腺ThyroidImagingReportingDataSystemTI-RADS™分级指南中涉及医学实体名词进行分析,判定特征词赋值表内容为:A.形态大小正常、B.形态失常、C.形态不规则、D.实质回声不均、E.内回声不均、F.低回声区、G.强回声光斑、H.异常回声、I.边界不清、J.肿大淋巴结血流信号,并使用停止列表删除最常见的功能词;S2、特征权重赋值:基于文本特征一维正态分布形式及TermFrequency-InverseDocumentFrequency公式共同计算特征权值: ,其中S为文档总数,为出现词的文档数,为每万人内甲状腺疾病患者比例,与分别代表甲状腺疾病患者内不同等级患者占比的最大值和最小值;S3、文本术语向量化:利用将待分类及标准文档向量化,则代表待分类文档属于不属于,为可调参数;S4、归一化处理:先使用该公式分别将文本信息范围进行限制;,其中为明确医学实体名词频数,min和max分别代表了该词的最小\大词频,之后使用以下公式计算待分类文本与标准文本归一化的相似度:,和分别是待分类和标准文档的第和个医学实体词权值,是矩阵Q的第ij个对角线元素;S5、文本分类:上述步骤已将彩超报告的文本信息抽象成向量化的样本集,将其与训练好的模板文件进行相似度计算,重复计算直至分到相应的类别中。
全文数据:
权利要求:
百度查询: 华中科技大学 一种基于Rocchio算法的甲状腺超声特征肿瘤分级系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。