首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于多组学的胃癌治疗疗效的预测模型训练、预测方法及系统_浙江大学_202310813707.3 

申请/专利权人:浙江大学

申请日:2023-07-04

公开(公告)日:2024-06-21

公开(公告)号:CN116862861B

主分类号:G06T7/00

分类号:G06T7/00;G06V10/25;G06V10/26;G06V10/764;G06V10/774;G16H50/20;G16H70/60;G01N1/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2023.10.27#实质审查的生效;2023.10.10#公开

摘要:本发明公开了一种基于多组学的胃癌治疗疗效的预测模型训练、预测方法及系统,包括获取样本图像集,数据包括CT图像和染色图像;对样本图像集中的每个图像进行ROI分割,获得病灶区域集;对病灶区域集中每个病灶区域进行特征提取,获取训练样本集;将训练样本集输入XGBoost预测模型进行训练,得到训练完成的XGBoost预测模型。本发明基于CT图像和染色图像获得影像组特征和病理学特征,将两个特征集输入XGBoost预测模型进行训练,从而提高预测模型的准确率。

主权项:1.一种基于多组学的胃癌治疗疗效的预测模型训练方法,其特征在于,包括:获取样本图像集,数据包括CT图像和染色图像;对所述样本图像集中的每个图像进行ROI分割,获得病灶区域集;对所述病灶区域集中每个病灶区域进行特征提取,获取训练样本集;将所述训练样本集输入XGBoost预测模型进行训练,得到训练完成的XGBoost预测模型;其中,对所述病灶区域集中每个病灶区域进行特征提取,获取训练样本集包括:采用Python软件利用开源工具包Pyradiomics包从所述CT图像提取影像组学特征;采用生物图像分析的开源应用程序CellProfiler从所述染色图像提取病理学特征;所述影像组学特征包括定性语义特征和定量非语义特征,所述定性语义特征包括病灶的形状和病灶性质,所述定量非语义特征是指借助算法从CT影像中提取出来的特征,其包括一阶统计特征、二阶纹理特征和高阶纹理特征;所述一阶统计特征包括体素的偏度、峰度、体素强度的最大值、中值、最小值、平均值、极差、标准差以及肿瘤最大轴长度、最短轴长度、伸长率、球形度、平面度、表面积、体积、体表面积比,所述二阶纹理特征包括灰度共生矩阵、灰度游程长度矩阵、灰度尺寸区域矩阵、邻域灰度差矩阵和灰度依赖矩阵,所述高阶纹理特征为滤波器过滤后特征;采用生物图像分析的开源应用程序CellProfiler从所述染色图像提取病理学特征包括:去除所述染色图像中无组织空白区域;对所述染色图像进行色彩标准化处理;将所述染色图像均匀切成小分块;通过所述应用程序CellProfiler中的“UnmixColors”模块对小分块的所述染色图像进行颜色分离;通过所述应用程序CellProfiler中的“IdentifyPrimaryObjects”模块分割识别组织中的细胞核和细胞质;通过所述应用程序CellProfiler中的“ObjectIntensityDistribution”、“ObjectIntensity”、“Texture”和“ObjectSizeShape”模块,提取了细胞形状、大小、组织纹理和图片像素强度分布的定量图像特征;将所有小分块的每个特征维度的最小值、25%分位数、75%分位数和最大值聚合为所述染色图像的特征;对所述特征采用组内和组间相关系数筛选出可重复性好的稳定特征,并采用嵌入式的LASSO算法筛选出所述特征数量;所述XGBoost预测模型公式为: 式中:obj*为预测值;Gj和Hj分别为第j个节点所有样本的一阶导和二阶导的求和;T为决策树中叶子节点的个数;γ和λ分别为正则项系数;Gj和Hj的公式分别为: 式中:yi为实际值;l为损失函数;为预测值;k为第k棵树; 的公式为: 式中:为预测值;xi为训练样本集中的特征;fkxi为第k棵树对样本xi的预测结果。

全文数据:

权利要求:

百度查询: 浙江大学 一种基于多组学的胃癌治疗疗效的预测模型训练、预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。