【摘要】目的:研究计算机断层扫描(computed tomography,CT)影像组学的集成学习模型和融合模型方法模型在术前预测肝细胞癌 (hepatocellular carcinoma,HCC)患者的微血管侵犯(microvascular invasion,MVI)状态的应用价值。方法:选取广西医科大学附属肿瘤医 院 2017 年 1—12 月收治的孤立性 HCC 患者 218 例。通过 ITK-SNAP 软件勾画 CT 资料静脉期的肝脏肿瘤边缘,使用 Python(3.8.1)提取影 像组学特征,采用 t 检验,最小绝对收缩、算子回归算法和梯度下降树进行影像组学特征筛选。最后使用 6 种集成学习算法构建预测模型, 并通过模型融合的方法构建了基于 6 种模型的融合预测模型。结果:共提取出组学特征 1 046 个,经过 t 检验,最小绝对收缩和算子回归和 梯度下降树筛选出 10 个最重要影像组学特征。基于 10 个特征构建的梯度提升决策树、随机森林、极端梯度提升算法、极端随机树、轻梯度 提升算法、自适应增强算法模型在验证集的曲线下面积(area under curve,AUC)值分别为 0.79、0.81、0.80、0.78、0.76 和 0.77,6 种集 成学习模型之间预测结果差异无统计学意义(P > 0.050)。基于 6 种集成模型的融合模型预测验证集 MVI 的 AUC 值最高为 0.89,预测结 果与 6 种集成模型差异均有统计学意义(P < 0.05)。结论:集成学习算法在 HCC 影像组学特征具有术前预测 MVI 的潜力,且多模型的融 合模型显著提升了预测性能,在 MVI 预测上具有较高的诊断价值。
【关键词】肝细胞癌;微血管侵犯;影像组学;CT;集成学习;模型融合