【摘要】目的:利用多模态临床特征与机器学习技术,对甲状腺结节(TN)进行良恶性分类。方法:收集 2018 年 1 月—2022 年 12 月共 2 976 例 TN 患者的超声报告、疾病和人口学数据,利用基于规则的自然语言处理技术结构化超声报告特征,联合疾病和人口学信息,提取特征输入机器学习分类器,诊断 TN 良恶性,并使用 SHAP 方法解释分类模型。结果:各机器学习模型均取得优良的分类结果,平均受试者工作特征曲线下面积(AUROC)、精确率 - 召回率曲线下面积(AUPRC)、F1-score 和准确率分别为 0.949、0.724、43.69% 和89.49%,超声文本特征对分类的影响最大。结论:融合多模态特征有助于提高 TN 的良恶性分类性能。
【关键词】超声;甲状腺结节;良恶性;机器学习;多模态特征