JCO Precis Oncol 中国医学科学院肿瘤医院：可解释机器学习模型预测直肠癌侧方盆腔淋巴结转移-编程实验室

文献信息

本次分享的文献是由中国医学科学院肿瘤医院联合北京大学第一医院、北京协和医院等4家中心团队近日（20250917)在《Journal of Clinical Oncology Precision Oncology》（中科院2区，IF=5.6）上发表的研究“Interpretable Machine Learning Models for Predicting Lateral Pelvic Lymph Node Metastasis in Rectal Cancer: A Chinese Multicenter Retrospective Study”即可解释机器学习模型预测直肠癌侧方盆腔淋巴结转移：一项中国多中心回顾性研究，该研究为中国多中心回顾性研究，纳入4家医院2015-2020年接受全直肠系膜切除术（TME）联合侧方盆腔淋巴结清扫术（LPLND）且无新辅助治疗的直肠癌患者共520例。研究构建并验证了5种机器学习模型（逻辑回归、随机森林等），旨在预测直肠癌患者髂内和闭孔淋巴结（侧方盆腔淋巴结核心转移部位）的转移状态，并通过SHAP方法提升模型可解释性。结果显示，随机森林（RF）模型表现最优，外部验证集AUC达0.899、准确率0.827；SHAP分析明确关键预测因素为“肿大淋巴结短轴直径>区域淋巴结转移状态>肿瘤距肛缘距离”。该模型可为直肠癌术前个体化治疗决策提供精准支持。

研究背景及目标

研究背景

疾病负担：直肠癌是全球常见恶性肿瘤，尽管筛查、手术及辅助治疗进展显著，但淋巴结转移患者的死亡率仍居高不下，侧方盆腔淋巴结（尤其是髂内、闭孔淋巴结）转移是影响疾病进展、预后及治疗决策的关键因素。

临床痛点：

髂内/闭孔淋巴结转移与高复发率、低生存率相关，但其术前评估常依赖单一因素（如MRI下淋巴结短轴直径、肿瘤距肛缘距离），存在局限（如肿大淋巴结跨区域时难以用单一阈值判断）；

传统评估方法无法整合多维度临床数据（影像、病理、实验室指标），难以实现精准风险分层；

技术契机：机器学习可挖掘临床数据中的非线性关联，提升预测准确性，但传统模型存在“黑箱”问题，缺乏可解释性，限制临床应用。

研究目标

开发基于多中心临床数据的机器学习模型，精准预测直肠癌患者髂内和闭孔淋巴结转移状态；

采用SHAP方法解析模型决策逻辑，明确关键预测因素，提升模型可解释性；

通过外部验证验证模型的泛化能力，为临床术前个体化治疗决策提供工具。

数据和方法

研究数据

数据来源

中国4家三甲医院2015年1月-2020年12月的回顾性队列：

训练/测试集：中国医学科学院肿瘤医院（320例）+天津人民医院（91例），共411例（237例淋巴结转移阴性，174例阳性）；

外部验证集：北京大学第一医院（76例）+北京协和医院（33例），共109例（66例阴性，43例阳性）。

纳入与排除标准

纳入标准：①病理确诊直肠腺癌；②术前影像提示可疑髂内/闭孔淋巴结转移；③接受TME+LPLND；④无新辅助治疗（化疗、放疗等）。

排除标准：①淋巴结标本未单独送检；②术后病理未记录侧方盆腔淋巴结（LPLN）状态；③术中淋巴结位置与术前影像不符。

数据预处理

缺失值：采用中位数填补（适用于连续变量，如CEA、CA19-9）；

数据划分：训练集与测试集按3:1比例随机划分，外部验证集独立用于泛化性评估。

技术方法

特征选择

采用双算法联合筛选，确保变量可靠性：

Lasso回归：通过正则化排除冗余变量（阈值设为0.01，系数<0.01的变量被排除）；

Boruta算法：基于随机森林评估变量重要性，筛选“显著影响预测”的变量；

最终保留变量：肿大淋巴结短轴直径、区域淋巴结状态、肿瘤距肛缘距离、临床T分期、肿瘤直径、肿瘤分化程度、术前CEA、淋巴结位置。

模型构建与优化

模型类型：5种经典机器学习模型：

逻辑回归（LR）；2.随机森林（RF）；3.极端梯度提升（XGBoost）；4.支持向量机（SVM）；5.K近邻（KNN）；

超参数优化：采用网格搜索（Grid Search）+5折交叉验证，确定各模型最优参数（如RF的树数量、最大深度）。

模型评估指标

核心指标：AUC（受试者工作特征曲线下面积，反映整体预测能力）、准确率（预测正确的比例）、F1值（平衡灵敏度与特异度）；

辅助指标：灵敏度（真阳性率）、特异度（真阴性率）。

模型解释（SHAP分析）

分析维度：

全局解释：通过“SHAP特征重要性图”量化各特征对预测结果的平均影响（按均值绝对SHAP值排序）；

局部解释：通过“SHAP力导向图”展示单个患者的预测逻辑（各特征对“转移概率”的正向/负向贡献）。

统计分析

描述性统计：连续变量用“均值±SD”或“中位数（IQR）”，分类变量用“频数（百分比）”；

组间比较：连续变量用独立样本t检验，分类变量用卡方检验；

显著性水平：P<0.05为差异有统计学意义；

实验结果图

图 1：特征筛选结果图（Lasso回归+Boruta算法）

图 1A（Lasso特征选择图）：以回归系数0.01为阈值，排除CA19-9、年龄等关联性较弱的特征，保留淋巴结短轴直径、区域淋巴结状态、肿瘤距肛距离等核心特征，避免变量冗余。

图 1B（Boruta变量重要性图）：按特征重要性排序，排除CA19-9、BMI、性别，与Lasso筛选结果一致，进一步验证核心特征的可靠性，为后续建模提供高质量输入变量。

图 2：5种机器学习模型的ROC曲线（训练集+测试集+外部验证集）

展示逻辑回归（LR）、K近邻（KNN）、随机森林（RF）、极端梯度提升（XGBoost）、支持向量机（SVM）5种模型在测试集（图2B）和外部验证集（图2C）的性能。其中RF模型表现最优，外部验证集AUC达0.899，显著优于其他模型，证明其泛化能力强，适合临床推广。

图 3：RF模型的SHAP可解释性分析图

图 3A（SHAP特征重要性图）：按平均绝对SHAP值排序，淋巴结短轴直径是最重要预测因素，其次是区域淋巴结状态、术前CEA水平、肿瘤距肛距离，明确各特征对预测结果的影响权重。

图 3B（SHAP蜂群图）：红色代表高特征值、蓝色代表低特征值，高淋巴结短轴直径、区域淋巴结阳性、肿瘤距肛近等会提升转移概率（SHAP值为正），直观呈现特征值与预测结果的关联。

图 4：RF模型的个体患者SHAP力图（真阳性vs真阴性）

图 4A（真阳性患者）：预测转移概率91%，淋巴结短轴直径大、区域淋巴结阳性等特征为主要正贡献，与术后病理转移结果一致，解释高风险原因。

图 4B（真阴性患者）：预测转移概率29%，区域淋巴结阴性、术前CEA正常等为主要负贡献，符合病理无转移结果，明确低风险依据。

讨论

临床价值

该研究解决了传统单一指标评估直肠癌髂内和闭孔淋巴结转移准确性低的问题。RF模型可整合多临床特征实现精准预测，帮助医生在术前明确患者转移风险，为个体化治疗方案制定提供可靠依据——对高风险患者，可考虑更积极的新辅助治疗或扩大手术清扫范围；对低风险患者，可避免不必要的扩展手术及术后并发症，减少过度治疗或治疗不足的情况。

创新点

研究设计创新

首次针对直肠癌髂内和闭孔淋巴结转移开发可解释机器学习模型，聚焦临床最关键的侧方淋巴结亚群，填补了该领域精准预测工具的空白；

采用中国多中心数据（4家三甲医院），并通过独立外部验证验证泛化性，避免单中心研究的选择偏倚，结果更具临床推广价值。

方法学创新

双算法特征筛选：结合Lasso回归（排除冗余）与Boruta算法（评估重要性），确保变量选择的可靠性，避免单一算法的局限性；

“预测+解释”双目标：通过SHAP实现“全局特征重要性+个体预测逻辑”的完整解释，既明确群体层面的关键因素，又能为单个患者的预测结果提供临床可理解的理由，提升模型的临床接受度。

数据整合创新

突破传统“单一因素评估”的局限，整合影像（MRI淋巴结直径）、病理（分化程度）、实验室（CEA）、临床（T分期）多维度数据，更符合临床实际决策场景。