-
基于可解释性机器学习模型的轻型缺血性卒中复发预测研究
编辑人员丨6天前
目的 利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素.方法 回顾性收集2020年7-12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因素变量筛选,合成少数过采样技术-标称连续处理数据不平衡,数据集按8∶2的比例分为训练集与测试集,网格搜索10折交叉验证构建轻量梯度提升机(light gradient boosting machine,LightGBM)、支持向量机(support vector machine,SVM)模型,并与逻辑回归(logistic regression,LR)模型进行比较,基于ROC的AUC、校准曲线分别评价模型的区分度与校准度,性能最好的模型通过Shapley加性解释(Shapley additive explanation,SHAP)模型对预测结果进行解读.结果 本研究共纳入520例MIS患者,2年内复发93例(17.9%),测试集中LightGBM、SVM、LR预测患者2年内复发的AUC分别为0.935(95%CI 0.896~0.973)、0.833(95%CI 0.770~0.896)、0.764(95%CI 0.691~0.835),准确度分别为0.890、0.773、0.693,布里尔分数分别为0.105、0.167、0.200.结果 显示LightGBM模型性能最优,基于SHAP的LightGBM可解释模型重要性前5的是舒张压、年龄、糖尿病、LDL-C、吸烟.结论 本研究建立的LightGBM模型预测效果良好,可为MIS患者2年内复发的预测提供借鉴.通过SHAP可解释性帮助临床医师更好地理解预测模型结果背后的原因,对MIS患者做出更个性化与合理化的临床决策.
...不再出现此类内容
编辑人员丨6天前
-
可视化影像决策模型在评估肺结节浸润程度中的价值
编辑人员丨6天前
目的:探讨基于临床资料、影像征象和影像组学特征构建的联合模型在术前对肺结节浸润程度的预测价值,并通过决策热图及Shapley算法对模型进行可视化分析.方法:回顾性搜集2018年1月—2022年3月在本院经病理确诊的179例肺结节患者的临床资料和术前CT图像(肺窗平扫).根据肺肿瘤新分类,分为腺体前驱病变组(78例)和浸润性肺腺癌组(101例).采用Deepwise软件,分别提取瘤灶、瘤周3 mm和5 mm区域的影像组学特征.使用单因素分析、相关性分析、Boruta算法和逐步logistic回归分析等特征筛选算法确定各区域的最佳组学特征,然后采用logistics方法分别构建3个单区域及2个多区域(肿瘤+瘤周3 mm及肿瘤+瘤周5 mm)共5个影像组学模型,分析各模型的预测效能并计算其影像组学评分(Radsocre).通过单因素和多因素logistic回归方法筛选相关临床指标和结节的主要CT征象,并采用XGBoost算法将筛选出的高危因素结合瘤灶+瘤周3 mm联合模型的影像组学得分构建临床影像联合模型.额外收集浙江省嘉兴市中医医院经病理证实的69例肺结节患者的临床和CT资料来完成联合模型的泛化性验证.利用决策热图和Shapley算法对模型分别进行可视化和特征贡献度分析.结果:相比单区域影像组学模型(训练集:AUC=0.740、0753、0.768;验证集:AUC=0.841、0.856、0.809),多区域影像组学模型在两个数据集中均显示出更高的预测效能(AUC=0.878和0.834).XGBoost联合模型的预测效能得到进一步地提高(AUC=0.948和0.886).Shap-ley分析显示影像组学得分、CT值和结节长度为预测肺结节浸润程度的最重要的3个特征.决策热图算法实现了对浸润性预测推演过程的可视化.结论:XGBoost模型对肺结节浸润性的评估具有较高的准确性和泛化性.决策热图实现了可解释机器学习算法的可视化从而保障了模型的实用性,为肺结节的临床处理及管理提供了一种无创性的辅助诊断工具.
...不再出现此类内容
编辑人员丨6天前
-
基于SHAP值特征选择的γ通过率分类预测及解释
编辑人员丨6天前
目的:探索SHAP值结合极端梯度提升树(XGBoost)算法的特征选择技术来构建调强放疗γ通过率预测模型的可行性和有效性,并给出相应的模型解释。方法:回顾性分析2020年11月至2021年11月在湖南省肿瘤医院接受盆腔固定野调强放射治疗的196例肿瘤患者采用基于模体测量方式的调强放疗计划的剂量验证结果,γ通过率标准为3%/2 mm、10%剂量阈值。提取基于剂量文件的影像组学特征并使用SHAP值结合XGBoost算法进行特征筛选后构建预测模型。分别选取特征数量为50、80、110、140个,构建四种机器学习分类模型,计算曲线下面积(AUC)值、召回率及F1分数评估预测模型的分类性能。结果:基于SHAP值特征选择的110个特征构建的预测模型AUC值为0.81,召回率达到0.93,F1分数为0.82,均优于其他三个模型。结论:针对盆腔肿瘤调强放疗计划,可以采用SHAP值与XGBoost算法结合以选择用于预测的最佳影像组学特征子集来构建γ通过率的预测模型,并能通过SHAP值给出模型输出解释,可能在理解依赖机器学习模型所做的预测方面提供价值。
...不再出现此类内容
编辑人员丨6天前
-
可解释的机器学习模型预测缺血性脑卒中患者预后研究
编辑人员丨6天前
目的:探讨可解释的机器学习模型预测急性缺血性脑卒中预后的应用价值。方法:选取广东医科大学附属湛江中心医院神经内科自2020年3月至2023年10月实施静脉溶栓治疗的296例急性缺血性脑卒中患者为研究对象,随访3个月后使用改良Rankin量表评估预后(0~2分定义为预后良好,3~6分定义为预后不良)。回顾性收集患者的临床资料,并采用多因素Logistic回归分析筛选出患者预后的独立影响因素。以3∶2比例将患者随机分为训练集( n=178)和测试集( n=118),以预后独立影响因素为特征变量训练10种机器学习模型(逻辑回归、随机森林、支持向量机、朴素贝叶斯、线性判别分析、混合判别分析、灵活判别分析、梯度增强机、极端梯度提升和分类梯度提升),分别使用校准曲线、精确-召回曲线、精确-召回增益曲线及受试者工作特征曲线评估这10种机器学习模型的预测性能,使用Shapley加法解释(SHAP)对机器学习模型附加解释和可视化(包含全局解释和局部解释)。 结果:296例患者中预后不良72例。年龄( OR=1.039,95% CI:1.008~1.072, P=0.015)、美国国立卫生研究院卒中量表评分( OR=1.213,95% CI:1.000~1.337, P<0.001)、格拉斯哥昏迷量表评分( OR=0.470,95% CI:0.289~0.765, P=0.002,)、卒中预测工具-Ⅱ评分( OR=1.257,95% CI:1.043~1.516, P=0.016)、C反应蛋白水平( OR=1.709,95% CI:1.398~2.087, P<0.001)和血小板计数( OR=0.988,95% CI:0.978~0.998, P=0.016)是患者预后的独立影响因素。在10种机器学习模型中,极端梯度提升模型预测患者预后的性能最高(校准曲线评估示一致性指数为0.896,精确-召回曲线评估示曲线下面积为0.791,精确-召回增益曲线示曲线下面积为0.363,受试者工作特征曲线示曲线下面积为0.856)。全局解释中SHAP直观图显示特征变量的重要性排序依次为C反应蛋白、美国国立卫生研究院卒中量表评分、血小板计数、格拉斯哥昏迷量表评分、卒中预测工具-Ⅱ评分和年龄;SHAP散点图可视化了6个特征变量的贡献方向,呈"两端分布"现象;SHAP依赖图显示了6个特征变量的观测值与SHAP值间的依赖关系,其中C反应蛋白趋势最为显著。SHAP力图为单个样本提供了局部解释,使得极端梯度提升模型更加透明和可解释性。 结论:基于年龄、美国国立卫生研究院卒中量表评分、格拉斯哥昏迷量表评分、卒中预测工具-Ⅱ评分、C反应蛋白水平和血小板计数为特征变量的极端梯度提升模型预测急性缺血性脑卒中患者预后的性能最优,在此基础上结合SHAP进行模型解释和可视化,有助于理解各特征变量对预测结果的贡献大小及方向。
...不再出现此类内容
编辑人员丨6天前
-
伴右向左分流隐源性卒中患者发病风险预测模型研究
编辑人员丨6天前
目的:利用机器学习预测右向左分流(right-to-left shunt,RLS)人群隐源性卒中(cryptogenic stroke,CS)发病风险,为CS的准确和高效预测提供解决方案。方法:回顾分析2018年1月至2023年9月在青岛大学附属医院崂山院区神经内科治疗的经颅多普勒超声发泡试验(c-TCD)阳性的289例RLS人群的临床数据,包括人口统计学信息、疾病史、实验室检查指标、诊断和治疗等。使用机器学习train_test_split()函数将数据集随机分为训练集和测试集,比例为8∶2。采用Logistic回归、决策树、随机森林、极端梯度提升、人工神经网络、梯度提升、极限树和自适应增强等算法构建RLS人群CS风险预测模型,使用受试者工作特征曲线(receiver operating characteristic,ROC)及曲线下面积(area under curve,AUC)、混淆矩阵、精确率、召回率、准确率、F1值、校准曲线、决策曲线等综合评估模型性能。性能最优的模型使用特征重要性和SHAP值进行可解释性分析。使用SPSS 25.0进行 t检验、Mann-Whitney U检验和 χ2检验。采用Delong检验比较两模型间AUC的差异。 结果:289例RLS人群发生CS 166例(57.5%),非CS 123例(42.5%)。统计分析结果显示,CS患者D-二聚体、平均血小板体积、纤维蛋白原等血液生化指标高于非CS患者(均 P<0.01);训练集与测试集各变量均差异无统计学意义(均 P>0.05)。对测试集进行CS风险预测,随机森林模型取得了最高的AUC(0.885)、精确率(0.806)、召回率(0.879)、准确率(0.810)以及F1得分(0.841)。校准曲线显示随机森林模型最接近参考线,决策曲线表明随机森林模型具有更大的净受益。可解释性分析显示高风险因素包括平均血小板体积、D-二聚体、国际标准化比值、体质量指数以及年龄。 结论:基于随机森林的预测工具表现出色,在预测RLS人群CS风险方面准确性较高。
...不再出现此类内容
编辑人员丨6天前
-
机器学习方法构建老年心房颤动合并冠心病患者远期死亡的预测模型研究
编辑人员丨6天前
目的:利用机器学习方法建立老年心房颤动(房颤)合并冠心病患者的远期死亡预测模型,并确定相应的危险因素。方法:回顾性队列研究,连续入组2013年1月至2015年3月北京医院收治的60岁及以上房颤合并冠心病患者329例,男性183例(55.6%)例,女性146例(44.4%),年龄(77.8±7.3)岁,80岁及以上142例(43.2%)。失访11例(3.3%),死亡151例(45.9%),最后纳入分析的患者共318例。根据患者生存结局,将318例患者分为死亡组(151例)和存活组(167例)。此外,另选取2015年4—7月入院的60岁及以上房颤合并冠心病患者60例为外部数据验证集。采集人口统计学参数、合并疾病、辅助检查和临床治疗情况。随访至少6年,记录包括死亡在内的主要不良心脑血管事件(MACCE)。最后将入组患者按9∶1的比例随机分为训练集和测试集,通过机器学习算法建立不同模型预测房颤合并冠心病患者远期死亡率,并通过外部数据(60例)验证比较确立最优模型,利用Shapley加法解释算法对变量的重要性进行排序,得出排名前20位的特征变量,以确定危险因素。结果:329例患者中,总体中位随访时间77.0月(95% CI:54.0~84.0),失访11例(3.3%),死亡151例(45.9%)。通过分析得出支持向量机模型、k-近邻算法(KNN)模型、决策树模型、随机森林模型、ADABoost模型、XGBoost模型、Logistic回归模型预测远期死亡率的受试者工作特征曲线(ROC)下面积(AUC)分别为0.76、0.75、0.75、0.91、0.86、0.85和0.81。其中随机森林模型预测效能最高,其准确率达0.789,F1值高达0.806,且优于传统的Logistic回归模型(AUC:0.91比0.81, P<0.05)。D-二聚体、年龄、MACCE次数、左心室射血分数、人血白蛋白水平、贫血、纽约心脏病协会心功能分级、陈旧性心肌梗死病史、估测肾小球滤过率(eGFR)及静息心率是预测远期死亡率的重要危险因素。 结论:基于机器学习方法建立的随机森林模型可预测老年房颤合并冠心病患者的远期死亡率,具有较好的识别能力,其准确性高于传统的Logistic回归模型。可通过干预患者的D-二聚体水平、纠正低蛋白血症和贫血、改善心功能和控制静息心室率降低远期死亡率,改善患者远期预后。
...不再出现此类内容
编辑人员丨6天前
-
采用机器学习技术建立布鲁杆菌病早期预测模型
编辑人员丨6天前
采用机器学习技术构建布鲁杆菌病(简称:布病)早期预测模型,以辅助提高布病的诊断效率。本文为病例对照研究,收集2011年5月9日至2021年11月29日首都医科大学附属北京地坛医院的布病患者2 381例作为病例组,首都医科大学附属北京朝阳医院表观健康人检验数据13 257例作为对照组。采用患者年龄、性别、临床诊断信息及22项血细胞分析结果,使用机器学习的随机森林、朴素贝叶斯、决策树、逻辑回归和支持向量机5种算法构建布病早期预测模型;其中14 074例(病例组2 143例,对照组11 931名)用于构建布病早期预测模型,1 564例(病例组238例,对照组1 326名)用于测试模型的预测效能。结果显示,通过对5种机器学习模型进行比对,支持向量机模型预测性能最佳,受试者工作曲线(ROC)线下面积(AUC)为0.991,准确度、精确度、特异度和召回率分别可达95.6%、95.5%、95.4%和95.9%。依据SHAP图显示,血小板分布宽度(PDW)和嗜碱粒细胞相对值(BASO%)结果较低,红细胞分布宽度变异系数(R-CV)、红细胞血红蛋白浓度(MCHC)和血小板体积(MPV)结果高的男性被预测为布病风险高。其中,血小板分布宽度(PDW)对预测模型贡献度最大,红细胞分布宽度变异系数(R-CV)次之。综上,基于机器学习技术建立高灵敏度的布病早期预测方法,对布病患者的及早发现、尽快治疗可能具有重要意义。
...不再出现此类内容
编辑人员丨6天前
-
膝关节内侧单髁置换术后假体周围骨折的临床诊治进展
编辑人员丨6天前
单间室膝关节置换术(UKA)是治疗终末期膝关节前内侧骨关节炎的有效方法。UKA围手术期可能发生假体周围胫骨平台及股骨内髁骨折,其治疗极具挑战性。导致这一并发症的原因包括:技术性原因,如术中操作导致平台后皮质强度弱化、内侧胫骨关节面切骨量过多导致承载假体的骨量减少、假体对线不良导致骨床应力集中等;假体设计原因,如非骨水泥假体的压配固定设计、胫骨切骨导向器多钉孔固定等;胫骨平台形态原因,如亚洲人群胫骨内侧平台窄小及悬凸等。合理选择适应症、正确地把握手术原则及标准化手术技术是预防UKA围手术期假体周围骨折的关键,治疗方式的选择主要取决于骨折模式及假体的稳定性。
...不再出现此类内容
编辑人员丨6天前
-
预测含高致吐风险铂类药物化疗致恶心呕吐人工智能模型的建立与评价
编辑人员丨6天前
目的:基于人工智能技术建立肿瘤患者接受高致吐风险铂类药物化疗诱发恶心呕吐(CINV)的风险预测模型,为止吐方案的选择提供依据。方法:收集2018年1月至2022年12月在天津医科大学总医院肿瘤科登记的接受顺铂或卡铂[卡铂血药浓度-时间曲线下面积(AUC)≥4]肿瘤患者的临床信息,包括性别、年龄、饮酒史、孕吐史、化疗周期、患者对发生恶心呕吐的预期、化疗药物、止吐方案、院外止吐治疗、化疗前夜睡眠小于7 h、上周期发生CINV情况、肌酐清除率(Ccr)等。对数据进行预处理后随机分为训练集和测试集,训练集用于构建预测模型,测试集用于评价模型预测效能。分别采用梯度提升树(GBDT)、随机森林(RF)和逻辑回归(LR)3种算法建立预测模型,并对模型性能进行评价。评价指标包括准确度、灵敏度、召回率、F1值(灵敏度和召回率的调和平均数)和受试者工作特征曲线下面积(AUROC)。最后应用Shapley加法解释(SHAP)方法对有预测意义的临床特征进行可解释性分析。结果:本研究共纳入患者698例,男性439例(62.9%);中位年龄64(21,84)岁;共接受1 654个周期化疗。化疗方案含顺铂者364例,化疗864个周期;含卡铂且AUC≥4者361例,化疗790个周期。止吐方案选择神经激肽-1受体拮抗剂(NK-1 RA)、5-羟色胺3受体拮抗剂(5-HT3 RA)和地塞米松者的治疗周期数为1 347个,选择5-HT3 RA和地塞米松者的周期数为307个。Spearman相关性分析结果显示肿瘤患者特征变量之间相关性不强,均可用于模型建立。GBDT最优超参数n_estimators=500,max_depth=9;RF最优超参数max_depth=5;LR最优超参数penalty=L2。根据最优超参数训练数据分别建立GBDT、RF和LR 3种预测模型。GBDT模型准确度为0.903,灵敏度为0.882,召回率为0.903,F1值为0.883,AUROC为0.778±0.036(95% CI:0.739~0.814);RF模型的准确度为0.885,灵敏度为0.861,召回率为0.885,F1值为0.870,AUROC为0.679±0.041(95% CI:0.636~0.720);LR模型的准确度为0.817,灵敏度为0.851,召回率为0.817,F1值为0.832,AUROC为0.682±0.042(95% CI:0.639~0.723)。Ccr、年龄、化疗周期、饮酒史以及化疗前患者预期会发生恶心呕吐是具有预测意义的主要临床特征;Ccr、年龄、化疗周期与CINV的发生呈负相关,无饮酒史和患者预期会发生恶心呕吐会增加CINV的发生风险。 结论:GBDT、RF和LR 3种模型均可对接受高致吐铂类药物患者CINV的发生风险进行预测,其中GBDT模型的预测效能最佳。
...不再出现此类内容
编辑人员丨6天前
-
机器学习和Logistic回归模型预测心脏外科术后患者发生急性肾损伤的比较分析
编辑人员丨6天前
目的:使用机器学习中极限梯度提升(XGBoost)算法构建心脏外科术后患者发生急性肾损伤(AKI)的风险预测模型,探讨心脏外科术后患者发生AKI的危险因素和保护因素。方法:纳入美国重症监护医学信息数据库Ⅲ(MIMIC-Ⅲ)中全部接受心脏外科手术患者的临床资料,按术后14 d内是否发生AKI分为AKI组和非AKI组,并比较两组患者的临床特征。在五折交叉验证的基础上,分别采用XGBoost和Logistic回归法建立心脏外科术后AKI预测模型,并比较两种模型的受试者工作特征曲线下面积(AUC)。采用沙普利加和解释法(SHAP)解释XGBoost的输出模型。结果:共纳入6 912例心脏外科术后患者,其中5 681例(82.2%)在术后14 d内发生AKI,1 231例(17.8%)未发生AKI。与非AKI组相比,AKI组患者年龄更大〔岁:68.0(59.0,76.0)比62.0(52.0,71.0)〕,急诊入院及合并肥胖、糖尿病比例更高(52.4%比47.8%,9.0%比4.0%,32.0%比22.2%),生命体征指标中呼吸频率(RR)更低〔次/min:17.0(14.0,20.0)比19.0(15.0,22.0)〕,心率(HR)更慢〔次/min:80.0(67.0,89.0)比82.0(71.5,93.0)〕,血压更高〔mmHg(1 mmHg≈0.133 kPa):80.0(70.7,90.0)比78.0(70.0,88.0)〕,实验室指标中血红蛋白(Hb)、血糖、血K +、血肌酐(SCr)更高〔Hb(g/L):122.0(109.0,136.0)比120.0(106.0,135.0),血糖(mmol/L):7.3(6.1,8.9)比6.8(5.7,8.5),血K +(mmol/L):4.2(3.9,4.7)比4.2(3.8,4.6),SCr(μmol/L):88.4(70.7,106.1)比79.6(70.7,97.2)〕,白蛋白(ALB)和三酰甘油(TG)更低〔ALB(g/L):38.0(35.0,41.0)比39.0(37.0,42.0),TG(mmol/L):1.4(1.0,2.0)比1.5(1.0,2.2)〕,且多器官功能障碍综合征(MODS)和脓毒症比例更高(30.6%比16.2%,3.3%比1.9%),差异均有统计学意义(均 P<0.05)。Logistic回归预测模型中的主要影响因素包括血乳酸〔Lac;优势比( OR)=1.062,95%可信区间(95% CI)为1.030~1.100, P=0.050〕、肥胖( OR=2.234,95% CI为1.900~2.640, P<0.001)、男性( OR=0.858,95% CI为0.794~0.928, P=0.049)、伴有糖尿病( OR=1.820,95% CI为1.680~1.980, P<0.001)和急诊入院( OR=1.278,95% CI为1.190~1.380, P<0.001)。受试者工作特征曲线(ROC曲线)分析显示,Logistic回归模型预测心脏外科术后发生AKI的AUC为0.62(95% CI为0.61~0.67)。经过网格搜索与五折交叉验证结合优化XGBoost模型参数,模型训练效果良好,没有出现过拟合或欠拟合。ROC曲线分析结果显示,XGBoost模型预测心脏外科术后发生AKI的AUC为0.77(95% CI为0.75~0.80),明显高于Logistic回归预测模型的AUC( P<0.01)。经SHAP方法处理后,XGBoost输出模型中对最终结果最重要的预测因素是年龄和ALB,其中年龄是危险因素(平均| SHAP值|为0.434),ALB是保护因素(平均| SHAP值|为0.221)。 结论:年龄是心脏外科术后患者发生AKI的重要危险因素,而ALB则是保护因素。机器学习预测心脏外科术后AKI的效能比传统Logistic回归更加优秀,能分析变量与结局间更复杂的关系,更精准地个体化预测术后AKI的发生风险。
...不再出现此类内容
编辑人员丨6天前
