-
基于可解释性机器学习模型的轻型缺血性卒中复发预测研究
编辑人员丨2天前
目的 利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素.方法 回顾性收集2020年7-12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因素变量筛选,合成少数过采样技术-标称连续处理数据不平衡,数据集按8∶2的比例分为训练集与测试集,网格搜索10折交叉验证构建轻量梯度提升机(light gradient boosting machine,LightGBM)、支持向量机(support vector machine,SVM)模型,并与逻辑回归(logistic regression,LR)模型进行比较,基于ROC的AUC、校准曲线分别评价模型的区分度与校准度,性能最好的模型通过Shapley加性解释(Shapley additive explanation,SHAP)模型对预测结果进行解读.结果 本研究共纳入520例MIS患者,2年内复发93例(17.9%),测试集中LightGBM、SVM、LR预测患者2年内复发的AUC分别为0.935(95%CI 0.896~0.973)、0.833(95%CI 0.770~0.896)、0.764(95%CI 0.691~0.835),准确度分别为0.890、0.773、0.693,布里尔分数分别为0.105、0.167、0.200.结果 显示LightGBM模型性能最优,基于SHAP的LightGBM可解释模型重要性前5的是舒张压、年龄、糖尿病、LDL-C、吸烟.结论 本研究建立的LightGBM模型预测效果良好,可为MIS患者2年内复发的预测提供借鉴.通过SHAP可解释性帮助临床医师更好地理解预测模型结果背后的原因,对MIS患者做出更个性化与合理化的临床决策.
...不再出现此类内容
编辑人员丨2天前
-
基于机器学习建立脓毒症心肾综合征患者早期死亡风险预测模型
编辑人员丨2天前
目的:探讨机器学习算法构建脓毒症心肾综合征患者早期死亡风险预测模型的方法,为临床早期识别高危患者及精准治疗提供依据。方法:入选同济大学附属同济医院2015年1月1日至2019年5月31日期间入院的脓毒症心肾综合征患者为研究对象,收集患者确诊时的临床表现、实验室检查及治疗情况等资料。研究终点事件定义为患者确诊后30 d内死亡。运用Python软件构建不同机器学习算法模型,采用受试者工作特征曲线下面积( AUC)评估各模型的预测效能。运用构建的最优模型筛选疾病相关风险因素,构建可视化决策树模型和半朴素贝叶斯(sNB)模型。 结果:340例患者入选本研究,其中114例(33.5%)患者确诊后30 d内死亡。支持向量机(SVM )、随机森林(RF)、梯度提升树(GBDT) 、极端梯度提升(XGBoost)和轻量梯度提升(LGBM)5种模型的 AUC值分别为0.652、0.868、0.870、0.754和0.852,其中GBDT模型预测患者发生终点事件的 AUC值最优。依据GBDT模型特征重要度评分筛选出前10项患者预后的影响因素,包括序贯器官衰竭评估(SOFA)总评分、神经系统SOFA评分、血管活性药物应用史、高敏肌钙蛋白(cTNI)、年龄、肌红蛋白(MYO)、循环系统SOFA评分、慢性肾脏病史、心率和基线血肌酐值等参数,建立可视化决策树模型,模型共4层,15个节点,8个终端节点。依据SOFA总评分、MYO变化率、基线血肌酐值和年龄等4项影响因素建立决策树流程,模型预测患者发生终点事件的 AUC值为0.690。sNB模型提示总SOFA总评分与神经系统SOFA评分、SOFA总评分与血管活性药物、cTNI与基线血肌酐值间的相互作用影响患者的短期预后。 结论:基于机器学习建立的脓毒症心肾综合征患者早期死亡风险预测模型结果提示,高SOFA评分仍然是预测脓毒症心肾综合征患者预后不良的首要危险因素。本研究建立的可视化决策树模型和sNB模型可在疾病早期针对高危患者进行临床判断,为脓毒症患者的精准治疗提供预测依据。
...不再出现此类内容
编辑人员丨2天前
-
基于机器学习的艾司奥美拉唑相关急性肾损伤风险预测模型的构建与验证
编辑人员丨2天前
目的:分析接受艾司奥美拉唑治疗的住院患者发生急性肾损伤(AKI)的影响因素,构建艾司奥美拉唑相关AKI的风险预测模型。方法:研究设计为回顾性研究。研究对象选自2018年1月至2020年12月于山东第一医科大学第一附属医院住院并接受艾司奥美拉唑治疗的患者。通过医院电子病历系统收集患者临床资料,包括患者基本信息、手术类型、干预措施、用药信息和实验室检查结果。根据是否发生艾司奥美拉唑相关AKI将患者分为AKI组和非AKI组,比较2组临床特征。采用最小绝对收缩和选择算子(LASSO回归)分析艾司奥美拉唑相关AKI的影响因素。以8∶2的比例将患者随机分为训练集和测试集。基于训练集数据,采用5种机器学习算法[logistic回归(LR)、随机森林(RF)、梯度提升机(GBM)、极端梯度提升(XGBoost)和轻量梯度提升机(LightGBM)]建立艾司奥美拉唑相关AKI预测模型;基于测试集数据,比较5种模型的受试者工作特征曲线下面积(AUC)、敏感性、特异性和准确率。结果:共有5 436例患者纳入研究,包括男性3 231例、女性2 205例,年龄61(51,70)岁。393例(7.23%)发生艾司奥美拉唑相关AKI。LASSO回归分析共筛选出24个与艾司奥美拉唑相关AKI密切相关的变量,包括肝功能不全、慢性肾功能不全、低蛋白血症等。基于训练集(4 349例)数据构建艾司奥美拉唑相关AKI风险预测模型,结果显示5种模型的预测性能均良好(AUC均大于0.900)。以测试集(1 087例)数据对5种模型的预测性能进行验证,发现GBM模型的AUC最高(0.922),且预测性能较为稳定(在训练集与测试集中各项指标差异较小)。结论:应用艾司奥美拉唑与AKI发生明显相关,发生风险受患者基线肾功能、合并疾病及合并使用的其他药物等因素影响。基于GBM算法构建的风险预测模型,有助于临床对艾司奥美拉唑相关AKI发生风险进行早期评估。
...不再出现此类内容
编辑人员丨2天前
-
基于放射组学的盆腔肿瘤不同调强放疗技术γ通过率的预测研究
编辑人员丨2天前
目的:采用基于放射组学的机器学习方法,探索盆腔肿瘤不同调强放疗技术下γ通过率(GPR)分类预测模型的可行性,并比较了4种集成树模型的分类性能。方法:回顾性收集了409例使用不同调强放疗技术的计划,采用基于模体测量方式的三维剂量验证结果,γ通过率标准为3%/2 mm、10%剂量阈值。提取基于剂量文件的放射组学特征构建预测模型。分别采用随机森林、自适应增强、极端梯度提升树和轻量级梯度提升机4种机器学习算法,并且通过计算灵敏度、特异度、 F1分数及曲线下面积(AUC)值来评估它们的分类性能。 结果:随机森林、自适应增强、极端梯度提升树、轻量级梯度提升机模型的灵敏度和特异度分别为0.96、0.82、0.93、0.89和0.38、0.54、0.62、0.62, F1分数和AUC值分别为0.86、0.81、0.88、0.86和0.81、0.77、0.85、0.83。其中极端梯度提升树模型的灵敏度达到0.93,特异度、 F1分数和AUC值均为最高,要优于其他3种模型。 结论:针对采用不同调强放疗技术的盆腔肿瘤调强计划,使用基于放射组学的机器学习方法来构建伽马通过率分类预测模型具有一定的可行性,能够为将来GPR预测的多机构合作研究提供基础。
...不再出现此类内容
编辑人员丨2天前
-
机器学习算法在肝细胞癌微血管侵犯术前预测中的应用价值
编辑人员丨2天前
目的:探讨机器学习算法在肝细胞癌微血管侵犯(MVI)术前预测中的应用价值。方法:采用回顾性描述性研究方法。收集2015年5月至2018年12月福建医科大学孟超肝胆医院收治的277例肝细胞癌患者的临床病理资料;男235例,女42例;年龄为(56±10)岁,年龄范围为33~80岁。患者术前均行磁共振成像检查。227例肝细胞癌患者通过计算机产生随机数方法以7∶3比例分为训练集193例和验证集84例。应用逻辑回归列线图,支持向量机(SVM)、随机森林(RF)、人工神经网络(ANN)和轻量级梯度提升机(LightGBM)机器学习算法构建MVI术前预测模型。观察指标:(1)训练集及验证集患者临床病理资料分析。(2)影响训练集患者肿瘤MVI危险因素分析。(3)机器学习算法预测模型构建及其术前预测肿瘤MVI准确性比较。正态分布的计量资料以 ± s表示,组间比较采用配对 t检验。计数资料以绝对数表示,组间比较采用 χ2检验。单因素和多因素分析采用Logistic回归模型。 结果:(1)训练集及验证集患者临床病理资料分析:训练集和验证集患者性别(男,女)分别为157、36例和78、6例,两组比较,差异有统计学意义( χ2=6.028, P<0.05)。(2)影响训练集患者肿瘤MVI危险因素分析:训练集193例患者中,MVI阳性108例,MVI阴性85例。单因素分析结果显示:年龄、肿瘤数目、肿瘤直径、卫星病灶、肿瘤边界、甲胎蛋白(AFP)、碱性磷酸酶(ALP)和纤维蛋白原水平是影响肿瘤MVI的相关因素(比值比=0.971,2.449,1.368,4.050,2.956,4.083,2.532,1.996,95%可信区间为0.943~1.000,1.169~5.130,1.180~1.585,1.316~12.465,1.310~6.670,2.214~7.532,1.016~6.311,1.323~3.012, P<0.05)。多因素分析结果显示:AFP>20 μg/L、肿瘤多发、肿瘤直径越大、肿瘤边界不光滑是影响肿瘤MVI的独立危险因素(比值比=3.680,3.100,1.438,3.628,95%可信区间为1.842~7.351,1.334~7.203,1.201~1.721,1.438~9.150, P<0.05),而年龄越大,MVI发生风险越低(比值比=0.958,95%可信区间为0.923~0.994, P<0.05)。(3)机器学习算法预测模型构建及其术前预测肿瘤MVI准确性比较:①应用多因素分析结果筛选指标,包括年龄、AFP、肿瘤数目、肿瘤直径、肿瘤边界,构建逻辑回归列线图,SVM、RF、ANN及LightGBM机器学习算法预测模型,一致性分析结果显示逻辑回归列线图预测模型稳定性较好。逻辑回归列线图、SVM、RF、ANN、LightGBM机器学习算法预测模型训练集和验证集曲线下面积(AUC)分别为0.812、0.794、0.807、0.814、0.810和0.784、0.793、0.783、0.803、0.815,SVM、RF、ANN、LightGBM机器学习算法AUC分别与逻辑回归列线图AUC比较,差异均无统计学意义[(95%可信区间为0.731~0.849,0.744~0.860,0.752~0.867,0.747~ 0.862,Z=0.995,0.245,0.130,0.102, P>0.05)和(95%可信区间为0.690~0.873,0.679~0.865,0.702~0.882,0.715~ 0.891,Z=0.325,0.026,0.744,0.803, P>0.05)]。②应用RF、LightGBM机器学习算法自行筛选临床病理因素指标构建预测模型。根据指标对预测模型重要度排序,选择重要度>0.01的指标,包括年龄、肿瘤直径、AFP、白细胞(WBC)、血小板、总胆红素、天冬氨酸氨基转移酶、γ-谷氨酰转移酶、ALP和纤维蛋白原,构建RF机器学习算法预测模型;挑选重要度>5.0的指标,包括年龄、肿瘤直径、AFP、WBC、ALP和纤维蛋白原,构建LightGBM机器学习算法预测模型;由于ANN及SVM机器学习算法不具备筛选指标能力,应用单因素分析结果筛选指标,包括年龄、肿瘤数目、肿瘤直径、卫星病灶、肿瘤边界、AFP、ALP和纤维蛋白原水平,构建SVM、ANN机器学习算法预测模型。SVM、RF、ANN、LightGBM机器学习算法预测模型训练集和验证集AUC分别为0.803、0.838、0.793、0.847和0.810、0.802、0.802、0.836,分别与逻辑回归列线图AUC比较,差异均无统计学意义[(95%可信区间为0.740~0.857,0.779~0.887,0.729~0.848,0.789~0.895,Z=0.421,0.119,0.689,1.517, P>0.05)和(95%可信区间为0.710~0.888,0.700~0.881,0.701~0.881,0.740~0.908,Z=0.856,0.458,0.532,1.306, P>0.05)]。 结论:机器学习算法可用于术前预测肝细胞癌MVI,但其应用价值尚需多中心大样本数据进一步验证。
...不再出现此类内容
编辑人员丨2天前
-
基于不平衡数据的非肾病水平蛋白尿的膜性肾病预后模型建立
编辑人员丨2天前
目的:探索基于不平衡数据构建预测非肾病水平蛋白尿的膜性肾病预后的机器学习模型。方法:回顾性分析山西省人民医院2018年1月至2021年12月肾活检诊断为非肾病水平蛋白尿的膜性肾病患者的临床和病理资料。基于logistic回归、支持向量机(SVM)和轻量梯度提升(lightGBM)3种机器学习算法构建预测模型。采用混合采样技术处理不平衡数据,使用受试者工作特征曲线下面积(AUC)评估模型预测性能,运用Shapley加法解释(SHAP)对最佳性能模型的结果进行解释。结果:共纳入148例患者,男84例,女64例,年龄(47.2±12.5)岁,随访时间[ M( Q1, Q3)]14(7,20)个月。23例(15.5%)患者发生肾脏终点事件。SVM模型的AUC值最高(0.868,95% CI:0.813~0.925),其次为logistic回归(AUC:0.865,95% CI:0.755~0.899)和lightGBM(AUC:0.791,95% CI:0.690~0.882)。基于随机森林的特征递归消除交叉验证(RFECV)方法和SVM模型的SHAP图显示,免疫组化IgG、血清总蛋白(TP)、血清抗磷脂酶A2受体抗体(anti-PLA2R)、血氯、D-二聚体是影响非肾病水平蛋白尿的膜性肾病预后的危险因素,其中免疫组化IgG、anti-PLA2R、D-二聚体水平越高,患者达到肾脏终点事件的风险越高。 结论:本研究建立的SVM模型可有效预测非肾病水平蛋白尿的膜性肾病的预后,为早期识别高危患者及精准治疗提供了新方法。
...不再出现此类内容
编辑人员丨2天前
-
18F-FDG PET/CT影像组学对肺腺癌患者PD-L1表达水平的预测价值
编辑人员丨2天前
目的:探究 18F-脱氧葡萄糖(FDG)PET/CT影像组学特征预测肺腺癌患者程序性细胞死亡蛋白配体1(PD-L1)表达水平的临床应用价值。 方法:回顾性纳入2017年1月至2019年1月间北京大学肿瘤医院核医学科101例病理确诊且治疗前行 18F-FDG PET/CT检查的肺腺癌患者(男43例、女58例,中位年龄60岁)。免疫组织化学检测PD-L1表达阳性44例,阴性57例;分为训练组(71例)和验证组(30例)。分别提取患者临床病理资料、PET/CT影像组学特征、PET传统代谢参数、CT征象,将其纳入模型,使用过滤法和嵌入法进行特征选择。基于logistic回归、随机森林、XGBoost与轻量梯度提升机(LightGBM),分别进行训练并评估预测效果,优化得出预测PD-L1水平的最佳模型参数及相应受试者工作特征曲线下面积(AUC)。 结果:对于PD-L1表达,各模型均有一定的预测效果,以LightGBM模型最优,其对阳性和阴性的预测精确率分别为0.85和0.76。将临床资料+CT信息纳入LightGBM,精确率、召回率、F1指数在阳性组和阴性组中分别为0.71、0.67、0.69和0.69、0.73、0.72,准确性为0.70,AUC为0.79;相应地,临床资料+PET预测模型的精确率、召回率、F1指数在阳性组和阴性组中分别为0.79、0.73、0.76和0.75、0.80、0.77,准确性为0.77,AUC为0.80;临床资料+CT+PET预测模型的精确率、召回率、F1指数在阳性组和阴性组中分别为0.85、0.73、0.79和0.76、0.87、0.81,准确性为0.80,AUC为0.83。从最佳预测模型(临床资料+CT+PET)中筛选出的重要特征包括最大标准摄取值(SUV max)、标准摄取峰值(SUV peak)、CT特征_二维最大径、PET特征_形状伸长、PET特征_灰度共生矩阵相关等。 结论:联合临床资料、PET/CT影像组学特征、传统代谢参数可以有效预测PD-L1表达水平,辅助临床筛选免疫治疗获益人群。
...不再出现此类内容
编辑人员丨2天前
-
基于CT增强的影像组学诺模图在术前评估结肠癌微卫星不稳定状态的应用价值
编辑人员丨1个月前
目的 评估基于CT增强的影像组学诺模图对结肠癌微卫星不稳定(MSI)状态的预测价值.方法 回顾性分析129例术后明确MSI状态的结肠癌患者,按照7∶3的比例随机分为训练组(n=90)和验证组(n=39),从患者术前CT增强图像中提取影像组学特征,通过曲线下面积(AUC)评估不同机器学习算法的预测性能,并结合临床独立危险因素构建诺模图模型.采用决策曲线分析(DCA)评估模型的综合性能.结果 年龄和病变部位作为显著的独立危险因素被用以构建临床模型.选取轻量级梯度提升机(LightGBM)算法建立影像组学模型.诺模图模型作为联合模型,在训练组和验证组AUC分别为0.917和0.822,DCA显示诺模图模型具有良好的临床应用价值.结论 基于CT增强的影像组学诺模图提供了一种全新的结肠癌MSI状态的个性化预测方法.
...不再出现此类内容
编辑人员丨1个月前
-
2型糖尿病发生与多溴联苯醚暴露的关系及其预测模型构建和评价
编辑人员丨2024/7/13
目的 分析2型糖尿病(T2DM)发生与多溴联苯醚(PBDEs)暴露的关系,通过机器学习方法构建T2DM发生的预测模型并进行评价.方法 在NHANES数据库筛选出1 425例研究对象,其中非T2DM患者1 132例、T2DM患者293例.比较非T2DM患者与T2DM患者的临床资料,取有统计学差异的临床资料进一步进行boruta特征筛选,以明确T2DM发生与PBDEs的关系及其影响因素.将筛选出的T2DM发生影响因素输入R软件,并使用R软件creatDataPartition函数将数据按照80%训练集及20%验证集随机划分.使用逻辑回归、极致梯度提升(XGBoost)、轻量梯度提升、自适应增强、K近邻、朴素贝叶斯及支持向量机等7种算法构建机器学习模型,将训练集输入模型进行训练,将验证集输入模型使用十折交叉验证对进行模型进行内部验证.结合ROC曲线以及曲线下面积(AUC)对模型进行评价,选择新疆医科大学一附院内分泌科就诊的成人T2DM患者71例及健康体检者100例对效能最好的预测模型进行外部验证.使用SHAP工具分析高效能预测模型的可解释性,判断模型在决策过程中各个特征的重要性.结果 T2DM患者BMI、腰围、受教育程度、有糖尿病家族史比例、血清高密度脂蛋白及血清BDE-28、BDE-47、BDE-99、BDE-183、BDE-209浓度均高于非T2DM患者(P均<0.05),Boruta特征筛选出腰围、BMI、糖尿病家族史及血清BDE-47、BDE-99、BDE-28、BDE-209、BDE-183作为T2DM发生的影响因素纳入机器学习算法建立T2DM发生的预测模型.在训练集及验证集的内部验证中,XGBoost模型AUC值均最高,且准确度、Kappa值、灵敏度及特异度均位于前列,故选择XGBoost模型作为高效能预测模型.外部验证结果显示,XGBoost模型的准确度为0.702、灵敏度为0.549、特异度为0.787、AUC(95%CI)为0.674(0.575~0.773).SHAP工具对XGBoost模型的预测情况进行解释性分析结果显示,腰围、血清BDE-47为最重要的预测特征,同时血清BDE-99、BDE-209及BMI、糖尿病家族史在模型中具有较高的重要性,而血清BDE-28、BDE-183在模型中重要性相对较低.结论 血清BDE-47、BDE-99、BDE-28、BDE-209、BDE-183为T2DM发生的独立影响因素,基于血清PBDEs及腰围、BMI、糖尿病家族史建立的XGBoost模型对T2DM发生的预测效能较高,在T2DM发生的预测方面具有一定价值.
...不再出现此类内容
编辑人员丨2024/7/13
-
多序列MRI影像组学在脑膜瘤鉴别诊断中的价值
编辑人员丨2024/6/15
目的 探讨多序列MRI影像组学特征联合常规征象鉴别诊断脑膜瘤与其他颅内脑膜起源肿瘤的价值.材料与方法 回顾性分析经病理证实的两个中心共360例患者的临床及术前MRI资料.中心1患者256例(脑膜瘤145例、非脑膜瘤111例),按7∶3的比例随机分为训练组(n=179)和测试组(n=77);中心2患者104例作为外部验证组(脑膜瘤53例,非脑膜瘤51例).评估肿瘤的生长部位、生长方式、数目等18项一般临床资料及MRI常规征象,采用单变量及多变量二元logistic回归分析筛选与鉴别诊断相关的指标.图像标准化后,利用3D Slicer软件于T2WI、扩散加权成像(diffusion-weighted imaging,DWI)、T1WI增强图像勾画感兴趣区(region of interest,ROI)并进行特征提取;采用5折交叉验证法和最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)进行特征筛选.训练组、测试组采用逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)、K近邻(K-nearest neighbor,KNN)、轻量级梯度提升机(light gradient boosting machine,LightGBM)、自适应增强(adaptive boosting,AdaBoost)5种分类器进行建模,建立MRI常规模型、组学瘤内模型、组学瘤周模型、组学融合模型、全融合模型,筛选出其中效能最佳的模型进行外部验证.绘制受试者工作特征(receiver operating characteristic,ROC)曲线,评估模型的鉴别诊断效能;使用DeLong检验对模型曲线下面积(area under the curve,AUC)进行比较;使用决策曲线分析(decision curve analysis,DCA)评估模型的临床价值.结果 不同分类器构建的同一模型效能不同,其中SVM模型整体效能较高,测试组组学瘤内SVM模型AUC为0.889,除此之外训练组、测试组所有SVM模型AUC均大于0.900.组学瘤内模型、组学瘤周模型效能相当,二者均高于MRI常规模型;组学融合模型效能高于三者,但全融合模型效能最佳;其在外部验证组中亦表现良好,AUC为0.925,准确率为88.5%,DCA显示该模型在大范围阈值内可以为患者带来临床净收益.结论 基于多序列MRI影像组学特征模型可以在术前鉴别脑膜瘤与其他颅内脑膜起源肿瘤,联合常规征象可以提升模型效能;不同分类器对模型效能有影响,SVM模型效能高,稳健且泛化能力好.
...不再出现此类内容
编辑人员丨2024/6/15
