-
基于列线图及机器学习的免疫检查点抑制剂相关性肺炎风险预测模型构建及验证
编辑人员丨4天前
目的:运用机器学习算法及列线图,构建和验证免疫检查点抑制剂相关性肺炎(CIP)风险预测模型,旨在为更好的辅助临床护理人员筛查CIP的高危人群,提供准确直观的方法。方法:采用回顾性病例对照研究。选取2019年1月至2022年2月南方医科大学珠江医院就诊的230例使用免疫检查点抑制剂治疗的肿瘤患者,使用医院电子病历系统收集患者的资料。应用5种机器学习算法和列线图构建预测模型,在独立测试集进行模型的验证,最后依据评价指标AUC、准确率等评估预测模型的区分度及稳定性。结果:6种模型均提示,肺部基础疾病、吸烟史、血清白蛋白值≤35 g/L、胸部放疗史是促进CIP发生的重要影响因素。K最近邻、支持向量机(SVM)、朴素贝叶斯、决策树和随机森林构建的CIP预测模型的AUC分别为0.647、0.696、0.930、0.870、0.934。列线图构建的模型AUC为0.813,预测性能较好,但低于机器学习算法中表现最佳的随机森林模型(AUC=0.934)。结论:与列线图相比,基于机器学习算法建立的CIP的风险预测模型具有更高的诊断价值,但列线图构建的模型可更直观评估患者风险,建议在列线图基础上,结合机器学习算法,可增加预测模型的准确性及实用性。
...不再出现此类内容
编辑人员丨4天前
-
基于监督机器学习算法构建脓毒性休克患者死亡风险的预测模型
编辑人员丨4天前
目的:基于不同监督机器学习算法,构建并验证适用于脓毒性休克患者28 d死亡风险的最佳预测模型。方法:从美国重症监护医学信息数据库Ⅳ v2.0(MIMIC-Ⅳ v2.0)中筛选出符合脓毒症3.0的脓毒性休克患者,随机抽取病例,其中70%作为训练集,30%作为验证集。从人口学特征及基础生命体征、入重症监护病房(ICU)24 h内血清学指标及可能影响指标的合并症、功能评分及高级生命支持3个层面提取相关预测变量。比较基于决策树分类回归树(CART)、随机森林(RF)、支持向量机(SVM)、线性回归(LR)及超级学习器〔SL,综合了CART、RF和极端梯度提升(XGBoost)〕5种主流机器学习算法构建的模型对脓毒性休克患者28 d死亡的预测效能,筛选最佳算法模型。利用LASSO回归、RF和XGBoost算法,通过取交集确定最佳预测变量,构建预测模型。采用受试者工作特征曲线(ROC曲线)验证模型的预测效能;采用校准曲线评估模型的准确性;采用决策曲线分析(DCA)验证模型的实用性。结果:最终共纳入3?295例脓毒性休克患者,28 d存活2?164例,死亡1?131例,病死率为34.32%;其中,训练集2?307例(28 d死亡792例,病死率为34.33%),验证集988例(28 d死亡339例,病死率为34.31%)。基于训练集数据分别建立5种机器学习模型;在纳入3个层面的变量后,RF、SVM、LR 3种机器学习模型在验证集预测脓毒性休克患者28 d死亡的ROC曲线下面积(AUC)依次为0.823〔95%可信区间(95% CI)为0.795~0.849〕、0.823(95% CI为0.796~0.849)、0.810(95% CI为0.782~0.838),高于CART算法模型(AUC=0.750,95% CI为0.717~0.782)和SL算法模型(AUC=0.756,95% CI为0.724~0.789),故将以上3种算法模型确定为最佳算法模型。综合3个层面变量后,通过LASSO回归、RF和XGBoost算法筛选并取交集,得出16个最佳预测变量,依次为入ICU 24 h内pH最大值、白蛋白(Alb)最大值、体温最大值、血乳酸(Lac)最小值、Lac最大值、血肌酐(SCr)最大值、Ca 2+最大值、血红蛋白(Hb)最小值、白细胞计数(WBC)最小值、年龄、简化急性生理学评分Ⅲ(SAPSⅢ)、WBC最大值、急性生理学评分Ⅲ(APSⅢ)、Na +最小值、体质量指数(BMI)及活化部分凝血活酶时间(APTT)最小值。ROC曲线分析显示,以上述16个最佳预测变量构建的Logistic回归模型为最佳预测模型,在验证集中的AUC为0.806(95% CI为0.778~0.835);校准曲线及DCA曲线显示,该模型的精准度较高,且净收益最高可达0.3,其预测效能明显优于传统以单一功能评分〔APSⅢ评分、SAPSⅢ评分、序贯器官衰竭评分(SOFA)〕建立的模型〔AUC(95% CI)分别为0.746(0.715~0.778)、0.765(0.734~0.796)、0.625(0.589~0.661)〕。 结论:以pH值、Alb、体温、Lac、SCr、Ca 2+、Hb、WBC、SAPSⅢ评分、APSⅢ评分、Na +、BMI、APTT等16个最佳变量构建的Logistic回归模型为脓毒性休克患者28 d死亡风险的最佳预测模型,其效能稳定,区分度及精准度均较高。
...不再出现此类内容
编辑人员丨4天前
-
采用机器学习技术建立布鲁杆菌病早期预测模型
编辑人员丨4天前
采用机器学习技术构建布鲁杆菌病(简称:布病)早期预测模型,以辅助提高布病的诊断效率。本文为病例对照研究,收集2011年5月9日至2021年11月29日首都医科大学附属北京地坛医院的布病患者2 381例作为病例组,首都医科大学附属北京朝阳医院表观健康人检验数据13 257例作为对照组。采用患者年龄、性别、临床诊断信息及22项血细胞分析结果,使用机器学习的随机森林、朴素贝叶斯、决策树、逻辑回归和支持向量机5种算法构建布病早期预测模型;其中14 074例(病例组2 143例,对照组11 931名)用于构建布病早期预测模型,1 564例(病例组238例,对照组1 326名)用于测试模型的预测效能。结果显示,通过对5种机器学习模型进行比对,支持向量机模型预测性能最佳,受试者工作曲线(ROC)线下面积(AUC)为0.991,准确度、精确度、特异度和召回率分别可达95.6%、95.5%、95.4%和95.9%。依据SHAP图显示,血小板分布宽度(PDW)和嗜碱粒细胞相对值(BASO%)结果较低,红细胞分布宽度变异系数(R-CV)、红细胞血红蛋白浓度(MCHC)和血小板体积(MPV)结果高的男性被预测为布病风险高。其中,血小板分布宽度(PDW)对预测模型贡献度最大,红细胞分布宽度变异系数(R-CV)次之。综上,基于机器学习技术建立高灵敏度的布病早期预测方法,对布病患者的及早发现、尽快治疗可能具有重要意义。
...不再出现此类内容
编辑人员丨4天前
-
建立肝硬化门静脉高压症出血治疗方式预测模型
编辑人员丨4天前
收集2012年1月至2018年1月嘉兴市第一医院收治的诊断为肝硬化门静脉高压症食管-胃底静脉曲张破裂出血、手术后恢复良好且2年内未再复发的136例患者资料,运用机器学习随机森林算法建立肝硬化门静脉高压症食管-胃底静脉曲张破裂出血治疗方式预测模型。结果显示白细胞计数、血肌酐、凝血酶时间、血小板计数、活化部分凝血活酶时间和年龄是治疗方式的影响因素,且机器学习建立的预测模型精确度高。该模型为患者治疗方式的选择提供了科学依据,并且对大数据人工智能融入临床工作有一定启示。
...不再出现此类内容
编辑人员丨4天前
-
可解释的机器学习模型预测缺血性脑卒中患者预后研究
编辑人员丨4天前
目的:探讨可解释的机器学习模型预测急性缺血性脑卒中预后的应用价值。方法:选取广东医科大学附属湛江中心医院神经内科自2020年3月至2023年10月实施静脉溶栓治疗的296例急性缺血性脑卒中患者为研究对象,随访3个月后使用改良Rankin量表评估预后(0~2分定义为预后良好,3~6分定义为预后不良)。回顾性收集患者的临床资料,并采用多因素Logistic回归分析筛选出患者预后的独立影响因素。以3∶2比例将患者随机分为训练集( n=178)和测试集( n=118),以预后独立影响因素为特征变量训练10种机器学习模型(逻辑回归、随机森林、支持向量机、朴素贝叶斯、线性判别分析、混合判别分析、灵活判别分析、梯度增强机、极端梯度提升和分类梯度提升),分别使用校准曲线、精确-召回曲线、精确-召回增益曲线及受试者工作特征曲线评估这10种机器学习模型的预测性能,使用Shapley加法解释(SHAP)对机器学习模型附加解释和可视化(包含全局解释和局部解释)。 结果:296例患者中预后不良72例。年龄( OR=1.039,95% CI:1.008~1.072, P=0.015)、美国国立卫生研究院卒中量表评分( OR=1.213,95% CI:1.000~1.337, P<0.001)、格拉斯哥昏迷量表评分( OR=0.470,95% CI:0.289~0.765, P=0.002,)、卒中预测工具-Ⅱ评分( OR=1.257,95% CI:1.043~1.516, P=0.016)、C反应蛋白水平( OR=1.709,95% CI:1.398~2.087, P<0.001)和血小板计数( OR=0.988,95% CI:0.978~0.998, P=0.016)是患者预后的独立影响因素。在10种机器学习模型中,极端梯度提升模型预测患者预后的性能最高(校准曲线评估示一致性指数为0.896,精确-召回曲线评估示曲线下面积为0.791,精确-召回增益曲线示曲线下面积为0.363,受试者工作特征曲线示曲线下面积为0.856)。全局解释中SHAP直观图显示特征变量的重要性排序依次为C反应蛋白、美国国立卫生研究院卒中量表评分、血小板计数、格拉斯哥昏迷量表评分、卒中预测工具-Ⅱ评分和年龄;SHAP散点图可视化了6个特征变量的贡献方向,呈"两端分布"现象;SHAP依赖图显示了6个特征变量的观测值与SHAP值间的依赖关系,其中C反应蛋白趋势最为显著。SHAP力图为单个样本提供了局部解释,使得极端梯度提升模型更加透明和可解释性。 结论:基于年龄、美国国立卫生研究院卒中量表评分、格拉斯哥昏迷量表评分、卒中预测工具-Ⅱ评分、C反应蛋白水平和血小板计数为特征变量的极端梯度提升模型预测急性缺血性脑卒中患者预后的性能最优,在此基础上结合SHAP进行模型解释和可视化,有助于理解各特征变量对预测结果的贡献大小及方向。
...不再出现此类内容
编辑人员丨4天前
-
基于随机森林算法的中青年妇科恶性肿瘤患者心理痛苦预测模型构建及验证
编辑人员丨4天前
目的:基于随机森林算法构建中青年妇科恶性肿瘤患者心理痛苦风险预测模型并验证其预测效果,为医护人员早期发现患者心理痛苦提供工具。方法:采用横断面研究,以整群抽样法选取2021年10月至2022年10月天津市6所三级甲等医院妇科和肿瘤科收治的中青年妇科恶性肿瘤患者385例,采用R-studio软件以7∶3比例将研究对象随机分为训练集270例和测试集115例。根据是否存在心理痛苦将训练集患者分为心理痛苦阳性151例和心理痛苦阴性119例,对各影响因素进行单因素分析。采用R-studio软件在训练集上建立中青年妇科恶性肿瘤患者心理痛苦预测的随机森林模型并在测试集上验证。结果:模型预测准确度为94.78%,灵敏度为96.88%,特异度为92.16%,阳性预测值为93.94%,阴性预测值为95.92%,AUC为0.992(95% CI 0.982~1.000)。根据各影响因素在随机森林模型中的Gini系数平均下降量进行排序,得出前5位重要预测变量依次为:一般自我效能感量表得分、Herth希望量表得分、领悟社会支持量表得分、抑郁自评量表得分、焦虑自评量表得分。 结论:基于随机森林算法构建的中青年妇科恶性肿瘤患者心理痛苦预测模型有较高的预测效能,可为医护人员及早识别患者心理痛苦并制订干预措施提供参考。
...不再出现此类内容
编辑人员丨4天前
-
白癜风患者肠道微生物菌群特征研究
编辑人员丨4天前
目的:探讨白癜风患者肠道微生物菌群特点,分析肠道菌群变化与白癜风发病的关系,为临床治疗提供新思路。方法:2017年4-12月,杭州市第三人民医院皮肤科收集30例白癜风患者及30例健康对照粪便标本,通过Roche/45高通量测序平台对其16S rRNA V3区进行定性分析;用宏基因组学对5例白癜风患者粪便及5例健康对照者粪便进行分析,明确其潜在调控通路。结果:与健康对照比较,白癜风患者粪便中细菌物种相似,但白癜风患者肠道微生物多样性富集明显减少( P<0.05);在门水平上,变形杆菌和梭杆菌丰度明显降低;在属水平上,7个种属(拟杆菌、大肠杆菌志贺菌、罗氏囊菌、相炭疽杆菌、梭杆菌、柔膜细菌-RF9、普氏菌-7)丰度明显降低( P<0.05),4个种属(瘤胃球菌-1、瘤胃球菌科UCG、毛螺菌科、链球菌)明显增加( P<0.05);链球菌属及相炭疽杆菌在白癜风患者表达差异尤为明显,前者增加10.8倍,后者减少6.517倍。通过构建一个基于11个白癜风相关属的肠道微生物菌群的随机森林模型,显示该判别模型在ROC中AUC为0.89;宏基因组分析显示,白癜风相关菌群失调主要与免疫相关通路(如WNT通路、Notch通路等)、能量代谢、线粒体功能、氨基酸代谢(如苯丙氨酸代谢)通路相关。 结论:白癜风患者肠道微生态环境中细菌群落多样性与健康对照存在明显差异,其菌群失调可能参与白癜风的发病发展,补充益生菌可能有益于白癜风治疗。
...不再出现此类内容
编辑人员丨4天前
-
伴右向左分流隐源性卒中患者发病风险预测模型研究
编辑人员丨4天前
目的:利用机器学习预测右向左分流(right-to-left shunt,RLS)人群隐源性卒中(cryptogenic stroke,CS)发病风险,为CS的准确和高效预测提供解决方案。方法:回顾分析2018年1月至2023年9月在青岛大学附属医院崂山院区神经内科治疗的经颅多普勒超声发泡试验(c-TCD)阳性的289例RLS人群的临床数据,包括人口统计学信息、疾病史、实验室检查指标、诊断和治疗等。使用机器学习train_test_split()函数将数据集随机分为训练集和测试集,比例为8∶2。采用Logistic回归、决策树、随机森林、极端梯度提升、人工神经网络、梯度提升、极限树和自适应增强等算法构建RLS人群CS风险预测模型,使用受试者工作特征曲线(receiver operating characteristic,ROC)及曲线下面积(area under curve,AUC)、混淆矩阵、精确率、召回率、准确率、F1值、校准曲线、决策曲线等综合评估模型性能。性能最优的模型使用特征重要性和SHAP值进行可解释性分析。使用SPSS 25.0进行 t检验、Mann-Whitney U检验和 χ2检验。采用Delong检验比较两模型间AUC的差异。 结果:289例RLS人群发生CS 166例(57.5%),非CS 123例(42.5%)。统计分析结果显示,CS患者D-二聚体、平均血小板体积、纤维蛋白原等血液生化指标高于非CS患者(均 P<0.01);训练集与测试集各变量均差异无统计学意义(均 P>0.05)。对测试集进行CS风险预测,随机森林模型取得了最高的AUC(0.885)、精确率(0.806)、召回率(0.879)、准确率(0.810)以及F1得分(0.841)。校准曲线显示随机森林模型最接近参考线,决策曲线表明随机森林模型具有更大的净受益。可解释性分析显示高风险因素包括平均血小板体积、D-二聚体、国际标准化比值、体质量指数以及年龄。 结论:基于随机森林的预测工具表现出色,在预测RLS人群CS风险方面准确性较高。
...不再出现此类内容
编辑人员丨4天前
-
基于CT影像组学的机器学习模型预测胰腺癌门静脉-肠系膜上静脉侵犯的研究
编辑人员丨4天前
目的:探讨基于CT影像组学的机器学习模型预测胰腺癌门静脉-肠系膜上静脉(PV-SMV)侵犯的价值。方法:回顾性分析2010年1月至2021年7月南京医科大学附属无锡第二医院收治的156例经手术病理确诊的胰腺癌患者的临床、病理及术前CT影像资料,其中男性95例,女性61例,年龄(65.7±8.2)岁。所有入组患者按3∶2的比例划分训练集和验证集。通过患者术前增强CT提取肿瘤影像组学特征,采用最大相关最小冗余算法进行特征选择后,构建5种机器学习算法预测模型,并与常规影像特征诊断的受试者工作特征(ROC)曲线进行比较。结果:94例患者纳入训练集,62例纳入验证集。训练集和验证集中手术探查证实的PV-SMV侵犯病例分别为30例(31.9%)和25例(40.3%)。基于10个影像组学特征构建的5个机器学习模型中,LASSO回归模型的AUC优于随机森林、支持向量机、K近邻和朴素贝叶斯4个模型,差异有统计学意义(均 P<0.05)。与常规影像特征的诊断效能比较,LASSO回归模型在验证集中诊断PV-SMV侵犯具有更高的AUC(0.920比0.752)和更好的灵敏度(92.0%比86.5%),差异具有统计学意义(均 P<0.05)。 结论:基于CT影像组学的机器学习模型可实现胰腺癌PV-SMV侵犯的术前预测,LASSO回归模型较常规影像特征的诊断效能更高。
...不再出现此类内容
编辑人员丨4天前
-
随机生存森林:基于机器学习算法的生存分析模型
编辑人员丨4天前
传统的生存分析方法虽在生物医学领域已有广泛应用,但需满足一些前提假设。随机生存森林方法可克服这一弱点。本文以美国梅奥诊所的肝脏原发性胆汁肝硬化的数据为例,从随机生存森林的原理、建模步骤、实例演示和适用性讨论等方面进行阐述,以期为读者进行生存分析提供新的思路和方法。
...不再出现此类内容
编辑人员丨4天前
