-
机器学习方法构建老年心房颤动合并冠心病患者远期死亡的预测模型研究
编辑人员丨5天前
目的:利用机器学习方法建立老年心房颤动(房颤)合并冠心病患者的远期死亡预测模型,并确定相应的危险因素。方法:回顾性队列研究,连续入组2013年1月至2015年3月北京医院收治的60岁及以上房颤合并冠心病患者329例,男性183例(55.6%)例,女性146例(44.4%),年龄(77.8±7.3)岁,80岁及以上142例(43.2%)。失访11例(3.3%),死亡151例(45.9%),最后纳入分析的患者共318例。根据患者生存结局,将318例患者分为死亡组(151例)和存活组(167例)。此外,另选取2015年4—7月入院的60岁及以上房颤合并冠心病患者60例为外部数据验证集。采集人口统计学参数、合并疾病、辅助检查和临床治疗情况。随访至少6年,记录包括死亡在内的主要不良心脑血管事件(MACCE)。最后将入组患者按9∶1的比例随机分为训练集和测试集,通过机器学习算法建立不同模型预测房颤合并冠心病患者远期死亡率,并通过外部数据(60例)验证比较确立最优模型,利用Shapley加法解释算法对变量的重要性进行排序,得出排名前20位的特征变量,以确定危险因素。结果:329例患者中,总体中位随访时间77.0月(95% CI:54.0~84.0),失访11例(3.3%),死亡151例(45.9%)。通过分析得出支持向量机模型、k-近邻算法(KNN)模型、决策树模型、随机森林模型、ADABoost模型、XGBoost模型、Logistic回归模型预测远期死亡率的受试者工作特征曲线(ROC)下面积(AUC)分别为0.76、0.75、0.75、0.91、0.86、0.85和0.81。其中随机森林模型预测效能最高,其准确率达0.789,F1值高达0.806,且优于传统的Logistic回归模型(AUC:0.91比0.81, P<0.05)。D-二聚体、年龄、MACCE次数、左心室射血分数、人血白蛋白水平、贫血、纽约心脏病协会心功能分级、陈旧性心肌梗死病史、估测肾小球滤过率(eGFR)及静息心率是预测远期死亡率的重要危险因素。 结论:基于机器学习方法建立的随机森林模型可预测老年房颤合并冠心病患者的远期死亡率,具有较好的识别能力,其准确性高于传统的Logistic回归模型。可通过干预患者的D-二聚体水平、纠正低蛋白血症和贫血、改善心功能和控制静息心室率降低远期死亡率,改善患者远期预后。
...不再出现此类内容
编辑人员丨5天前
-
基于脑部T 2WI病灶影像组学的机器学习模型鉴别多发性硬化和视神经脊髓炎谱系疾病的多中心研究
编辑人员丨5天前
目的:探讨基于脑部T 2WI病灶影像组学的机器学习模型鉴别多发性硬化(MS)和视神经脊髓炎谱系疾病(NMOSD)的效能。 方法:回顾性分析2009年1月至2018年9月在首都医科大学附属北京天坛医院、南昌大学第一附属医院东湖院区、天津医科大学总医院、首都医科大学宣武医院接受诊治的MS和NMOSD患者223例的资料,按照7∶3的比例完全随机分为训练集(156例)和测试集(67例)。收集2009年1月至2018年9月在复旦大学附属华山医院、吉林大学中日联谊医院接受诊治以及2020年3月至2021年9月在南昌大学第一附属医院象湖院区接受诊治的MS和NMOSD患者共74例作为独立的外部验证集。对患者进行脑部横断面MR T 2WI,从T 2WI中提取影像组学特征,通过最小冗余最大相关性和最小绝对收缩和选择算子算法进行特征选择,之后构建各种机器学习分类器模型(logistic回归、决策树、AdaBoost、随机森林或支持向量机)鉴别诊断MS与NMOSD。采用受试者操作特征曲线的曲线下面积(AUC)评估训练集、测试集、外部验证集中各分类器模型的性能。 结果:基于多中心的T 2WI,共提取了11个与区分MS和NMOSD有关的影像组学特征并构建分类器模型。其中随机森林模型区分MS与NMOSD的效能最好,其在训练集、测试集和外部验证集中区分MS与NMOSD的AUC值分别为1.000、0.944和0.902,特异度分别为100%、76.9%和86.0%,灵敏度分别为100%、92.1%和79.7%。 结论:基于脑部病灶T 2WI的影像组学特征构建的随机森林模型可以有效地区分MS和NMOSD。
...不再出现此类内容
编辑人员丨5天前
-
基于机器学习算法的心力衰竭预测模型
编辑人员丨2024/6/22
目的 4 种机器学习算法构建心力衰竭风险预测模型,为早期发现病患和治疗干预提供理论支撑.方法 通过对Kaggle社区上发布的心力衰竭数据集预处理后,使用特征选择筛选出与心衰的相关因素作为预测指标,选择逻辑回归、决策树、AdaBoost、XGBoost 4 种机器学习算法建立预测模型.对其准确率、精准率、召回率、F1-Score、ROC曲线下面积(AUC)进行对比分析,以验证模型性能.结果 研究分析了 918 例心衰患者的 11 种特征,筛选出10 个特征因子纳入建模.经网格搜索方法超参数调优后,XGBoost 模型表现最优,准确率、精准率、召回率、f1_score、AUC值分别为 87.5%、90.38%、89.71%、90.04%、0.93.另外,数据分析显示运动ST段坡度、运动性心绞痛、胸痛类型、年龄为心力衰竭的主要影响因子.结论 XGBoost模型对心力衰竭预测性能最佳,机器学习算法能为心力衰竭的早期防控及诊断提供参考依据.
...不再出现此类内容
编辑人员丨2024/6/22
-
区分胶质母细胞瘤和单发性脑转移瘤的多模态融合深度学习模型的开发和验证
编辑人员丨2024/4/27
目的:胶质母细胞瘤(glioblastoma,GBM)和脑转移瘤(brain metastases,BMs)是成人中常见的恶性脑肿瘤,目前磁共振成像(magnetic resonance imaging,MRI)是筛查和评估脑肿瘤预后的常用方法,但其鉴别诊断GBM和BMs的特异性和敏感性有限.近年来,深度神经网络在诊断分类和创建临床决策支持系统方面显示出极大的潜力.本研究旨在应用深度学习技术提取的放射组学特征,探讨其在初诊GBM和单发性脑转移瘤(solitary brain metastases,SBMs)术前准确分类中的可行性,进一步探索基于多模态数据融合对分类任务的影响.方法:回顾性分析经组织病理或临床诊断证实的135例初诊GBM患者和73例SBMs患者的头颅MRI序列数据.首先,选择结构性T1加权、T1C加权和T2加权作为整个模型的3个输入,在配准后的3种模态MR图像上人工勾画感兴趣区域(regions of interest,ROI),并获取多模态放射组学特征,使用基于随机森林(random forest,RF)的特征选择方法降低维度,进一步分析每个特征的重要性.然后,通过对比解纠缠的方法寻找不同模态特征之间的共享特征和互补特征.最后,通过融合不同模态的2种特征,预测每个样本对GBM和SBMs的响应.结果:应用机器学习和本文提出的多模态融合方法的放射组学特征对GBM和SBMs有较好的区分能力.相较于单模态数据,应用支持向量机(support vector machine,SVM)、Logistic回归、RF、自适应增强(adaptive boosting,AdaBoost)、梯度提升决策树(gradient boosting decision tree,GBDT)机器学习算法的多模态融合模型均取得了较大提升,曲线下面积(area under the curve,AUC)分别为0.974、0.978、0.943、0.938、0.947.本研究的对比解纠缠多模态MR融合方法表现更好,测试集上AUC、准确度(accuracy,ACC)、灵敏度(sensitivity,SEN)、特异度(specificity,SPE)分别为0.985、0.984、0.900、0.990.相较于其他多模态融合方法,本研究方法的AUC、ACC和SEN均呈现出最好的性能表现.验证本研究各模块组件作用的消融实验中,同时使用3种损失函数后,AUC、ACC和SEN分别提升了1.6%、10.9%和15.0%.结论:基于深度学习的对比解纠缠多模态MR放射组学特征融合技术有助于提高GBM和SBMs的分类准确性.
...不再出现此类内容
编辑人员丨2024/4/27
-
基于机器学习构建贵州省大学生非自杀性自伤行为的预测模型
编辑人员丨2023/9/30
目的 探索机器学习算法在预测大学生非自杀性自伤(NSSI)行为中的效果,分析大学生NSSI行为的影响因素,为促进大学生心理健康提供参考.方法 于2022年12月采用分层随机整群抽样方法选取贵州省某高校835名大学生为研究对象,采用青少年自我伤害行为问卷、家庭功能评定量表、情绪调节自我效能感量表进行施测,以人口学特征、家庭因素和情绪因素为自变量,以大学生是否有NSSI行为为因变量,使用机器学习算法构建预测模型,包括逻辑回归、支持向量机、决策树、算法梯度提升树、随机森林、AdaBoost.结果 大学生NSSI行为检出率为23.23%(194名);NSSI行为组的家庭功能总分、情感交流、自我主义、家庭规则得分高于非NSSI行为组(t值分别为3.02,3.35,2.23,2.87,P值均<0.05),非NSSI行为组在情绪调节自我效能感总分、管理消极情绪自我效能感、表达积极情绪自我效能感得分高于NSSI行为组(t值分别为-5.04,-5.48,-2.43,P值均<0.05).随机森林、支持向量机、逻辑回归、决策树、算法梯度提升树、AdaBoost的召回率依次为 84.3%,90.6%,73.4%,87.5%,95.3%,89.0%;F1 依次为 84.4%,92.1%,71.2%,79.4%,91.7%,89.1%;精确度依次为84.4%,93.5%,69.1%,72.7%,88.4%,89.1%;AUC依次为 0.845,0.922,0.706,0.776,0.915,0.891.结论 相较于算法梯度提升树、随机森林、逻辑回归和AdaBoost模型,支持向量机模型预测贵州省大学生是否存在NSSI行为有较好的预测效果.应选择适合模型尽早识别可能存在NSSI行为的学生,对其进行心理危机干预,促进学生的心理健康.
...不再出现此类内容
编辑人员丨2023/9/30
-
不平衡数据处理方法对中药不良反应预测的应用研究
编辑人员丨2023/8/6
目的:针对中药不良反应数据的不平衡性,探索并应用不平衡数据的处理方法,对中药的不良反应进行预测.本文以使用丹红注射液的患者为研究对象,对来自37家医院集中监测数据进行深度挖掘,在使用了丹红注射液的患者中预测是否发生不良反应.方法:从数据层面采用四种方法:不处理、随机欠采样、随机过采样、SMOTE采样;从算法层面采用四种模型或算法:决策树、随机森林、AdaBoost算法、Gradient Boosting算法,对数据的不平衡性进行处理.两个层面的方法两两结合,对16种方法与模型或算法组合的预测效果进行比较.结果:随机欠采样和AdaBoost算法相结合、随机欠采样和Gradient Boosting算法相结合的预测效果较为理想,recall和G-mean都达到80%以上,AUC指标也高达0.86.结论:初步探索中药不良反应可能适用的不平衡数据处理方法,预测结果结合实际经验,能较准确地预测使用了丹红注射液的患者是否发生不良反应,在临床实际应用中能起到一定的警示作用.同时,根据输出的变量重要性排名,能最大程度地避免用药后的不良反应的发生,为丹红注射液的安全性再评价提供一些科学参考依据.
...不再出现此类内容
编辑人员丨2023/8/6
-
神经重症患者早期联合营养临床疗效研究
编辑人员丨2023/8/6
目的 探讨早期联合应用肠外肠内营养对神经重症患者的临床疗效.方法 纳入2018年1月1日至2018年8月31日人住上海市第十人民医院神经外科重症监护室(NICU)的255例神经重症患者,按营养方式分为传统的肠内营养组和早期联合肠外肠内营养治疗组,传统治疗组患者采取早期应用肠内营养液的疗法,而实验组患者在人院后行肠外营养,72 h后给予肠内营养液的疗法,比较两组患者出院后格拉斯哥预后评分(GOS评分)、个体不良反应发生率、日均肠内营养量、人血白蛋白补充量、日均补液量、肺部感染率和感染时间、住院期间白蛋白水平变化的差异.探讨联合营养组肠内营养时间及营养量与肺部感染、血清白蛋白水平之间的关系.采用决策树、随机森林、最邻近法、自适应助推法及自主整合模型进行拟合,对GOS评分进行预测.结果 共纳入255例患者,传统肠内营养组170例(对照组),早期肠外联合肠内营养组85例(实验组).1∶2倾向性得分匹配后各基线指标差异无统计学意义.两组间GOS评分OR=1.853(95%CI:1.018~3.385),P=0.043.白蛋白水平变化与营养方案的选择无关,但与入院意识水平和患者入院前基本白蛋白水平有关.实验组出院时意识水平较对照组更好,补液量更少,但日均肠内营养量及补充人血白蛋白的患者数更多,不良反应发生种类更多,发生时间更早(P<0.05).各GOS预测模型的误判率为0.482~0.606.结论 早期联合肠外肠内营养疗法与传统早期肠内营养疗法相比,对于神经重症患者的预后有提升作用.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于机器学习的院内消化道致命性再出血预测与指标筛选
编辑人员丨2023/8/6
目的 提出基于机器学习的院内消化道致命性再出血预测和指标筛选方法.方法 从解放军总医院急救数据库中提取确诊为消化道出血样本728例次,其中确定发生院内消化道致命性再出血患者343例次.提取、筛选得到相关生理或化验指标共计64项.在十折交叉验证的基础上,分别使用Logistic回归、以决策树为弱分类器的自适应增强(AdaBoost)算法、以决策树为弱分类器的XGBoost算法进行分类预测并对比;利用XGBoost算法进行序列特征前向搜索,以训练时迭代出的指标重要性进行筛选,并得到预测院内消化道致命性再出血的关键指标.结果 Logistic回归和基于决策树的AdaBoost算法、XGBoost算法在各特征输入维度下均得到了较好的F1.5分数,其中XGBoost算法效果最好、评分最高,即能够尽可能找出更多的可能发生院内消化道致命性再出血的患者.通过XGBoost算法迭代结果得到了预测院内消化道致命性再出血的前30个重要性较高的指标,其中前12个关键指标迭代时F1.5分数达到峰值(0.893),分别为血红蛋白测定(Hb)、钙(CA)、红细胞计数(RBC)、平均血小板体积测定(MPV)、平均红细胞血红蛋白浓度(MCH)、收缩压(SBP)、血小板计数(PLT)、镁(MG)、淋巴细胞(LYM)、葡萄糖(GLU,血气分析)、葡萄糖(GLU,血生化)、舒张压(DBP).结论 Logistic回归及基于决策树的AdaBoost算法和XGBoost算法都能达到预测院内消化道致命性再出血的预警目的,其中XGBboost算法更佳,并能得到12个关键指标.
...不再出现此类内容
编辑人员丨2023/8/6
-
数据挖掘技术在嗜铬细胞瘤术中血流动力学不稳定性预测的应用研究
编辑人员丨2023/8/6
目的 嗜铬细胞瘤手术切除可能导致术中血流动力学不稳定这一高风险因素发生,会危及生命.本次研究试图通过数据挖掘方法,发现可以预测嗜铬细胞瘤术中发生血流动力学不稳定情况发生的危险因素,为患者术前准备最佳治疗方案提供依据,为临床提供帮助.方法 分别使用朴素贝叶斯、决策树(CART、C4.5、C5.0、C5.0 boosted)、随机森林算法、支持向量机(Support Vector Machine,SVM)、Bootstrap-based Aggregate和AdaBoost九种模型,用交叉验证(Crossvalidation)、Hold-out方法和Bootstrap3种方法,对九种模型分别采取3种划分训练集和测试集的比例,计算准确率.并且计算sensitivity (recall)、specificity、precision、fl-score值进行比较.结果 根据结果显示,采用hold out方法划分训练集和测试集,划分比例为6∶4时,AdaBoost模型的准确率最高,为0.859 6.而且该模型的specificity、sensitivity (recall)、precision和fl-score指标都是最高的.prevma、ctvalue、bmi、intratime、age、size这6个属性的重要性最大,可以作为预测影响血流动力学不稳定性发生的重要因素.结论 数据挖掘技术用于预测嗜铬细胞瘤手术中的IHD风险因素是可行的.将来会越来越多地应用于临床和医学决策,为各种疾病的诊断,治疗和预防提供不断扩展的支持.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于集成学习模型预测重症患者再入重症监护病房的风险
编辑人员丨2023/8/5
目的:基于集成学习算法建立患者再入重症监护病房(intensive care unit,ICU)的风险预测模型,并比较各个模型的预测性能.方法:使用美国重症医学数据库(medical information mart for intensive care,MIMIC)-Ⅲ,根据纳入、排除标准筛选患者,提取人口学特征、生命体征、实验室检查、合并症等可能对结局有预测作用的变量,基于集成学习方法随机森林、自适应提升算法(adaptive boosting,AdaBoost)和梯度提升决策树(gradient boosting decision tree,GBDT)建立再入ICU预测模型,并比较集成学习与Logistic回归的预测性能.使用五折交叉验证后的平均灵敏度、阳性预测值、阴性预测值、假阳性率、假阴性率、受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)和Brier评分评价模型效果,基于最佳性能模型给出重要性排序前10位的预测变量.结果:所有模型中,GBDT(AUROC =0.858)优于随机森林(AUROC =0.827),略好于 AdaBoost(AUROC =0.851).与Logistic回归(AUROC = 0.810)相比,集成学习算法在区分度上均有较大的提升.GBDT算法给出的变量重要性排序中,平均动脉压、收缩压、舒张压、心率、尿量、血肌酐等变量排序靠前,相对而言,再入ICU患者的心血管功能和肾功能更差.结论:基于集成学习算法的患者再入ICU预测模型表现出较好的性能,优于Logistic回归.使用集成学习算法建立的再入ICU风险预测模型可用于识别再入ICU风险高的患者,医务人员可针对高风险患者采取干预措施,改善患者的整体临床结局.
...不再出现此类内容
编辑人员丨2023/8/5