-
基于随机森林算法的云南女性产后抑郁风险预测模型构建
编辑人员丨2天前
目的 建立针对云南省多民族人群的产后抑郁风险预测模型并识别预测因子.方法 于云南省某多民族聚居县对处于产后42天~1年的女性采用爱丁堡产后抑郁量表(Edinburgh Postnatal Depression Scale,EPDS)进行产后抑郁筛查.以是否存在产后抑郁症状(EPDS ≥9分)为结局指标,基于随机森林算法纳入人口经济学、社会心理学、产科学、新生儿、配偶及家庭、其他特征因素共52个影响因素,在训练集上构建云南多民族人群产后抑郁风险预测模型,在测试集上采用准确率、灵敏度、特异度、阳性预测值、阴性预测值及受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC曲线)下面积(Area Under Curve,AUC)评价该模型性能.结果 本研究纳入分析的女性为459名,产后抑郁检出率为11.55%,其中汉族7.56%、壮族13.94%、其他少数民族13.92%.重要性评分位于前14的变量为:焦虑、既往不良情绪史、夫妻感情、家人支持水平、照顾新生儿身心疲惫、妊娠风险分级、母婴同室、喂养模式、文化程度、配偶文化程度、夜间照顾新生儿次数、民族、孕次、年龄.该模型准确率为92.74%,特异度为95.50%,灵敏度为69.23%,阳性预测值为64.29%,阴性预测值为96.36%,AUC值为0.925.同时,分别以汉族、壮族和其他少数民族人群作为验证集进行内部验证,显示模型稳定性好.结论 基于随机森林算法建立的云南多民族人群产后抑郁风险预测模型性能良好,可用于预测少数民族地区女性产后抑郁风险因子,从而采取针对性干预措施.
...不再出现此类内容
编辑人员丨2天前
-
输尿管软镜钬激光碎石术治疗输尿管上段复杂性结石后双J管附壁结石形成的原因分析
编辑人员丨2天前
目的:分析输尿管软镜钬激光碎石术治疗输尿管上段复杂性结石后双J管附壁结石形成的原因.方法:选择2015年1月至2023年8月于首都医科大学附属北京潞河医院收治的105例输尿管上段复杂性结石患者,其中男58例,女47例,根据结石评估结果分为结石组(n=40)与非结石组(n=65).通过随机森林算法分析患者双J管附壁结石形成的影响因素.通过单因素和多因素分析双J管附壁结石形成的独立影响因素,并构建分类树模型.结果:结石组和非结石组CT值、术中出血量、双J管留置时间、白细胞计数(WBC)、C反应蛋白(CRP)、尿酸(UA)、血钙、尿pH值、尿蛋白、尿红细胞、尿白细胞、尿结晶比较差异均有统计学意义(t/χ2 值分别为4.361、2.502、6.815、12.176、24.398、15.595、6.517、2.069、6.881、4.524、3.883、4.699,均P<0.05).双J管留置时间、尿蛋白阳性、尿结晶阳性、UA为双J管附壁结石形成的独立危险因素(P<0.05).分类树模型显示,双J管留置时间是双J管附壁结石形成的重要预测因素,收益图和索引图显示模型预测良好.结论:双J管留置时间、尿蛋白阳性、尿结晶阳性、UA为双J管附壁结石形成的独立危险因素.临床应重点关注相关因素,及时制定预防策略,以期降低双J管附壁结石的发生风险.
...不再出现此类内容
编辑人员丨2天前
-
医务人员血源性职业暴露危险因素分析:基于随机森林算法和logistic回归模型的效应对比
编辑人员丨2天前
目的 分析医务人员血源性职业暴露风险因素,为及时提出针对性干预措施,预防血源性职业暴露提供依据.方法 选取2016年1月—2023年6月呼伦贝尔市某三级综合医院上报的发生血源性职业暴露的103名医务人员为暴露组,选取同班次未发生职业暴露的625名医务人员为对照组,收集研究对象的相关资料,采用随机森林算法和多因素logistic回归分析分别构建影响医务人员发生血源性职业暴露的预测模型.结果 103例血源性职业暴露人员的主要暴露部位为手,有89例(占86.41%);主要暴露方式为锐器伤,有83例(占80.58%);主要暴露源为乙型肝炎病毒,有65例(占63.11%).暴露后立即上报的有65例(占63.11%),12 h以内上报的24例(占23.30%).logistic回归分析结果显示:相比年龄≥ 30岁,年龄<30岁的医务人员发生血源性职业暴露的可能性增加至4.142倍(P<0.05);相比工作年限≥ 5年,工作年限<5年的医务人员发生血源性职业暴露的可能性增加至1.696倍(P<0.05);相比中级及以上职称,初级职称医务人员发生血源性职业暴露的可能性增加至5.989倍(P<0.05);相比每年多次参加培训,每年只参加1次培训的医务人员发生血源性职业暴露的可能性增加至1.864倍(P<0.05);科室类别为急诊、重症及手术室的医务人员较其他科室医务人员发生血源性职业暴露的可能性增加至2.205倍(P<0.05).随机森林算法结果显示,重要性评分排名前6的影响因素分别是职称、年龄、工作年限、年职业防护培训次数、职业类型、文化程度.随机森林预测模型的准确率、精确率、召回率及F1分数(精确率和召回率的调和平均数)均要高于logistic预测模型,且随机森林预测模型的ROC曲线下面积(AUC)为0.829(P<0.001),也高于logistic回归模型的0.818(P<0.001).结论 随机森林模型对血源性职业暴露有更好的预测效能,但logistic回归模型有更直观的分析结果,两者联合使用能进一步提高预测的准确性.应加强对年龄小、工作年限短、职称低等重点人员的培训,制定标准化的措施来预防医务人员的血源性暴露.
...不再出现此类内容
编辑人员丨2天前
-
列线图与机器学习算法预测中老年龋齿的比较研究
编辑人员丨2天前
目的 对比列线图与不同机器学习算法构建中老年人龋齿预测模型的效能.方法 采用多阶段分层随机抽样法,选取南宁市、贵港市、崇左市510名中老年人为研究对象,进行问卷调查及口腔检查.采用单因素分析和Lasso回归筛选相关变量,使用多因素logistic回归分析确定最终独立影响因素.基于显著特征,建立列线图预测模型,并运用线性判别分析(LDA)、偏最小二乘算法(PLS)、距离多普勒算法(RDA)、广义线性模型(GLM)、随机森林(RF)、支持向量机(SVM)核函数(SVM-Radial)及SVM线性核函数(SVM-Linear)7种机器学习算法构建7种龋齿风险预测模型.采用受试者工作特征(ROC)曲线下面积(AUC)中位数评价各模型预测性能,以及不同变量筛选方法所构建模型的预测性能.结果 中老年人龋齿检出率为71.18%.经过特征筛选后最终保留5个预测因子,分别是年龄(OR=0.945,95%CI:0.917~0.973)、刷牙频率(OR=0.688,95%CI:0.475~0.997)、过去1年是否洗牙(OR=0.303,95%CI:0.103~0.890)、牙存留数(OR=1.062,95%CI:1.038~1.087)和口腔健康评估量表(OHAT)得分(OR=1.363,95%CI:1.234~1.505).各模型对比结果显示,RF算法所构建的预测模型表现最佳,AUC中位数为0.747,其次为列线图,AUC中位数为0.733.单因素+Lasso+多因素logistic(简称Lasso+logistic)筛选自变量构建预测模型的AUC中位数均高于RF算法筛选自变量构建的预测模型.结论 基于Lasso+logistic筛选变量,RF较列线图及其他机器学习算法在中老年龋齿预测中提供了更可靠的预测性能.
...不再出现此类内容
编辑人员丨2天前
-
脓毒症相关性急性肾损伤患者3个月死亡风险列线图预测模型的建立与评价
编辑人员丨2天前
目的:建立并评价脓毒症相关性急性肾损伤(S-AKI)患者3个月死亡风险的列线图预测模型。方法:基于美国重症监护医学信息数据库Ⅳ(MIMIC-Ⅳ),收集2008至2021年S-AKI患者的临床数据。初步纳入58个相关预测因素,以3个月内全因死亡为结局事件。按7∶3比例将数据分为训练集和验证集。在训练集中采用单因素Logistic回归分析初步筛选变量,运用多重共线性分析、Lasso回归和随机森林算法并结合临床应用价值进行变量选择,建立多因素Logistic回归模型并利用列线图进行可视化表达。在验证集中进行内部验证,评价模型预测价值;绘制受试者工作特征曲线(ROC曲线)计算曲线下面积(AUC)评价列线图模型及牛津急性疾病严重度评分(OASIS)、序贯器官衰竭评分(SOFA)、全身炎症反应综合征评分(SIRS)的区分度;校准曲线评价校准度;决策曲线分析(DCA)评估不同阈值概率下的净效益。结果:基于确诊后3个月时的生存状况将患者分为存活组7?768例(68.54%),死亡组3?566例(31.46%)。在训练集中通过多重筛选,最终纳入7个变量,即Logistic器官功能障碍评分(LODS)、Charlson合并症指数、尿量、国际标准化比值(INR)、呼吸支持方式、血尿素氮和年龄,并纳入列线图模型。在验证集中进行内部验证,ROC曲线分析显示,列线图模型的AUC为0.81〔95%可信区间(95% CI)为0.80~0.82〕,大于OASIS评分的0.70(95% CI为0.69~0.71),远大于SOFA评分的0.57(95% CI为0.56~0.58)和SIRS评分的0.56(95% CI为0.55~0.57),具有较好区分度。校准曲线显示列线图模型校准度优于OASIS、SOFA、SIRS评分。DCA曲线显示列线图模型在不同阈概率情况下的临床净收益均好于OASIS、SOFA、SIRS评分。 结论:基于MIMIC-Ⅳ临床大数据建立的一个包含7项变量的S-AKI患者3个月死亡风险预测列线图模型具有很好的区分度和校准度,为评估S-AKI患者预后提供了有效的新工具。
...不再出现此类内容
编辑人员丨2天前
-
基于循环游离DNA末端基序检测的食管鳞状细胞癌及其癌前病变预测模型建立及验证
编辑人员丨2天前
目的:探索并建立基于循环游离DNA(cfDNA)末端基序检测的食管鳞状细胞癌(ESCC)预测模型,并评估其用于ESCC早期检测的可行性。方法:前瞻性收集2021年8月至2022年11月中国医学科学院肿瘤医院201例ESCC、46例食管高级别上皮内瘤变(HGIN)、46例食管低级别上皮内瘤变(LGIN)、176例食管良性病变患者和29例健康对照的血浆样本进行cfDNA提取、文库构建与测序。将ESCC患者和对照组受试者随机分为训练集(284例)和验证集(122例)。对训练集中ESCC及对照组cfDNA末端基序矩阵标准化处理及差异特征筛选,经主成分分析降维、十折交叉验证及随机森林递归特征消除后训练并建立随机森林分类模型Motif-1(M1),在验证集和癌前病变组中验证其性能。将癌前病变组患者纳入数据集后随机分为训练集(243例)、验证集(105例)、测试集(150例),采用与M1相同的方法使用训练集训练并构建随机森林模型Motif-2(M2),在验证集中检验并确定最佳阈值,在测试集中进行性能检测。结果:构建了2个基于cfDNA 末端基序检测的ESCC及其癌前病变的预测模型,M1模型在验证集中的灵敏度为90.0%,特异度为77.4%,曲线下面积(AUC)为0.884;M1模型预测LGIN、HGIN及T1aN0期食管癌的灵敏度分别为76.1%、80.4%和91.2%,联合预测HGIN及T1aN0期食管癌的灵敏度为85.0%,且预测分值和灵敏度随着恶性肿瘤的临床分期上升而增加( P<0.001)。M2模型在测试集中灵敏度为87.5%,特异度为77.4%,AUC为0.857;M2模型预测食管癌前病变及ESCC的灵敏度分别为80.0%和89.7%,联合预测HGIN及T1aN0期食管癌的灵敏度为89.4%。 结论:构建的2种基于 cfDNA 末端基序的血浆检测模型在ESCC及其癌前病变中具有较高的灵敏度及特异度,可用于早期ESCC检测。
...不再出现此类内容
编辑人员丨2天前
-
基于CT影像组学预测中重度甲状腺相关性眼病放疗有效性的研究
编辑人员丨2天前
目的:基于中重度甲状腺相关性眼病(TAO)患者放疗前的CT影像组学特征,利用机器学习方法构建中重度TAO患者放疗有效性的预测模型。方法:回顾性收集从2015年1月至2023年6月在山西医科大学第一医院接受放疗的93例中重度TAO患者的临床与CT影像资料,提取影像组学特征。利用统计学方法分析临床因素与放疗有效性是否有统计差异性。利用Spearson相关性分析和L1正则化逻辑回归算法进行特征选择。基于所选特征,构建3个预测模型:逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)。最后利用10折交叉验证方法,重复100次,计算曲线下面积(AUC)、敏感性、特异性和准确度来评估模型的性能;使用校准曲线评价预测模型的校准度;最后采用决策曲线分析法对最佳预测模型的临床价值进行评估。结果:临床因素与放疗有效性无统计差异性。分析所有影像组学特征后,选出10个具有代表性的特征。在3个预测模型中,SVM模型在训练集和测试集均取得了最佳性能(分别为AUC 0.92,AUC 0.87)。校准曲线显示SVM模型的预测曲线与理想曲线间没有明显偏差,二者具有较好的一致性。决策曲线显示在大部分概率阈值下,与全部干预和全部不干预相比,SVM模型可获得临床收益。结论:放疗前的CT影像组学特征可用于预测中重度TAO患者放疗的有效性,有望为临床提前干预提供帮助,避免部分患者接受无效的治疗。
...不再出现此类内容
编辑人员丨2天前
-
建立肝硬化门静脉高压症出血治疗方式预测模型
编辑人员丨2天前
收集2012年1月至2018年1月嘉兴市第一医院收治的诊断为肝硬化门静脉高压症食管-胃底静脉曲张破裂出血、手术后恢复良好且2年内未再复发的136例患者资料,运用机器学习随机森林算法建立肝硬化门静脉高压症食管-胃底静脉曲张破裂出血治疗方式预测模型。结果显示白细胞计数、血肌酐、凝血酶时间、血小板计数、活化部分凝血活酶时间和年龄是治疗方式的影响因素,且机器学习建立的预测模型精确度高。该模型为患者治疗方式的选择提供了科学依据,并且对大数据人工智能融入临床工作有一定启示。
...不再出现此类内容
编辑人员丨2天前
-
基于列线图及机器学习的免疫检查点抑制剂相关性肺炎风险预测模型构建及验证
编辑人员丨2天前
目的:运用机器学习算法及列线图,构建和验证免疫检查点抑制剂相关性肺炎(CIP)风险预测模型,旨在为更好的辅助临床护理人员筛查CIP的高危人群,提供准确直观的方法。方法:采用回顾性病例对照研究。选取2019年1月至2022年2月南方医科大学珠江医院就诊的230例使用免疫检查点抑制剂治疗的肿瘤患者,使用医院电子病历系统收集患者的资料。应用5种机器学习算法和列线图构建预测模型,在独立测试集进行模型的验证,最后依据评价指标AUC、准确率等评估预测模型的区分度及稳定性。结果:6种模型均提示,肺部基础疾病、吸烟史、血清白蛋白值≤35 g/L、胸部放疗史是促进CIP发生的重要影响因素。K最近邻、支持向量机(SVM)、朴素贝叶斯、决策树和随机森林构建的CIP预测模型的AUC分别为0.647、0.696、0.930、0.870、0.934。列线图构建的模型AUC为0.813,预测性能较好,但低于机器学习算法中表现最佳的随机森林模型(AUC=0.934)。结论:与列线图相比,基于机器学习算法建立的CIP的风险预测模型具有更高的诊断价值,但列线图构建的模型可更直观评估患者风险,建议在列线图基础上,结合机器学习算法,可增加预测模型的准确性及实用性。
...不再出现此类内容
编辑人员丨2天前
-
基于随机森林算法的中青年妇科恶性肿瘤患者心理痛苦预测模型构建及验证
编辑人员丨2天前
目的:基于随机森林算法构建中青年妇科恶性肿瘤患者心理痛苦风险预测模型并验证其预测效果,为医护人员早期发现患者心理痛苦提供工具。方法:采用横断面研究,以整群抽样法选取2021年10月至2022年10月天津市6所三级甲等医院妇科和肿瘤科收治的中青年妇科恶性肿瘤患者385例,采用R-studio软件以7∶3比例将研究对象随机分为训练集270例和测试集115例。根据是否存在心理痛苦将训练集患者分为心理痛苦阳性151例和心理痛苦阴性119例,对各影响因素进行单因素分析。采用R-studio软件在训练集上建立中青年妇科恶性肿瘤患者心理痛苦预测的随机森林模型并在测试集上验证。结果:模型预测准确度为94.78%,灵敏度为96.88%,特异度为92.16%,阳性预测值为93.94%,阴性预测值为95.92%,AUC为0.992(95% CI 0.982~1.000)。根据各影响因素在随机森林模型中的Gini系数平均下降量进行排序,得出前5位重要预测变量依次为:一般自我效能感量表得分、Herth希望量表得分、领悟社会支持量表得分、抑郁自评量表得分、焦虑自评量表得分。 结论:基于随机森林算法构建的中青年妇科恶性肿瘤患者心理痛苦预测模型有较高的预测效能,可为医护人员及早识别患者心理痛苦并制订干预措施提供参考。
...不再出现此类内容
编辑人员丨2天前
