-
基于XGBoost机器学习算法的肺结节浸润性预测模型构建与验证:一项双中心研究
编辑人员丨1周前
目的 采用XGBoost机器学习算法构建一个临床影像模型,预测肺结节病理浸润性,并在一个外部验证组中对模型进行泛化性验证.方法 回顾性纳入CT诊断为孤立性肺结节患者248例,分别提取肺结节区域和结节周围3mm、5mm区域的放射组学特征.经过从粗到细的特征选择后,使用最小绝对收缩和选择算子(LASSO)方法计算Radscore.采用单因素和多因素Logistic回归分析筛选与肺结节浸润性相关的临床放射学因素.然后,利用Logistic和XGBoost算法构建临床-放射组学联合模型,在一个独立的外部验证组(n=147)中评估模型的泛化性能.结果 综合Radscore、CT值、肺结节长度、月牙征的临床放射学XGBoost联合模型对肺结节浸润性的预测效果优于放射组学模型、临床放射学Logistic联合模型,在训练队列中的曲线下面积AUC为0.889(95%CI,0.848~0.927),在外部验证组中曲线下面积AUC为0.889(95%CI,0.823~0.942).结论 我们采用XGBoost机器学习算法构建了一种预测肺结节浸润性的临床放射学模型,结果显示出令人满意的预测效能,并在一个独立外部验证组中得到了良好的泛化性验证,可以帮助临床医生指导肺结节的诊疗并制定评估策略.
...不再出现此类内容
编辑人员丨1周前
-
5~18岁过敏性哮喘患儿螨皮下免疫治疗效应预测模型
编辑人员丨1周前
目的:分析影响5~18岁过敏性哮喘患儿螨皮下特异性免疫治疗(SCIT)效果的因素并寻找最佳预测模型。方法:回顾性分析南京医科大学附属儿童医院呼吸科2006年12月至2021年11月完成3年以上螨SCIT的688例5~18岁过敏性哮喘患儿的资料,根据疗效分为停药组和未停药组,定义男性、皮肤点刺结果、年龄、每日药物评分(DMS)、视觉模拟量表(VAS)得分和入组季节为自变量,使用R语言建模(Logistic回归、随机森林和极端梯度上升模型)分析自变量对结局的影响,使用受试者工作特征曲线比较3种模型预测能力,应用德隆检验进行3种模型曲线下面积(AUC)的假设检验。结果:688例过敏性哮喘患儿中男435例、女253例。就诊年龄5~<8岁349例,8~<11岁240例,11~18岁99例。皮肤点刺试验单一螨过敏429例(62.4%)、螨为主且合并其他过敏259例(37.7%)。3年后停药组351例(51.0%)、未停药组337例(49.0%)。DMS 初始时4(3,6)分,3个月3(2,5)分,4个月3(2,5)分,12个月2(1,3)分,3年0(0,1)分。VAS 初始时3.5(2.5,5.2)分,3个月3.2(2.2,4.8)分,4个月2.6(1.4,4.1)分,12个月1.0(0.6,1.8)分,3年0.5(0,1.2)分。3、4、12个月时DMS较初始时下降率分别为0(0,20%),16.7%(0,33.3%),50.0%(31.0%,75.0%);VAS则分别为7.1%(3.2%,13.8%),27.6%(16.7%,44.4%),70.2%(56.1%,82.3%)。688例过敏性哮喘患儿起始治疗季节中春季99例、夏季230例、秋季171例、冬季188例。R语言Logistic回归模型发现DMS 3个月>3分( OR=-3.5,95% CI: -4.3~-2.7, P<0.01)、男性( OR=-1.7,95% CI: -2.3~-1.0, P<0.01)、DMS 4个月下降率>16.7%( OR=-1.6,95% CI: -2.3~-0.8, P<0.01)、DMS 3个月下降率>0( OR=-0.7,95% CI: -1.3~-0.2, P<0.05)对停药可能性大;DMS 12个月下降率>50.0%( OR=0.7,95% CI:0.1~1.3, P<0.05)、VAS 12个月>1.0分( OR=0.9,95% CI:0.3~1.6, P<0.05)、初始VAS<4.0分( OR=1.0,95% CI:0.4~1.6, P<0.01)对停药可能性小。随机森林模型和极端梯度上升模型均显示DMS 3个月>3分(平均减少准确度=30.9、重要性=0.45)对停药影响力最大。随机森林模型AUC 0.900、精确度78.2%、灵敏度84.5%,Logistic回归模型分别为0.891、80.0%、80.0%;极端梯度上升模型0.886、76.9%、84.5%。德隆检验分别比较3种模型AUC均可用于该数据集的预测(均 P>0.05)。 结论:过敏性哮喘需要使用越多的药物控制原发病、开始螨SCIT后越缓慢减少原发病的治疗药物,越有利于3年后停用所有药物。随机森林模型为过敏性哮喘螨皮下免疫治疗效果的最佳预测模型。
...不再出现此类内容
编辑人员丨1周前
-
XGBoost模型对腹腔镜肝切除术治疗肝细胞癌复发的预测因素分析
编辑人员丨1周前
目的:建立一种能预测肝细胞癌(HCC)患者腹腔镜肝切除术(LH)术后复发的极端梯度上升法(XGBoost)模型。方法:回顾性选取2013年1月—2016年9月在承德医学院附属医院首次接受LH治疗的原发性HCC患者440例为研究对象,确诊方式为病理诊断。使用随机数表法,以2∶8的比例将研究对象分为训练组( n=88)和验证组( n=352)。采用Kaplan-Meier法绘制无复发生存曲线,并采用Log-rank检验比较两组的生存情况;采用训练组建立COX回归模型和XGBoost模型,筛选预测LH术后复发的独立预测因素;采用受试者工作特征曲线(ROC)分析两种模型的预测能力,并在验证组中进行内部验证;采用Hosmer and Lemeshow Test来评价两种模型的校准度,以 P>0.05为模型与实际情况拟合度良好。 结果:多因素COX回归模型和XGBoost模型均筛选出了癌栓、分化程度低、肿瘤微血管浸润、肿瘤个数、肿瘤较大、乙肝表面抗原阳性是肿瘤复发的独立预测因素( HR=2.477、0.769、1.786、1.905、1.544、1.805;95% CI: 1.465~4.251、0.619~0.819、1.263~2.546、1.354~2.704、1.272~1.816、1.055~2.555)。XGboost模型评分依次为32、29、24、18、16、11分。训练组中COX回归模型和XGBoost模型预测复发的曲线下面积(AUC)分别为0.746(0.730~0.762)和0.802(0.785~0.818),XGBoost模型预测能力较强,且在验证队列中也得到了证实。 结论:本研究建立和验证了能够预测接受LH的HCC患者术后复发的XGBoost模型。该模型可应用于临床工作中,辅助医师为患者制订个性化的术后监测方案。HCC患者复发率高,预后差,早发现、早诊断、早治疗、加强术后复诊是改善患者预后的重要措施。
...不再出现此类内容
编辑人员丨1周前
-
基于极端梯度上升算法的联合诊断模型对胃神经内分泌肿瘤病理分级的诊断效能
编辑人员丨1周前
目的:评估基于极端梯度上升(XGBoost)算法的联合诊断模型对胃神经内分泌肿瘤(NENs)病理分级的诊断效能。方法:以郑州大学第一附属医院2012年8月至2019年12月收治的81例胃NENs患者为对象,收集其临床资料和CT影像学资料。分析CT影像的病灶个数、肿瘤部位、形态、淋巴结转移状态、肿瘤最厚径、最长径和动静脉期CT值等特征;采用ITK-SNAP软件和Python 2.1.0 Pyradiomics软件对CT影像进行影像组学分析预处理并从分割图像中提取组学特征;采用XGboost算法分别建立CT影像模型、动脉期组学模型、静脉期组学模型和联合诊断模型;采用准确度、均方误差(MSE)和平均绝对误差(MAE)评价以上模型的诊断性能。结果:NENs患者年龄为28.0~78.0(58.6±10.7)岁,其中男性56例,占69.1%。胃NENs病理分级G1/G2级和G3级患者病灶个数、肿瘤部位、形态、淋巴结转移状态、肿瘤最厚径和最长径的差异均有统计学意义(均 P<0.05),动(静)脉期CT值差异无统计学意义(均 P>0.05)。联合诊断模型中的特征分别为A_logarithm_glcm_Imc1、P_squareroot_glcm_MaximumProbability、肿瘤最厚径、最长径、A_wavelet-HHL_glrlm_GrayLevelNonUniformity和P_wavelet-LLL_ngtdm_Contrast。CT影像模型、动脉期组学模型、静脉期组学模型和联合诊断模型的准确度分别为81.8%、86.0%、87.8%和91.0%;MSE分别为539.41、490.08、429.99和371.92;MAE分别为16.72、15.25、14.23和12.33。联合诊断模型的MAE值小于CT影像模型和动脉期组学模型( P值分别为<0.001和0.004),而与静脉期组学模型的MAE值差异无统计学意义( P=0.111)。 结论:基于XGBoost算法的联合诊断模型对胃神经内分泌肿瘤病理分级具有良好的诊断效能。
...不再出现此类内容
编辑人员丨1周前
-
Logistic回归法和机器学习算法构建子痫前期预测模型的比较
编辑人员丨1周前
目的:利用医院电子病历系统首页信息和临床检验数据通过logistic回归(logistic regression,LR)法和机器学习算法构建子痫前期(preeclampsia,PE)预测模型,同时比较机器学习算法和LR构建模型的预测性能。方法:基于2012年1月1日至2019年12月31日在广州医科大学附属第三医院就诊孕产妇的围产期数据和柔济妊娠检验数据库信息,根据临床诊疗指南和相关文献报道关联整合后选取数据量较为完整的孕24~28周共2 736例孕妇的28项临床相关指标作为PE预测模型构建数据。将其中PE患者作为PE组( n=245),其余非PE患者中采用欠采样法选择255例为对照组。使用随机森林算法(random forest,RF)及极端梯度上升算法(eXtreme Gradient Boosting,XGB)和LR模型分别构建PE疾病预测模型。模型构建完成后,在2019年6月至2022年12月开展的PE前瞻性队列研究获得数据中(PE组38例,对照组80例),进行PE预测准确性的外部验证。采用准确度、灵敏度、特异度、受试者工作特征曲线下面积比较不同模型的预测效能。 结果:3种预测模型构建时纳入的指标提示,尿酸、肌酐、年龄、孕早期体重指数、尿素、甘油三酯、红细胞计数、嗜酸性粒细胞计数、总胆固醇、中性粒细胞计数、尿蛋白、丙氨酸氨基转移酶以及尿潜血是影响PE预测模型的指标。RF、XGB和LR模型在训练集和测试集中的受试者工作特征曲线下面积分别为0.851(95% CI:0.730~0.891)、0.955(95% CI:0.865~0.987)、0.884(95% CI:0.767~0.923)和0.845(95% CI:0.723~0.868)、0.907(95% CI:0.791~0.919)、0.851(95% CI:0.755~0.893)。在测试集中,RF、XGB和LR模型的准确度、灵敏度与特异度分别为0.803、0.607、0.958,0.864、0.790、0.927和0.832、0.661、0.971。在外部验证集中RF、XGB和LR预测模型的准确度分别为0.822、0.814和0.763;灵敏度分别为0.737、0.789和0.605;特异度分别为0.863、0.825和0.838,其中XGB模型的约登指数最高,为0.614。 结论:相对于传统的建模方法,利用机器学习算法可以在真实临床检测数据中建立更加有效的PE预测模型。
...不再出现此类内容
编辑人员丨1周前
-
极端梯度上升模型在预测临床重症手足口病中的应用价值
编辑人员丨2023/8/6
目的 探讨极端梯度上升模型(XGBoost)和Logistic回归模型在临床重症手足口病(HFMD)预测中的应用对比.方法 回顾性收集郑州市某医院2017年3月至11月期间住院部收治的HFMD患儿872例的临床资料,其中轻症488例,重症384例.使用R3.4.4软件进行所有资料的分析,分别构建XGBoost和Logistic回归模型,比较两种模型对重症HFMD的预测效果.结果 在XGBoost模型中,输出变量重要性中前三位分别为:白细胞计数、年龄和心率,其对重症HFMD总体预测准确性为92.4%,ROC曲线下面积为0.952(95% CI:0.931 ~0.967).Logistic回归模型总体预测准确性为80.1%,ROC曲线下面积为0.848(95% CI:0.833~0.866).模型评估显示XGBoost模型的预测效果明显优于Logistic回归模型.结论 XGBoost模型可以用于预测重症HFMD,相比于传统模型,具有较高的准确性和诊断价值.
...不再出现此类内容
编辑人员丨2023/8/6
-
黑河典型荒漠植被区土壤水盐和养分沿降水梯度的变化特征
编辑人员丨2023/8/5
为探索极端干旱地区典型荒漠植被区土壤水盐和养分对降水梯度的反应,以黑河流域中下游典型荒漠植被区为研究对象,沿35-209 mm年降水梯度,测定7个样地的土壤水盐和养分含量.结果表明:沿降水梯度变化,土壤含水量、容重、pH、电导率、总碳、总氮、速效磷和速效钾差异性显著(P < 0.05).随着降水量增加,土壤含水量、土壤总碳、土壤总氮大致呈增加变化趋势,最高值出现在209 mm(S7)处,均值分别为8.31%、23.31 mg/g、0.99 mg/g,而土壤容重和土壤速效钾呈下降变化趋势,最低值出现在149-209 mm(S5-S7),均值分别为1.25 g/cm3和68.40 mg/kg,土壤pH随着降水量的增加呈"M"形变化趋势,波动幅度较小,而土壤电导率与土壤pH变化趋势相反,波动幅度较大;土壤速效磷随着降水量的增加呈先上升后下降趋势,在69 mm(S3)处最高,均值为10.16 mg/kg.上述研究表明,黑河流域荒漠植被区土壤水盐和养分随降水梯度呈现出一定的差异和规律性,水分条件变化对改善荒漠植被区土壤理化属性有着直接或间接的影响;研究结果可为黑河中下游戈壁荒漠地区植被建设和土壤管理工作提供参考.
...不再出现此类内容
编辑人员丨2023/8/5
-
高山垫状植物团状福禄草开花面积与方位随海拔的变化及其适应性
编辑人员丨2023/8/5
作为高山生态系统中的奠基种(foundation species),垫状植物自身种群的繁殖与扩张,对高山生态系统功能稳定性起着关键作用.但是,垫状植物如何在极端环境条件下实现资源的有效利用与分配,达到繁殖最优化,至今鲜为人知.该研究在滇西北白马雪山沿海拔梯度选择具有不同坡度及坡向的5个团状福禄草(Arenaria polytrichoides)种群,调查、比较种群内、种群间以及具有不同性系统的植株个体之间的开花面积比、开花方位,并分析不同生态因子对其开花特性的影响.结果 表明:随着海拔的升高,团状福禄草个体变小,其分配到开花的资源比例总体上随海拔上升呈现下降的趋势,说明团状福禄草的繁殖分配受到由海拔所引起的生态因子的调控.但是,部分低海拔种群内植物个体的繁殖分配显著低于部分高海拔种群,说明海拔并非控制植物繁殖分配的唯一因素.此外,植株开花总面积随植株个体增大而增加,但开花面积比却随个体增大而变小,说明植株分配到开花的资源增长速率可能低于植株个体的增长速率.在性别差异方面,两性植株对开花的资源分配比例要显著高于雌性植株,但是,其差异程度受到海拔因素的影响.最后,在同一种群内,团状福禄草在冠层表面不同方位上的开花面积比存在显著差异性,这种差异性在不同种群之间又具有不同的表现形式.
...不再出现此类内容
编辑人员丨2023/8/5
-
两种急性百草枯中毒死亡预测模型比较
编辑人员丨2023/8/5
目的 比较Cox比例风险回归模型和极端梯度上升(XGBoost)模型对急性百草枯中毒(APP)死亡的预测效果.方法 选择青岛市第八人民医院和山东省立医院于2018年1月1日-2020年12月1日收治的APP患者为研究对象,采用随机数表法分为训练组和验证组.分别建立Cox比例风险回归模型和XGBoost模型筛选APP患者死亡的预测因素.采用受试者工作特征曲线(ROC)分析两种模型的预测效能,采用Hosmer-Lemeshow检验评价两种模型的校准度.结果 共纳入APP患者150例,训练组和验证组各75例,分别死亡52例和55例,占69.33%和73.33%.Cox比例风险回归模型结果显示,摄入百草枯剂量、服毒至就诊时间、首次灌流时间、首次呕吐时间、谷草转氨酶、谷丙转氨酶、血肌酐、尿素氮、白细胞、动脉血乳酸、肌酸激酶同工酶、血糖、血钙和血钾是APP患者死亡的独立预测因素(均P<0.05).XGBoost模型结果显示,预测能力由强到弱的因素依次为服毒至就诊时间、首次呕吐时间、首次灌流时间、动脉血乳酸、白细胞、摄入百草枯剂量、血肌酐、血钾、血钙、肌酸激酶同工酶、血糖、谷草转氨酶、尿素氮和谷丙转氨酶.XGBoost模型预测APP患者死亡的AUC值为0.972,大于Cox比例风险回归模型的0.921 (P<0.05).Cox比例风险回归模型、XGBoost模型的预测结果与实际死亡情况的一致性均较好(P>0.05).结论 Cox比例风险回归模型和XGBoost模型筛选APP患者死亡的预测因素一致,但后者预测能力优于前者.
...不再出现此类内容
编辑人员丨2023/8/5
-
基于XGBoost算法的地屈孕酮用于治疗先兆流产的有效性及安全性研究
编辑人员丨2023/8/5
目的 使用XGBoost算法构建地屈孕酮用于治疗先兆流产的有效性及安全性预测模型.方法 选取本院2017年1月-2018年1月就诊的2811例先兆流产患者的临床资料,根据先兆流产患者的临床资料建立地屈孕酮用药数据库,依据妊娠结局分为保胎成功组和保胎失败组,阿氏评分>7组vs阿氏评分≤7组,利用XGBoost算法构建预测模型.结果 地屈孕酮保胎成功率为79.97%,新生儿阿氏评分≤7的比率为1.14%.基于XGBoost算法建立的地屈孕酮用于治疗先兆流产有效性的全部变量预测模型准确率为0.990,F1值为0.975,AUC值为0.993;最终预测模型准确率为0.990,F1值为0.975,AUC值为0.995.基于XGBoost算法的地屈孕酮用于治疗先兆流产安全性的全部变量预测模型准确率为0.986,F1值为0.000,AUC值为0.609.结论 基于XGBoost算法的地屈孕酮用于治疗先兆流产有效性的最终预测模型能准确可靠地预测地屈孕酮治疗先兆流产的有效性,且可推动地屈孕酮在临床更加规范、安全、有效的应用,还可为地屈孕酮的临床应用指南制定提供数据支持.基于XGBoost算法的地屈孕酮用于治疗先兆流产安全性的全部变量预测模型虽不能有效预测地屈孕酮对先兆流产的安全性,但最后筛选出的3个影响"阿氏评分≤7"的重要影响因子对于预测新生儿窒息情况仍有参考价值.
...不再出现此类内容
编辑人员丨2023/8/5
