-
机器学习算法在早期肝细胞癌术后复发预测中的应用价值
编辑人员丨1天前
目的:比较多种机器学习算法在早期肝细胞癌(HCC)术后复发预测中的效能。方法:回顾性分析2009年5月至2019年12月南京医科大学第一附属医院收治的882例接受根治性手术切除的早期HCC患者的临床资料,其中男性701例,女性181例,年龄(57.3±10.5)岁(范围:21~86岁)。将患者按2∶1随机分为训练集(588例)和测试集(294例)。构建的机器学习预测模型包括随机生存森林(RSF)、梯度提升机、弹性网络-Cox回归和Cox回归模型。采用一致性指数(C-index)衡量模型预测的准确性、综合Brier分数量化模型的预测误差、校准曲线反映模型的拟合情况。比较机器学习模型、竞争模型和HCC分期系统的预测效能。所有模型均在独立的测试集内进行验证。结果:训练集内患者中位无复发生存时间为61.7个月,测试集内患者中位无复发生存时间为61.9个月,两组患者无复发生存情况的差异无统计学意义( χ2=0.029, P=0.865)。RSF模型由5个常用临床病理学特征构成:白蛋白-胆红素分级、血清甲胎蛋白、肿瘤数目、肝切除方式和微血管侵犯。在训练集和测试集中,RSF模型的C-index值分别为0.758(95% CI:0.725~0.791)和0.749(95% CI:0.700~0.797),综合Brier分数分别为0.171和0.151。RSF模型对早期HCC复发预测的准确性优于其他3种机器学习模型、竞争模型(ERASL模型)及HCC分期系统(巴塞罗那分期、中国肝癌的分期方案、TNM分期),差异均有统计学意义( P值均<0.01)。校准曲线提示,RSF模型的预测概率与实际观察值具有较好的一致性。RSF模型可将早期HCC患者的复发风险分为低危、中危和高危组,在训练集和测试集内三组患者无复发生存情况的差异有统计学意义( P<0.01)。RSF模型对早期HCC术后复发风险的分层明显优于TNM分期。 结论:本研究构建的RSF模型集合了5个常用临床病理学特征,可较为准确地预测复发风险。
...不再出现此类内容
编辑人员丨1天前
-
多污染物统计模型在金属混合暴露与DNA氧化损伤关联分析中的应用
编辑人员丨1天前
目的:应用多污染物统计模型研究金属混合暴露与DNA氧化损伤的关联,探讨引起DNA氧化损伤效应的关键组分。方法:以山东某钢铁公司钢铁冶炼企业工人作为研究对象。采用电感耦合等离子体质谱法检测尿液中金属元素浓度。采用超高效液相色谱-串联质谱法检测尿中8-羟基脱氧鸟苷(8-OHdG)浓度。应用贝叶斯核机器回归(BKMR)、弹性网络回归和分位数g计算回归分析尿金属与尿8-OHdG的关联。结果:共纳入研究对象共768名,年龄(36.15±7.40)岁。BKMR、弹性网络回归、分位数g计算回归结果均显示,金属混合暴露与尿8-OHdG水平升高的关联有统计学意义。分位数g计算回归结果显示,金属混合物水平每增加25%,尿8-OHdG水平增加77.60%。弹性网络分析显示,暴露风险得分每增加25%,尿8-OHdG水平增加26%。BKMR的单变量暴露效应分析显示,尿硒、锌、镍与尿8-OHdG水平存在正相关。结论:金属混合暴露引起DNA氧化损伤水平升高,其中硒、锌和镍的作用更加明显。
...不再出现此类内容
编辑人员丨1天前
-
基于超声造影影像组学预测局部进展期直肠癌新辅助放化疗病理完全缓解的应用研究
编辑人员丨1天前
目的:评估基于超声造影的影像组学模型对局部进展期直肠癌(LARC)患者新辅助放化疗(nCRT)后病理完全缓解(pCR)的预测效能。方法:本研究回顾性纳入2018年4月至2023年4月在广西医科大学第一附属医院接受nCRT后行全直肠系膜切除的106例LARC患者,以6∶4随机划分为训练集63例(pCR者14例)和验证集43例(pCR者12例)。基于PyRadiomics从超声造影图像肿瘤感兴趣区域提取影像学特征。采用类内相关系数、Mann-Whitney U检验、最小绝对收缩和选择算子算法对特征进行降维。最后选取7个与pCR相关的影像学特征,基于R语言使用弹性网络回归构建超声造影影像组学模型,并与临床特征融合构建一个联合模型。采用ROC曲线下面积(AUC)评估模型的诊断效能。 结果:训练集中,超声造影影像组学模型的AUC为0.695(95% CI=0.532~0.859),联合模型的AUC为0.726(95% CI=0.584~0.868)。验证集中,超声造影影像组学模型的AUC为0.763(95% CI=0.625~0.902),联合模型的AUC为0.790(95% CI=0.653~0.928)。单因素及多因素逻辑回归分析均表明CA199( P<0.05)和超声造影影像组学评分( P<0.001)可作为LARC患者nCRT后pCR的独立预测因子。 结论:超声造影影像组学评分对LARC患者nCRT后是否达到pCR具有一定预测价值,有可能为预测LARC患者nCRT后达到pCR提供一种无创影像学生物标志物。
...不再出现此类内容
编辑人员丨1天前
-
LASSO及其拓展方法在回归分析变量筛选中的应用
编辑人员丨1天前
多重共线性是影响回归分析结果的一个重要问题,近年来发展的LASSO方法对于筛选解释性较高的变量、处理高维数据和解决多重共线性问题具有强大的优势。该方法是在模型估计中增加了惩罚项,能将一些不必要变量的回归系数压缩为零进而从模型中剔除,达到变量筛选的目的。本文将重点介绍LASSO这一方法,并与最优子集、岭回归、自适应LASSO与弹性网络的结果进行比较,结果显示LASSO与自适应LASSO在解决自变量多重共线性问题以及增强模型解释性、预测精度方面均有较好的表现。
...不再出现此类内容
编辑人员丨1天前
-
广西中医医院医务人员绩效分配满意度影响因素分析
编辑人员丨2024/4/13
目的:调查广西公立中医医院医务人员绩效分配满意度及其影响因素,为完善中医医院绩效分配体系提供参考.方法:采取分层抽样抽取广西12所公立中医医院2 316名医疗、护理、医技、行政和后勤人员,运用R语言进行Logistic回归和随机森林、弹性网络、支持向量机模型3种机器学习算法分析影响因素.结果:广西中医医院医务人员绩效分配满意度为32.99%,随机森林模型在预测准确性、特异度、AUC上表现最好,不同岗位薪酬差距能否反映劳动价值、工资能否体现劳动价值、自2017年以来薪酬增长情况、税后收入、付出回报程度、编制内外薪酬是否有区别是影响医务人员绩效分配满意度的6个主要影响因素.结论:目前广西中医医院医务人员绩效分配满意度较低,建议建立基于DRG和RBRVS的中医医院薪酬绩效分配方案,提高基本薪酬占比,制定合理的年薪制薪酬水平标准.
...不再出现此类内容
编辑人员丨2024/4/13
-
卒中后吞咽障碍患者卒中相关性肺炎预测模型的构建
编辑人员丨2024/4/6
目的 分析卒中后吞咽障碍患者卒中相关性肺炎(stroke-associated pneumonia,SAP)的影响因素,构建SAP风险预测模型并验证其预测效果.方法 前瞻性连续纳入2022年11月至2023年5月,重庆市3所医院神经内科住院的卒中后吞咽障碍患者为对象,调查患者一般情况、临床资料、吞咽及口腔健康状况.应用弹性网络筛选预测因素,多因素Logistic回归建模并进行验证,绘制列线图展示模型结果.结果 共纳入211例患者,46例(21.80%)发生卒中相关性肺炎.弹性网络共筛选出5个预测因素,即美国国立卫生院卒中量表(national institutes of health stroke scale,NIHSS评分)、洼田饮水试验、唾液分泌状况、口腔健康评估量表(oral health assessment tool,OHAT)评分、口腔卫生状况.似然比检验结果提示,模型在统计上显著(x2=104.17,P<0.01),判别指数为0.960.模型受试者操作特征曲线下面积(AUC)为0.93(95%CI:0.87~0.93),最佳风险阈值为0.10,准确度为83.87%,灵敏度为84.62%,特异度为83.67%.结论 构建的模型能较好地预测卒中后吞咽障碍患者SAP风险,对尽早识别高风险患者、制定个体化预防策略具有临床意义.
...不再出现此类内容
编辑人员丨2024/4/6
-
基于TCGA数据库的头颈鳞癌预后关键基因分析
编辑人员丨2024/3/30
目的 利用现有的TCGA数据库中头颈鳞癌基因表达谱数据和生存数据,探索头颈鳞癌预后关键基因.方法 基于机器学习方法并在统计学意义下进行基因差异表达分析.分别利用LASSO回归及弹性网络回归,初步筛选出与生存相关的基因,并基于GEPIA数据库和Wilcox test检验对筛选结果进行双重检验.利用UALCAN数据库和COX比例风险回归模型,对通过检验的基因结果进行生存分析,探索预后关键基因与生存率的关系.结果 共获得1 881个差异基因,并且弹性网络回归筛选的18个基因通过了双重检验(P<0.05).6个基因在UALCAN数据库和COX比例风险回归模型中均与头颈鳞癌生存率相关,其中CDKN2A、DMRTA2与患者生存率正相关,PLAU、STC2、SYT1、TIMP4则与患者生存率负相关.结论 CDKN2A、DMRTA2、PLAU、STC2、SYT1、TIMP4这6个基因为头颈鳞癌预后关键基因.
...不再出现此类内容
编辑人员丨2024/3/30
-
机器学习方法构建老年患者术后急性肾损伤的预测模型
编辑人员丨2024/1/20
目的 采用机器学习方法构建老年患者术后急性肾损伤(AKI)的预测模型.方法 收集2019年6月至2020年7月行手术治疗的老年患者的术前信息和术后随访信息,提取实验室检查结果,共纳入115个术前变量,应用极端梯度提升(XGB)、梯度提升(GBM)、随机森林(RF)、支持向量机(SVM)和弹性网络逻辑回归(ELA)5种方法构建术后AKI预测模型,采用受试者工作特征曲线下面积(AUROC)、精确度-召回率曲线下面积(AUPRC)和Brier评分评估模型性能.为简化模型以便于临床实践应用,得到原始模型后剔除部分相关性较低的变量,并再次用上述方法对模型进行评估.结果 本研究最终纳入老年患者5 929例,男3 359例(56.7%),女2 570例(43.3%),年龄65~99岁,其中154例(2.6%)发生术后AKI.在应用5种机器学习方法构建的预测模型中,XGB模型的 AUROC 和 AUPRC 最高,分别为 0.798(95%CI 0.705~0.888)和 0.230(95%CI 0.079~0.374);Brier评分最低,为0.023(95%CI 0.014~0.029).对XGB模型进行简化后,保留72个变量,简化模型的 AUROC、AUPRC 和 Brier 评分分别为 0.790(95%CI 0.711~0.861)、0.176(95%CI 0.070~0.313)和0.024(95%CI 0.017~0.033),与原模型差异无统计学意义.结论 在应用5种机器学习方法构建的术后急性肾损伤预测模型中,XGB的预测效能最佳,经简化的XGB预测模型仍保留较高的预测效能,且更容易在临床上推广使用.
...不再出现此类内容
编辑人员丨2024/1/20
-
基于临床、影像组学开发并验证用于预测肺磨玻璃结节浸润性的Nomogram模型
编辑人员丨2023/12/30
目的 探讨基于影像学征象、临床特征及临床影像组学联合模型预测术前GGN的病理浸润性的价值.方法 回顾性收集经手术切除的219例GGN患者临床、影像及病理资料,分为腺体前驱病变(AAH/AIS)和浸润性肺腺癌(MIA/IAC),比较两组患者影像征象、临床特征的差异性.提取所有GGN患者影像组学特征,采用弹性网络算法构建影像组学模型.通过单因素和逐步Logistic回归筛选临床重要危险因素,构建临床模型,并进一步结合影像组学模型构建联合模型.ROC曲线评估模型预测性能,采用Nomogram图可视化模型风险因素.结果 AAH/AIS(n=99)组和MIA/IAC组(n=120)中月牙征、分叶征、毛刺征、胸膜牵拉征、GGN长度和CT值具有统计学意义(P<0.05).影像组学模型在训练组和验证组中的AUC分别为0.806(95%CI:0.7350.874)、0.814(95%CI:0.7030.913).月牙征、胸膜牵拉征和HU为临床独立危险因素,逐步回归分析得到最优临床模型,模型在训练组和验证组中的AUC分别为0.753(95%CI:0.6740.828)、0.742(95%CI:0.6210.851).结合Radscore、月牙征、胸膜牵拉征和HU构建联合模型,模型在训练组和验证组中的AUC分别为0.843(95%CI:0.8040.898)、0.869(95%CI:0.8480.927),相比其他两个模型,联合模型评估GGN病理浸润性展示了更强的模型性能,此外利用Nomogram量化影像特征.结论 基于临床特征及影像组学构建联合模型有助于术前无创预测GGN病理浸润性,Nomogram有助于可视化模型.
...不再出现此类内容
编辑人员丨2023/12/30
-
健康成人胰腺剪切波弹性成像的可行性和测量值及其影响因素
编辑人员丨2023/10/21
目的:探索健康成人胰腺不同部位剪切波弹性成像(SWE)的可行性和弹性测量值,并分析弹性成像成功率和测量值的影响因素。方法:2021年7月中山大学附属第一医院通过网络招募47名健康成年人进行胰腺SWE检查,收集其性别、年龄、体质量指数、测量部位(胰头、胰体、胰尾)、取样框深度、弹性测量值等资料,采用Logistic回归方法分析胰腺弹性成像成功与否的影响因素,应用方差分析和线性回归探索胰腺弹性测量值的影响因素。结果:胰腺弹性测量的成功率与测量部位有关(OR=0.50,P=0.011),胰体成功率最高(93.6%),胰头次之(74.5%),胰尾最低(48.9%)。胰腺不同部位(胰头、胰体、胰尾部)的弹性测量值比较[(10.00±2.06)kPa vs(8.77±2.02)kPa vs(9.90±2.32)kPa],差异无统计学意义(F=2.33,P=0.105)。取样框深度是胰体部弹性测量值的独立影响因素(回归系数r=2.16,P<0.001),取样框深度越深,弹性测量值越高。结论:健康成人胰腺SWE的成功率受测量部位影响,胰体部弹性测量值与取样框深度有关。
...不再出现此类内容
编辑人员丨2023/10/21
