-
肝细胞癌预后相关的炎症反应关键基因的筛选及其预后价值
编辑人员丨2天前
目的:筛选与肝细胞癌(hepatocellular carcinoma,HCC)预后密切相关的炎症反应关键基因,构建预后风险评分模型,并评估该模型在HCC中的预后价值.方法:从TCGA数据库获取HCC患者肝肿瘤组织及正常肝组织的mRNA表达数据作为训练集,从GEO数据库中获取HCC患者的mRNA表达数据作为验证集.筛选出与HCC预后相关的炎症反应相关基因,运用LASSO回归和随机生存森林(RSF)方法筛选与HCC预后相关的炎症反应关键基因.基于这些关键基因构建预后风险评分模型并验证,应用Cox比例风险回归评估该模型对患者预后的影响.构建列线图并进行一致性分析.结果:共筛选出15个与HCC预后相关的炎症反应基因,经LASSO回归和RSF分析,确定11个炎症反应关键基因,即IL18RAP、MEP1A、RIPK2、CYBB、SLC7A1、ADM、IL7R、P2RX4、ACVR2A、SERPINE1、SLC7A2.构建的预后风险评分模型在训练集和验证集上预测1、3、5年生存率,AUC值均超过0.60;Kaplan-Meier分析显示高风险组总生存期(OS)显著低于低风险组(P<0.01);PCA和t-SNE分析显示该模型能有效区分高、低风险患者.Cox回归分析提示预后风险评分是独立的预后因素,且与OS显著相关(P<0.01).列线图模型C-index为0.672,具有较高的预测精度,1年和3年校准曲线与标准曲线吻合度好,5年吻合度稍弱.结论:本研究成功构建并验证了一个基于炎症反应相关基因的风险评分模型,筛 选出的11个炎症反应关键基因(IL18RAP、MEP1A、RIPK2、CYBB、SLC7A1、ADM、IL7R、P2RX4、ACVR2A、SERPINE1、SLC7A2)与HCC进展密切相关,且在模型中显示出较强的预后预测能力.
...不再出现此类内容
编辑人员丨2天前
-
脓毒症相关性急性肾损伤患者3个月死亡风险列线图预测模型的建立与评价
编辑人员丨2天前
目的:建立并评价脓毒症相关性急性肾损伤(S-AKI)患者3个月死亡风险的列线图预测模型。方法:基于美国重症监护医学信息数据库Ⅳ(MIMIC-Ⅳ),收集2008至2021年S-AKI患者的临床数据。初步纳入58个相关预测因素,以3个月内全因死亡为结局事件。按7∶3比例将数据分为训练集和验证集。在训练集中采用单因素Logistic回归分析初步筛选变量,运用多重共线性分析、Lasso回归和随机森林算法并结合临床应用价值进行变量选择,建立多因素Logistic回归模型并利用列线图进行可视化表达。在验证集中进行内部验证,评价模型预测价值;绘制受试者工作特征曲线(ROC曲线)计算曲线下面积(AUC)评价列线图模型及牛津急性疾病严重度评分(OASIS)、序贯器官衰竭评分(SOFA)、全身炎症反应综合征评分(SIRS)的区分度;校准曲线评价校准度;决策曲线分析(DCA)评估不同阈值概率下的净效益。结果:基于确诊后3个月时的生存状况将患者分为存活组7?768例(68.54%),死亡组3?566例(31.46%)。在训练集中通过多重筛选,最终纳入7个变量,即Logistic器官功能障碍评分(LODS)、Charlson合并症指数、尿量、国际标准化比值(INR)、呼吸支持方式、血尿素氮和年龄,并纳入列线图模型。在验证集中进行内部验证,ROC曲线分析显示,列线图模型的AUC为0.81〔95%可信区间(95% CI)为0.80~0.82〕,大于OASIS评分的0.70(95% CI为0.69~0.71),远大于SOFA评分的0.57(95% CI为0.56~0.58)和SIRS评分的0.56(95% CI为0.55~0.57),具有较好区分度。校准曲线显示列线图模型校准度优于OASIS、SOFA、SIRS评分。DCA曲线显示列线图模型在不同阈概率情况下的临床净收益均好于OASIS、SOFA、SIRS评分。 结论:基于MIMIC-Ⅳ临床大数据建立的一个包含7项变量的S-AKI患者3个月死亡风险预测列线图模型具有很好的区分度和校准度,为评估S-AKI患者预后提供了有效的新工具。
...不再出现此类内容
编辑人员丨2天前
-
PET影像组学特征多参数模型对≥60岁弥漫性大B细胞淋巴瘤患者生存预后的预测价值
编辑人员丨2天前
目的:探讨基于机器学习的 18F-FDG PET影像组学特征对≥60岁弥漫性大B细胞淋巴瘤(DLBCL)患者的预后评估价值。 方法:回顾性分析2011年3月至2019年11月166例未经治疗的DLBCL患者(年龄≥60岁)的 18F-FDG PET/CT资料,其中男88例、女78例,年龄60~93岁;训练组115例,验证组51例。对患者PET图像进行病灶勾画及影像组学特征提取,运用3种机器学习方法[最小绝对收缩和选择算子(LASSO)、随机森林(RF)和极端梯度提升(Xgboost)]筛选特征,采用支持向量机(SVM)对特征进行分类并生成影像组学标签(RS),对患者总生存(OS)进行预测。根据Cox比例风险回归模型构建多参数模型,并通过一致性指数(C-index)进行评估。 结果:共提取1 421种影像组学特征,筛选出10个预测效能强的特征并生成RS。单因素Cox回归分析示,RS[风险比( HR)=5.685, 95% CI: 2.955~10.939; P<0.001]是OS的危险因素。构建出包含RS、代谢特征及临床风险因素的多参数模型,其较临床模型、基于PET模型及美国国家综合癌症网络国际预后指数(NCCN-IPI)在预测OS上具有更高的效能(训练组C-index:0.752、0.737、0.739、0.688;验证组C-index:0.845、0.798、0.844、0.775)。 结论:基于机器学习 18F-FDG PET影像组学特征的RS是≥60岁DLBCL患者生存预后的预测因素。构建的包含影像组学特征的多参数模型能较好地预测患者预后。
...不再出现此类内容
编辑人员丨2天前
-
随机生存森林:基于机器学习算法的生存分析模型
编辑人员丨2天前
传统的生存分析方法虽在生物医学领域已有广泛应用,但需满足一些前提假设。随机生存森林方法可克服这一弱点。本文以美国梅奥诊所的肝脏原发性胆汁肝硬化的数据为例,从随机生存森林的原理、建模步骤、实例演示和适用性讨论等方面进行阐述,以期为读者进行生存分析提供新的思路和方法。
...不再出现此类内容
编辑人员丨2天前
-
机器学习方法构建老年心房颤动合并冠心病患者远期死亡的预测模型研究
编辑人员丨2天前
目的:利用机器学习方法建立老年心房颤动(房颤)合并冠心病患者的远期死亡预测模型,并确定相应的危险因素。方法:回顾性队列研究,连续入组2013年1月至2015年3月北京医院收治的60岁及以上房颤合并冠心病患者329例,男性183例(55.6%)例,女性146例(44.4%),年龄(77.8±7.3)岁,80岁及以上142例(43.2%)。失访11例(3.3%),死亡151例(45.9%),最后纳入分析的患者共318例。根据患者生存结局,将318例患者分为死亡组(151例)和存活组(167例)。此外,另选取2015年4—7月入院的60岁及以上房颤合并冠心病患者60例为外部数据验证集。采集人口统计学参数、合并疾病、辅助检查和临床治疗情况。随访至少6年,记录包括死亡在内的主要不良心脑血管事件(MACCE)。最后将入组患者按9∶1的比例随机分为训练集和测试集,通过机器学习算法建立不同模型预测房颤合并冠心病患者远期死亡率,并通过外部数据(60例)验证比较确立最优模型,利用Shapley加法解释算法对变量的重要性进行排序,得出排名前20位的特征变量,以确定危险因素。结果:329例患者中,总体中位随访时间77.0月(95% CI:54.0~84.0),失访11例(3.3%),死亡151例(45.9%)。通过分析得出支持向量机模型、k-近邻算法(KNN)模型、决策树模型、随机森林模型、ADABoost模型、XGBoost模型、Logistic回归模型预测远期死亡率的受试者工作特征曲线(ROC)下面积(AUC)分别为0.76、0.75、0.75、0.91、0.86、0.85和0.81。其中随机森林模型预测效能最高,其准确率达0.789,F1值高达0.806,且优于传统的Logistic回归模型(AUC:0.91比0.81, P<0.05)。D-二聚体、年龄、MACCE次数、左心室射血分数、人血白蛋白水平、贫血、纽约心脏病协会心功能分级、陈旧性心肌梗死病史、估测肾小球滤过率(eGFR)及静息心率是预测远期死亡率的重要危险因素。 结论:基于机器学习方法建立的随机森林模型可预测老年房颤合并冠心病患者的远期死亡率,具有较好的识别能力,其准确性高于传统的Logistic回归模型。可通过干预患者的D-二聚体水平、纠正低蛋白血症和贫血、改善心功能和控制静息心室率降低远期死亡率,改善患者远期预后。
...不再出现此类内容
编辑人员丨2天前
-
机器学习算法在早期肝细胞癌术后复发预测中的应用价值
编辑人员丨2天前
目的:比较多种机器学习算法在早期肝细胞癌(HCC)术后复发预测中的效能。方法:回顾性分析2009年5月至2019年12月南京医科大学第一附属医院收治的882例接受根治性手术切除的早期HCC患者的临床资料,其中男性701例,女性181例,年龄(57.3±10.5)岁(范围:21~86岁)。将患者按2∶1随机分为训练集(588例)和测试集(294例)。构建的机器学习预测模型包括随机生存森林(RSF)、梯度提升机、弹性网络-Cox回归和Cox回归模型。采用一致性指数(C-index)衡量模型预测的准确性、综合Brier分数量化模型的预测误差、校准曲线反映模型的拟合情况。比较机器学习模型、竞争模型和HCC分期系统的预测效能。所有模型均在独立的测试集内进行验证。结果:训练集内患者中位无复发生存时间为61.7个月,测试集内患者中位无复发生存时间为61.9个月,两组患者无复发生存情况的差异无统计学意义( χ2=0.029, P=0.865)。RSF模型由5个常用临床病理学特征构成:白蛋白-胆红素分级、血清甲胎蛋白、肿瘤数目、肝切除方式和微血管侵犯。在训练集和测试集中,RSF模型的C-index值分别为0.758(95% CI:0.725~0.791)和0.749(95% CI:0.700~0.797),综合Brier分数分别为0.171和0.151。RSF模型对早期HCC复发预测的准确性优于其他3种机器学习模型、竞争模型(ERASL模型)及HCC分期系统(巴塞罗那分期、中国肝癌的分期方案、TNM分期),差异均有统计学意义( P值均<0.01)。校准曲线提示,RSF模型的预测概率与实际观察值具有较好的一致性。RSF模型可将早期HCC患者的复发风险分为低危、中危和高危组,在训练集和测试集内三组患者无复发生存情况的差异有统计学意义( P<0.01)。RSF模型对早期HCC术后复发风险的分层明显优于TNM分期。 结论:本研究构建的RSF模型集合了5个常用临床病理学特征,可较为准确地预测复发风险。
...不再出现此类内容
编辑人员丨2天前
-
同时性结直肠癌肝转移术后早期复发的影响因素
编辑人员丨2天前
目的:探讨同时性结直肠癌肝转移(sCRLM)术后早期复发的定义及其影响因素。方法:收集2008年12月至2016年12月中国医学科学院肿瘤医院肝胆外科sCRLM患者的临床病理资料。通过限制性立方条分析,探索复发出现的早晚与远期预后的关系,依次行单因素Cox、多因素Cox分析验证6个月作为早期复发定义界点的可行性。随后应用逻辑回归、支持向量机、决策树、随机森林、人工神经网络及XGBoost机器学习的特征变量选择算法,综合排名临床病理变量对6个月内早期复发的重要度,并按综合排名顺序依次将变量引入逻辑回归模型,观察逻辑回归模型的受试者工作特征曲线(ROC),根据ROC下面积、赤池信息准则、贝叶斯信息准则筛选最佳变量组合,将其纳入多因素逻辑回归分析,进而筛选出早期复发的独立性危险因素。随后对独立危险因素中的治疗性因素行逆概率加权(IPTW)方法分析,在降低协变量的标准化均数差的条件下进一步确认治疗性因素对sCRLM患者肝切除术后早期复发的影响。结果:共纳入228例sCRLM患者,随访2.10~108.57个月,男性142例,女性86例,年龄(55.89±0.67)岁。在170例(74.6%)复发患者中,限制性立方条分析确定无病生存期(DFS)与总生存期(OS)的风险比( HR)满足线性关系( P<0.05),且在所有患者中,Cox分析发现6个月作为早期复发的时间界点具有显著的可行性( HR=3.405, 95% CI: 2.098~5.526, P<0.05)。所有患者中93例(40.79%)出现早期复发,早期复发患者的生存率明显低于无早期复发患者( HR=3.405, 95% CI: 2.098~5.526, P<0.05,5年生存率分别为14.0%、52.0%)。六种机器学习算法联合多因素逻辑回归分析确定淋巴结清扫数量>22个( OR=0.258,95% CI: 0.132~0.506, P<0.05)是早期复发的保护性因素,而肝转移癌数量>3个( OR=4.715, 95% CI:2.467~9.011, P<0.05)和术后出现并发症( OR=2.334, 95% CI: 1.269~4.291, P<0.05)是早期复发的独立性风险因素。IPTW分析法在充分降低协变量混杂影响的条件下经因果推论证实淋巴结清扫数量>22个是DFS的保护性因素(IPTW HR=0.4887, P<0.05),且也是术后早期复发的保护性因素(IPTW OR=0.29, P<0.05),但与OS无关(IPTW HR=0.6951, P>0.05)。 结论:sCRLM术后6个月作为早期复发定义界点具有显著可行性,早期复发患者的长期生存差,sCRLM术后早期复发的独立性影响因素是淋巴结清扫数量、肝转移癌数量和术后并发症。
...不再出现此类内容
编辑人员丨2天前
-
未分化甲状腺癌预后随机生存森林模型的构建及预测效果分析
编辑人员丨2天前
目的:探讨未分化甲状腺癌(ATC)预后的影响因素,评估构建的随机生存森林(RSF)模型在ATC预后预测中的应用价值。方法:选择2004-2015年美国国立癌症研究所的监测、流行病学和最终结果(SEER)数据库中经组织病理学诊断为ATC的患者707例,采用简单随机法将所有患者分为训练集(495例)和验证集(212例)。采用单因素Cox比例风险模型分析影响训练集患者总生存(OS)的相关因素。采用基于最小赤池信息量准则(AIC)的多因素Cox比例风险模型分析上述变量并进行筛选,基于筛选出的变量构建预测OS的传统Cox模型;采用RSF算法对单因素Cox回归分析中 P<0.05的变量进行分析,筛选重要的5个特征,纳入基于最小AIC的多因素Cox比例风险模型,采用筛选出的变量构建预测OS的RSF-Cox模型。采用时间依赖受试者工作特征(tROC)曲线及曲线下面积(AUC)、校正曲线、决策曲线、综合Brier评分(IBS),通过训练集和验证集来评估各模型预测OS的效能。 结果:单因素Cox回归分析显示,年龄、是否接受化疗、淋巴结转移情况、是否接受放疗、手术方式、肿瘤浸润程度、肿瘤数量、肿瘤长径和诊断时年份这9个变量是ATC预后的影响因素(均 P<0.05)。基于最小AIC(4855.8)的多因素Cox回归分析显示,年龄较小(61~70岁比>80岁: HR=0.732,95% CI 0.560~0.957, P=0.023;≤50岁比>80岁: HR=0.561,95% CI 0.362~0.870, P=0.010)、接受化疗(是比否: HR=0.623,95% CI 0.502~0.773, P<0.001)、接受放疗(是比否: HR=0.695,95% CI 0.559~0.866, P=0.001)、接受手术(叶切除比未手术或未知: HR=0.712,95% CI 0.541~0.939, P=0.016;全切或次全切比未手术或未知: HR=0.535,95% CI 0.436~0.701, P<0.001)、肿瘤长径(≤2 cm比>6 cm: HR=0.495,95% CI 0.262~0.938, P=0.031;>2 cm且≤4 cm比>6 cm: HR=0.714,95% CI 0.520~0.980, P=0.037;>4 cm且≤6 cm比>6 cm: HR=0.699,95% CI 0.545~0.897, P=0.005)是ATC患者OS的独立保护因素;淋巴结转移(N 1未知比N 0: HR=1.664,95% CI 1.158~2.390, P=0.006;N 1b比N 0: HR=1.312,95% CI 1.029~1.673, P=0.028)、更具侵袭性的肿瘤浸润程度(组别3比组别1: HR=1.492,95% CI 1.062~2.096, P=0.021;组别4比组别1: HR=1.636,95% CI 1.194~2.241, P=0.002)是ATC患者OS的独立危险因素,诊断时年份(2010-2015年比2004-2009年: HR=1.166,95% CI 0.962~1.413, P=0.118)虽无统计学意义,但将其纳入可提高传统Cox模型的效能,故也将其纳入传统Cox模型。采用RFS算法,筛选出手术方式、肿瘤长径、年龄分组、是否接受化疗和肿瘤数量5个变量,基于最小AIC(4 884.6)的多因素Cox回归分析显示,接受化疗(是比否: HR=0.574,95% CI 0.476~0.693, P<0.001)、手术方式(叶切除比未手术或未知: HR=0.730,95% CI 0.567~0.940, P=0.015;全切或次全切比未手术或未知: HR=0.527,95% CI 0.423~0.658, P<0.001)、肿瘤长径(≤2 cm比>6 cm: HR=0.428,95% CI 0.231~0.793, P=0.007;>2 cm且≤4 cm比>6 cm: HR=0.701,95% CI 0.513~0.958, P=0.026;>4 cm且≤6 cm比>6 cm: HR=0.681,95% CI 0.536~0.866, P=0.002)是ATC患者OS的独立影响因素,基于这3个变量构建RSF-Cox模型。tROC曲线分析显示,在训练集中RSF-Cox模型预测6、12、18个月OS率的AUC分别为93.56、92.62、90.80,在验证集中分别为93.05、92.47、90.20;在训练集中传统Cox模型分别为89.00、87.76、85.24,在验证集中分别为86.22、83.68、82.86。预测6、12、18个月OS率时,RSF-Cox模型校准曲线较传统Cox模型更接近45°,RSF-Cox模型决策曲线的临床净获益均高于传统Cox模型。RSF-Cox模型IBS(0.089)低于传统Cox模型(0.111)。 结论:基于接受化疗、手术方式、肿瘤长径构建的RSF模型可以有效预测ATC患者的OS。
...不再出现此类内容
编辑人员丨2天前
-
机器学习算法和COX列线图在肝细胞癌术后生存预测中的应用价值
编辑人员丨2天前
目的:探讨机器学习算法和COX列线图在肝细胞癌术后生存预测中的应用价值。方法:采用回顾性描述性研究方法。收集2012年1月至2017年1月中国医学科学院北京协和医学院肿瘤医院收治的375例肝细胞癌行根治性肝切除术患者的临床病理资料;男304例,女71例;中位年龄为57岁,年龄范围为21~79岁。375例患者通过计算机产生随机数方法以8∶2比例分为训练集300例和验证集75例,应用逻辑回归、支持向量机、决策树、随机森林、人工神经网络机器学习算法构建肝细胞癌患者术后生存的预测模型,筛选性能最优的机器学习算法预测模型;构建肝细胞癌患者术后生存预测的COX列线图预测模型;比较最优机器学习算法预测模型和COX列线图预测模型预测肝细胞癌患者术后生存的性能。观察指标:(1)训练集与验证集患者临床病理资料分析。(2)训练集与验证集患者随访及生存情况。(3)机器学习算法预测模型构建及验证。(4)COX列线图预测模型构建及验证。(5)随机森林机器学习算法预测模型与COX列线图预测模型预测性能评价。采用门诊或电话方式进行随访,了解患者生存情况。随访时间截至2019年12月或患者死亡。正态分布的计量资料以 ± s表示,组间比较采用配对 t检验。偏态分布的计量资料以 M( P25, P75)或 M(范围)表示,组间比较采用Mann-Whitney U检验。计数资料以绝对数表示,当Tmin≥5,N≥40时,组间比较采用 χ2检验;当1≤Tmin≤5,N≥40时,采用校正 χ2检验;当Tmin<1或N<40时,采用Fisher确切概率法。采用Kaplan-Meier法计算生存率和绘制生存曲线。采用COX比例风险模型进行单因素分析,将 P<0.2的变量纳入Lasso回归分析,根据λ值筛选影响预后的变量,最后将变量纳入COX比例风险模型进行多因素分析。 结果:(1)训练集与验证集患者临床病理资料分析:训练集和验证集患者微血管侵犯(无、有),肝硬化(无、有)分别为292、8例,105、195例和69、6例,37、38例,两组患者比较,差异均有统计学意义( χ2=4.749,5.239, P<0.05)。(2)训练集与验证集患者随访及生存情况:训练集与验证集患者均获得随访。训练集300例患者随访时间为1.1~85.5个月,中位随访时间为50.3个月。验证集75例患者随访时间为1.0~85.7个月,中位随访时间为46.7个月。375例肝细胞癌患者术后1、3年总体生存率分别为91.7%、79.5%。训练集和验证集患者术后1、3年总体生存率分别为92.0%、79.7%和90.7%、81.9%。两组患者术后生存情况比较,差异无统计学意义( χ2=0.113, P>0.05)。(3)机器学习算法预测模型构建及验证。①筛选最优机器学习算法预测模型:根据变量对预测肝细胞癌术后3年生存的信息增益度,应用逻辑回归、支持向量机、决策树、随机森林和人工神经网络5种机器学习算法对肝细胞癌临床病理因素进行变量综合排名。筛选主要预测因素为乙型肝炎e抗原(HBeAg)、手术方式、肿瘤最大直径、围术期输血、肝被膜侵犯、肝脏Ⅳ段侵犯。将预测因素前3、6、9、12、15、18、21、24、27、29个变量依次引入5种机器学习算法。其结果显示:当引入9个变量时,逻辑回归、支持向量机、决策树、随机森林机器学习算法预测模型受试者工作特征曲线的曲线下面积(AUC)趋于稳定。当引入变量>12个时,人工神经网络机器学习算法预测模型AUC波动明显,逻辑回归、支持向量机机器学习算法预测模型AUC稳定性可继续改善,而随机森林机器学习算法预测模型AUC接近0.990,说明随机森林机器学习算法预测模型为最优机器学习算法预测模型。②随机森林机器学习算法预测模型优化和验证:将预测因素29个变量依次引入随机森林机器学习算法预测模型中,构建训练集最佳随机森林机器学习算法预测模型。其结果显示:当引入变量=10个时,网格搜索法示最佳决策树结点个数=4,最佳决策树数目=1 000;当引入变量≥10个时,随机森林机器学习算法预测模型AUC稳定在0.990左右。其中当引入变量=10个时,随机森林机器学习算法预测模型预测训练集术后3年总体生存AUC为0.992,灵敏度为0.629,特异度为0.996,预测验证集术后3年总体生存AUC为0.723,灵敏度为0.177,特异度为0.948。(4)COX列线图预测模型构建及验证。①训练集患者术后生存因素分析。单因素分析结果显示:HBeAg、甲胎蛋白、围术期输血、肿瘤最大直径、肝被膜侵犯、肿瘤分化程度是影响肝细胞癌患者术后生存的相关因素(风险比=1.958,1.878,2.170,1.188,2.052,0.222,95%可信区间为1.185~3.235,1.147~3.076,1.389~3.393,1.092~1.291,1.240~3.395,0.070~0.703, P<0.05)。将 P<0.2的临床病理因素纳入Lasso回归分析,其结果显示:性别,HBeAg,甲胎蛋白,手术方式,围术期输血,肿瘤最大直径,肿瘤位置在肝脏Ⅴ段和肝脏Ⅷ段,肝被膜侵犯,肿瘤分化程度(高分化、中高分化、中分化、中低分化)是影响肝细胞癌患者术后生存的相关因素。进一步将上述临床病理因素纳入多因素COX回归分析,其结果显示:HBeAg、手术方式、肿瘤最大直径是肝细胞癌患者术后生存的独立影响因素(风险比=1.770,8.799,1.142,95%可信区间为1.049~2.987,1.203~64.342,1.051~1.242, P<0.05)。②COX列线图预测模型的构建和验证:将训练集COX多因素分析结果中 P≤0.1的临床病理因素引入Rstudio软件及其rms软件包,构建训练集COX列线图预测模型。COX列线图预测模型预测术后总体生存的C-index为0.723(se=0.028),预测训练集术后3年总体生存AUC为0.760,预测验证集术后3年总体生存AUC为0.795。训练集校准图验证显示COX列线图预测模型对术后生存有较好预测效果。COX列线图回归函数=0.627 06×HBeAg(正常=0,异常=1)+0.134 34×肿瘤最大直径(cm)+2.107 58×手术方式(腹腔镜=0,开腹手术=1)+0.545 58×围术期输血(无输血=0,输血=1)-1.421 33×高分化(非高分化=0,高分化=1)。计算所有患者COX列线图风险评分,应用Xtile软件寻找COX列线图风险评分最佳阈值,风险评分≥2.9分为高危组,风险评分<2.9分为低危组。Kaplan-Meier总体生存曲线结果显示:训练集低危组和高危组患者术后总体生存比较,差异有统计学意义( χ2=33.065, P<0.05)。验证集低危组和高危组患者术后总体生存比较,差异有统计学意义( χ2=6.585, P<0.05)。进一步采用决策曲线分析结果显示:联合HBeAg、手术方式、围术期输血、肿瘤最大直径和肿瘤分化程度因素的COX列线图预测模型预测性能优于单一因素的预测性能。(5)随机森林机器学习算法预测模型和COX列线图预测模型预测性能评价:通过对2种模型中共同含有的重要变量(肿瘤最大直径)进行分析,并将2种模型通过预测误差曲线进行比较,观察2种模型的预测差异。其结果显示:肿瘤最大直径为2.2 cm时,随机森林机器学习算法和COX列线图预测模型预测患者术后3年生存率分别为77.17%和74.77%( χ2=0.182, P>0.05);肿瘤最大直径为6.3 cm时,随机森林机器学习算法和COX列线图预测模型预测患者术后3年生存率分别为57.51%和61.65%( χ2=0.394, P>0.05);肿瘤最大直径为14.2 cm时,随机森林机器学习算法和COX列线图预测模型预测患者术后3年生存率分别为51.03%和27.52%( χ2=12.762, P<0.05)。随着肿瘤最大直径增加,2种模型预测患者生存率差异增大。验证集中,随机森林机器学习算法预测模型预测患者术后3年总体生存AUC为0.723,COX列线图预测模型预测患者术后3年总体生存AUC为0.795,两者比较,差异有统计学意义( t=3.353, P<0.05)。采用Bootstrap交叉验证结果显示:随机森林机器学习算法预测模型和COX列线图预测模型预测3年生存的整合Brier得分分别为0.139、0.134,COX列线图预测模型预测误差低于随机森林机器学习算法预测模型。 结论:与机器学习算法预测模型比较,COX列线图预测模型预测肝细胞癌术后3年生存性能更佳,且其变量少,易于临床使用。
...不再出现此类内容
编辑人员丨2天前
-
基于集成机器学习模型创建评估胰腺癌预后的吉西他滨耐药基因标签
编辑人员丨2天前
目的:应用综合机器学习(ML)模型开发新的精确生物标志物,以预测胰腺癌(PC)患者预后及药物敏感性。方法:从公共多中心队列中获取768例患者的数据,并从CTRP-V2.0数据库中检索PC细胞的吉西他滨耐药数据。采用由9种ML算法组成的95个ML模型创建吉西他滨耐药相关基因特征(GRGS)。根据GRGS,PC患者被分为高危(共385例)和低危(共383例)两组。通过R 4.1.3软件的不同软件包,在纳入队列中评估GRGS预测PC患者总生存率(OS)的风险比( HR);并将CRGS与已发表基因标签进行比较。运用AutodockVina 1.2.2软件筛选药物与GRGS核心基因进行分子对接,记录药物与核心基因的结合能评分。单因素多因素分析均采用cox回归模型,Kaplan-Meier法绘制生存曲线,HR评估两组个体之间生存时间的差异, t检验比较连续性变量,c指数值(c-index)用来比较模型和基因标签效能。 结果:在95个模型中,最小绝对收缩和选择操作+随机生存森林模型(LASSO+RSF)开发的GRGS显示出最高的c-index,在5个队列中的平均值为0.674。在癌症基因组图谱(TCGA)中,CRGS分数较高的PDAC患者,其OS越差[ HR=7.40,95%可信区间( CI):4.42~12.41, P<0.01],相较于Grade分级、TNM分期、性别和年龄,CRGS是PADC患者较差OS的独立风险因素[ HR=1.07,95% CI:1.05~1.08, P<0.01]。与已发表的43个基因标签比较,GRGS在评估多个队列的预后方面表现更佳(c-index=0.94)。SMC4是组成GMGS的九个基因之一,达沙替尼结合SMC4蛋白分子的效能为-0.246。 结论:GRGS可作为评估PC患者临床预后和全身治疗的有前途的生物标志物。
...不再出现此类内容
编辑人员丨2天前
