-
基于可解释性机器学习模型的轻型缺血性卒中复发预测研究
编辑人员丨1周前
目的 利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素.方法 回顾性收集2020年7-12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因素变量筛选,合成少数过采样技术-标称连续处理数据不平衡,数据集按8∶2的比例分为训练集与测试集,网格搜索10折交叉验证构建轻量梯度提升机(light gradient boosting machine,LightGBM)、支持向量机(support vector machine,SVM)模型,并与逻辑回归(logistic regression,LR)模型进行比较,基于ROC的AUC、校准曲线分别评价模型的区分度与校准度,性能最好的模型通过Shapley加性解释(Shapley additive explanation,SHAP)模型对预测结果进行解读.结果 本研究共纳入520例MIS患者,2年内复发93例(17.9%),测试集中LightGBM、SVM、LR预测患者2年内复发的AUC分别为0.935(95%CI 0.896~0.973)、0.833(95%CI 0.770~0.896)、0.764(95%CI 0.691~0.835),准确度分别为0.890、0.773、0.693,布里尔分数分别为0.105、0.167、0.200.结果 显示LightGBM模型性能最优,基于SHAP的LightGBM可解释模型重要性前5的是舒张压、年龄、糖尿病、LDL-C、吸烟.结论 本研究建立的LightGBM模型预测效果良好,可为MIS患者2年内复发的预测提供借鉴.通过SHAP可解释性帮助临床医师更好地理解预测模型结果背后的原因,对MIS患者做出更个性化与合理化的临床决策.
...不再出现此类内容
编辑人员丨1周前
-
基于机器学习的流行性感冒中医辨证模型研究
编辑人员丨1周前
目的 通过机器学习方法对流行性感冒临床证候学资料进行训练,获得流感辨证模型.方法 收集2019年12月-2022年3月就诊于中日友好医院发热门诊的流行性感冒患者病历资料,使用数据采集系统进行数据处理,将不同数据处理过程产生的数据分别存储,以逻辑回归、决策树、朴素贝叶斯、支持向量机、多层感知机、lightGBM和随机森林为备选模型,通过Optuna进行超参数优化选择,并在各数据集中分别训练模型,以macro-F1评分为核心指标,对模型的预测性能进行评价.结果 整理得到训练样本1 011个,其中风热犯卫证453个、风寒束表证152个、表寒里热证406个;得到用于训练的数据集8个,包含数据80份.经训练,逻辑回归、决策树、朴素贝叶斯、支持向量机、多层感知机、lightGBM、随机森林模型的macro-F1评分分别为0.783 0、0.774 2、0.731 5、0.782 4、0.716 7、0.793 8、0.815 3.加权样本能显著提高平均模型性能,而主成分分析降维会降低平均模型性能.单一模型中,逻辑回归模型预测性能最佳;集成方法模型中,随机森林模型预测性能最佳.结论 在样本量较小的情况下,流行性感冒中医辨证模型使用逻辑回归、决策树、支持向量机和lightGBM较为适宜,随着样本量增加,逻辑回归、支持向量机、lightGBM和随机森林可能更为合适.不同数据处理方式会影响模型性能,对证型典型程度信息的采集有利于提高模型性能.
...不再出现此类内容
编辑人员丨1周前
-
基于磁共振影像组学和语义特征对高级别胶质瘤和转移瘤的鉴别研究
编辑人员丨1周前
目的本研究旨在结合传统MRI序列及增强检查,提取多模态高通量影像组学特征并联合语义特征,使用不同的机器学习分类器构建不同的模型并绘制列线图来鉴别高级别胶质瘤(high-grade glioma,HGG)和单发性脑转移瘤(solitary brain metastasis,SBM).材料与方法本研究对101名患者的多参数MR图像进行了回顾性分析,由两位资深医师标定肿瘤感兴趣区,然后对每个序列分别提取影像组学特征后进行组合,共提取428组影像组学特征.为消除人为标定差异,进行组内相关系数一致性检验,并运用最大相关最小冗余算法选取最具相关性的特征,然后进一步通过最小绝对收缩和选择算子算法筛除冗余特征.本研究采用支持向量机、逻辑回归、随机森林及K近邻四种算法建立分类模型.结合放射科医生评估的七项语义特征,通过卡方检验和多因素分析去除差异无统计学意义的语义特征.然后结合组学特征建立综合模型并绘制列线图.最终,评价各模型的诊断能力,以确定最优分类器.结果HGG及SBM患者建立的影像组学模型中LR的受试者工作特征曲线下面积(area under the curve,AUC)值最高,训练集与测试集分别为0.90和0.90.语义特征建立的模型中随机森林模型性能最好,训练集和测试集AUC分别为0.82和0.87.语义特征联合影像组学评分后采用逻辑回归建立的模型性能最好,训练集和测试集AUC分别为0.91和0.92.结论本研究使用影像组学机器学习分类器并联合其他图像语义特征绘制列线图对HGG及SBM进行鉴别,这是一种非侵入性方法,具有较好的准确性,为临床决策和实践提供了较大的帮助.
...不再出现此类内容
编辑人员丨1周前
-
基于治疗前多参数MRI影像组学特征预测局部晚期宫颈癌患者新辅助化疗后脉管浸润
编辑人员丨1周前
目的基于治疗前多参数磁共振成像(multi-parametric magnetic resonance imaging,mpMRI)影像组学特征构建模型预测局部晚期宫颈癌(locally advanced cervical cancer,LACC)新辅助化疗(neoadjuvant chemotherapy,NACT)后淋巴脉管间隙浸润(lymphovascular space invasion,LVSI)状态.材料与方法回顾性分析了300例于2013年至2022年来自于河南省人民医院(训练集187人,LVSI阳性73人)和河南省肿瘤医院(验证集113人,LVSI阳性31人)接受NACT并行根治性子宫切除术LACC患者的临床及影像资料.于轴位弥散加权成像(axial diffusion-weighted imaging,Ax_DWI)、矢状位T2加权成像(sagittal T2-weighted imaging,Sag_T2WI)和矢状位对比增强T1加权成像(sagittal T1-weighted contrast-enhanced imaging,Sag_T1C)上勾画肿瘤感兴趣区(region of interest,ROI)并提取特征,利用递归特征消除算法与最小绝对值收缩与选择算法筛选影像组学特征.随后,基于逻辑回归分类器分别建立单序列模型,双序列模型及基于三序列组学特征的联合序列模型.使用受试者工作特征(receiver operating characteristic,ROC)曲线评估各模型性能,使用DeLong检验比较曲线下面积(area under the curve,AUC),通过决策曲线评估模型的临床价值.结果在验证集中,基于Ax_DWI、Sag_T2WI及Sag_T1C构建的单序列模型的AUC分别为0.717[95%置信区间(confidence interval,CI):0.605~0.829]、0.734(95%CI:0.633~0.836)和0.733(95%CI:0.626~0.841);基于Ax_DWI+Sag_T2WI、Ax_DWI+Sag_T1C及Sag_T2WI+Sag_T1C构建的双序列模型的AUC值分别为0.763(95%CI:0.660~0.866)、0.786(95%CI:0.692~0.881)与0.815(95%CI:0.731~0.899);联合序列模型的AUC值为0.829(95%CI:0.740~0.914),高于各单序列模型与双序列模型,但联合序列模型与Ax_DWI模型、Sag_T2W1模型及Ax_DWI+Sag_T2W1模型之间AUC差异无统计学意义(P=0.015~0.047).决策曲线显示联合序列模型的临床净效益高于单序列模型与各双序列模型.结论基于治疗前mpMRI影像组学特征构建的联合序列模型可有效预测LACC患者NACT后的LVSI状态.
...不再出现此类内容
编辑人员丨1周前
-
18F-FDG PET/MR影像组学特征与宫颈癌PD-L1表达的相关性研究
编辑人员丨1周前
目的 探讨18F-氟代脱氧葡萄糖(fluorodeoxyglucose,FDG)正电子发射断层成像(positron emission tomography,PET)/MR影像组学特征与宫颈癌程序性死亡受体配体1(programmed death-ligand 1,PD-L1)表达的相关性.材料与方法 回顾性分析中国医科大学附属盛京医院2017年5月至2023年7月进行了18F-FDG PET/MR扫描的26例宫颈癌患者临床和影像资料,在PET,T1WI及T2WI的图像中对原发灶进行感兴趣区(region of interest,ROI)勾画,将每个患者的每个包含ROI横截面作为样本,以手术标本取样染色,将样本分为阳性组(n=233,73.97%)、阴性组(n=82,26.03%),并基于一阶统计量(Firstorder)从图像中提取影像组学特征.采用独立样本t检验或Mann-Whitney U检验比较两组间特征参数的差异,并分析图像特征参数与PD-L1表达的相关性.将样本按照7:3的比例随机划分为训练集和测试集,将差异有统计学意义的组学特征作为逻辑回归的参数建立PET影像组学模型、MR影像组学模型及PET/MR联合模型,通过受试者工作特征(receiver operating characteristic,ROC)曲线的曲线下面积(area under the curve,AUC)分析评估各模型对PD-L1表达诊断的效能.结果 PET图像参数10Percentile(P<0.01)、90Percentile(P<0.01)、Energy(P<0.01)、Interquartile Range(P<0.01)等15个一阶统计量特征与PD-L1表达具有较强的相关性,T1WI图像参数10Percentile(P<0.01)、90Percentile(P<0.05)、Maximum(P<0.05)、Mean(P<0.01)等9个一阶统计量特征与PD-L1表达具有较强的相关性,T2WI图像参数Entropy(P<0.05)、Skewness(P<0.01)、Energy(P<0.05)、Interquartile Range(P<0.01)等9个一阶统计量特征与PD-L1表达具有较强的相关性.在影像组学模型中,训练集PET组学模型、MR组学模型及PET/MR联合模型AUC值分别为0.478[95%置信区间(confidence interval,CI):0.389~0.565]、0.806(95%CI:0.728~0.874)、0.850(95%CI:0.784~0.909).测试集PET组学模型、MR组学模型及PET/MR联合模型AUC值分别为0.528(95%CI:0.381~0.669)、0.737(95%CI:0.623~0.843)、0.817(95%CI:0.715~0.902).结论 18F-FDG PET/MR影像组学特征与宫颈癌PD-L1表达差异有较强的相关性,PET/MR影像组学模型在预测宫颈癌PD-L1表达上具有更好的效能,能在临床上为宫颈癌患者评价PD-L1的表达以优化个体诊疗方案,改善患者预后.
...不再出现此类内容
编辑人员丨1周前
-
听力残疾老年人失能风险预测模型的构建与验证
编辑人员丨1周前
目的探讨听力残疾老年人发生失能的预测因素,并构建其失能风险预测模型.方法本研究采用二手数据研究方法,基于中国健康与养老追踪调查数据库,选择2015年≥60岁的374例听力残疾老年人为研究对象,按照7:3比例分为训练集(n=261)和验证集(n=113),根据其2018年是否发生失能为依据进行分组,分为随访期间未发生失能组(n=164)和随访期间发生失能组(n=97).采用最小绝对收缩和选择运算符(LASSO)多元逻辑回归筛选可能影响失能发生的变量.使用多因素logistic回归构建预测模型及绘制列线图,并进行外部验证.结果训练集失能率37.2%.高血压、肝脏疾病、关节炎/风湿病、文化水平、牙齿掉光、晚上睡眠时长、认知功能、吸烟、午间睡眠时长是听力残疾老年人发生失能的预测因素.训练集模型ROC曲线下面积为0.703,95%CI为0.636~0.769,敏感度为69.1%,特异度为67.1%;校准曲线与理想曲线相近,Brier得分为0.207;测试集的ROC曲线下面积为0.713,95%CI为0.606~0.821,敏感度为76.3%,特异度为68.0%.结论 高血压、肝脏疾病、关节炎/风湿病、文化水平、牙齿掉光、晚上睡眠时长、认知功能、吸烟、午间睡眠时长是听力残疾老年人发生失能的独立预测因素,列线图预测模型良好,对听力残疾老年人失能风险有一定的预测价值.
...不再出现此类内容
编辑人员丨1周前
-
IVIM、DKI联合DCE-MRI的影像组学在预测乳腺癌HER-2表达状态中的应用价值
编辑人员丨1周前
目的 探讨联合体素内不相干运动(intravoxel incoherent motion,IVIM)、扩散峰度成像(diffusion kurtosis imaging,DKI)和动态对比增强磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)、参数图构建影像组学模型预测乳腺癌患者人类表皮生长因子受体2(human epidermal growth factor receptor 2,HER-2)的表达状态.材料与方法 回顾性分析192例乳腺癌患者病例资料,根据患者的病理结果 分为HER-2表达阳性组(48例)和HER-2表达阴性组(144例),术前均行IVIM、DKI及DCE-MRI.并按照8:2的比例将病例随机分为训练集(154例)和测试集(38例).在灌注分数(perfusion fraction,f)、灌注相关扩散系数(perfusion related diffusion coefficient,D)、真实扩散系数(real diffusion coefficient,D)、平均扩散率(mean diffusivity,MD)和平均扩散峰度值(mean kurtosis,MK)参数图和第2期DCE-MRI(DCE-2)图像中勾画出病变区域的三维感兴趣区(region of interest,ROI),并提取其中的影像组学特征.采用Z分数归一化对特征进行标准化处理,并使用K最佳、最小冗余最大相关(max-relevance and min-redundancy,mRMR)、最小绝对收缩与选择算子回归(least absolute shrinkage and selection operator,LASSO)算法依次对特征进行降维和选择,通过logistic逻辑回归(logistic regression,LR)分类器分别建立参数图模型及联合模型,并采用5折交叉验证法验证模型的稳定性.通过受试者工作特征(receive operating characteristic,ROC)曲线和曲线下面积(area under the curve,AUC)对不同参数图像模型及联合模型的诊断效能进行分析,使用DeLong检验对各模型间ROC曲线进行比较,使用决策曲线分析(decision curve analysis,DCA)对模型的临床价值进行评估.结果从每个ROI中提取了2286个MRI特征,在f、D、D、MD、MK参数图、第2期DCE-MRI和联合序列中分别筛选得到7、6、7、6、7、12、10个特征与HER-2表达状态相关.f、D、D、MD、MK参数图模型及第2期DCE模型在测试集中的AUC分别为0.693、0.679、0.586、0.682、0.661、0.732;联合模型在测试集中的AUC为0.861(95%CI:0.775~0.958),敏感度和特异度分别为100.0%和71.4%,经DeLong检验,训练集中联合模型与f、D、D、MD、MK参数图模型及DCE-2模型之间AUC差异均有统计学意义(P均<0.05).结果表明联合模型对预测HER-2的表达状态优于单一模型.结论 基于DCE-MRI、IVIM和DKI的影像组学联合模型可以在术前有效预测乳腺癌患者的HER-2表达状态,有助于临床对乳腺癌进行诊断、分型、制订治疗方案及预后.
...不再出现此类内容
编辑人员丨1周前
-
基于多参数MRI的影像组学融合模型对乳腺癌腋窝淋巴结转移的术前预测价值
编辑人员丨1周前
目的:探讨基于多参数MRI的影像组学融合模型在乳腺癌术前预测腋窝淋巴结(ALN)转移的应用价值。方法:回顾性队列研究。纳入山西省肿瘤医院2020年8月—2021年9月经病理证实的272例乳腺癌患者的多参数MRI及临床病理资料。患者均为女性,年龄28~79(53.0±10.9)岁,其中ALN阳性107例、ALN阴性165例。按照7∶3的比例随机将患者分为训练组(191例)和验证组(81例)。从T 2加权像(T 2WI)、表观弥散系数(ADC)图和增强T 1加权像(cT 1WI)序列中提取影像组学特征。采用单因素逻辑回归、相关性分析和Boruta算法3个步骤进行特征选择,然后采用支持向量机(SVM)、随机森林(RF)和逻辑回归(LR)3种机器学习方法构建影像组学模型,并基于最优模型计算每位患者的影像组学分数(Radscore)。同时,通过多因素逐步回归分析筛选乳腺癌ALN转移的独立危险因素并构建临床模型。最后,联合Radscore和临床独立危险因素构建融合模型,并绘制列线图。采用受试者操作特征曲线、校准曲线和决策曲线(DCA)来评价模型对乳腺癌ALN转移的预测性能及临床效益。 结果:训练组和验证组患者肿瘤位置比较,差异有统计学意义( P<0.05);训练组中ALN阳性与ALN阴性患者间的肿瘤位置、MRI评估淋巴结状态比较,验证组中ALN阳性与ALN阴性患者间的雌激素受体、分子亚型及MRI评估淋巴结状态比较,差异均有统计学意义( P值均<0.05)。基于多参数MRI降维选择后,得到了6个与ALN转移呈显著相关的影像组学特征( P值均<0.05)。在训练组和验证组中,SVM、RF和LR模型均表现出很好的预测能力,AUC分别为0.784、0.826、0.703和0.733、0.817、0.703,其中RF模型效能最高。单因素、多因素回归分析显示,MRI评估淋巴结状态是乳腺癌ALN转移的独立预测因子[比值比(95%可信区间)=10.909(5.210~24.511), P<0.001],采用这一指标构建临床模型。联合Radscore和MRI评估ALN状态的融合模型在训练组和验证组中均表现出更好的性能,AUC分别为0.867和0.866,且其诊断效能均优于上述3种机器学习模型和临床模型(AUC分别为0.719和0.700)。DCA显示,3种机器学习模型、临床模型和融合模型均有一定的临床效益,其中融合模型的净收益值最大。 结论:基于多参数MRI影像组学特征和联合MRI评估淋巴结状态的融合模型有助于术前准确预测乳腺癌ALN转移状态。
...不再出现此类内容
编辑人员丨1周前
-
基于静脉期增强CT影像组学的机器学习模型术前预测局部进展期胃癌脉管侵犯
编辑人员丨1周前
目的:评估基于静脉期增强CT影像组学特征的机器学习模型术前预测局部进展期胃癌脉管侵犯(VI)的价值。方法:回顾性分析2011年7月至2020年12月郑州大学第一附属医院经病理证实的296例局部进展期胃癌患者,VI阳性213例、阴性83例,采用分层抽样方法按7∶3的比例将数据分为训练集(207例)和测试集(89例)。记录患者临床特征,采用多因素logistic回归筛选胃癌VI的独立危险因素。利用Pyradiomics软件提取肿瘤静脉期CT影像组学特征,采用最小绝对收缩和选择算法(LASSO)进行特征筛选,得到最优特征子集,建立影像组学标签。使用极端梯度提升(XGBoost)、逻辑回归(logistic)、朴素贝叶斯(GNB)和支持向量机(SVM)4种机器学习算法,对影像组学标签和筛选出的临床独立危险因素构建预测模型。采用受试者操作特征曲线评估模型预测胃癌VI的效能。结果:分化程度(OR=13.651,95%CI 7.265~25.650, P=0.003)、Lauren分型(OR=1.349,95%CI 1.011~1.799, P=0.042)和CA199(OR=1.796,95%CI 1.406~2.186, P=0.044)是预测局部进展期胃癌VI的独立危险因素。基于静脉期增强CT图像提取了864个影像组学特征,经LASSO筛选出18个最优特征构建组学标签。训练集中,XGBoost、logistic、GNB和SVM模型预测胃癌VI的曲线下面积(AUC)分别为0.914(95%CI 0.875~0.953)、0.897(95%CI 0.853~0.940)、0.880(95%CI 0.832~0.928)和0.814(95%CI 0.755~0.873),测试集中分别是0.870(95%CI 0.769~0.971)、0.877(95%CI 0.788~0.964)、0.859(95%CI 0.755~0.961)和0.773(95%CI 0.647~0.898)。logistic模型在测试集中AUC最大且稳定性高。 结论:基于静脉期增强CT影像组学特征的机器学习模型术前预测局部进展期胃癌VI均具有较高的效能,其中logistic模型的诊断效能最佳。
...不再出现此类内容
编辑人员丨1周前
-
基于CT影像组学预测中重度甲状腺相关性眼病放疗有效性的研究
编辑人员丨1周前
目的:基于中重度甲状腺相关性眼病(TAO)患者放疗前的CT影像组学特征,利用机器学习方法构建中重度TAO患者放疗有效性的预测模型。方法:回顾性收集从2015年1月至2023年6月在山西医科大学第一医院接受放疗的93例中重度TAO患者的临床与CT影像资料,提取影像组学特征。利用统计学方法分析临床因素与放疗有效性是否有统计差异性。利用Spearson相关性分析和L1正则化逻辑回归算法进行特征选择。基于所选特征,构建3个预测模型:逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)。最后利用10折交叉验证方法,重复100次,计算曲线下面积(AUC)、敏感性、特异性和准确度来评估模型的性能;使用校准曲线评价预测模型的校准度;最后采用决策曲线分析法对最佳预测模型的临床价值进行评估。结果:临床因素与放疗有效性无统计差异性。分析所有影像组学特征后,选出10个具有代表性的特征。在3个预测模型中,SVM模型在训练集和测试集均取得了最佳性能(分别为AUC 0.92,AUC 0.87)。校准曲线显示SVM模型的预测曲线与理想曲线间没有明显偏差,二者具有较好的一致性。决策曲线显示在大部分概率阈值下,与全部干预和全部不干预相比,SVM模型可获得临床收益。结论:放疗前的CT影像组学特征可用于预测中重度TAO患者放疗的有效性,有望为临床提前干预提供帮助,避免部分患者接受无效的治疗。
...不再出现此类内容
编辑人员丨1周前
