-
基于机器学习的阻塞性冠心病验前概率模型:来自C-Strat研究
编辑人员丨1天前
目的:利用机器学习算法开发中国人群的阻塞性冠心病验前概率模型。方法:纳入冠状动脉斑块早期识别与风险预警的临床注册研究(Chinese regiStry in early deTection and Risk strAtificaTion of coronary plaques,C-Strat)中疑似为冠心病而接受冠状动脉CT血管造影(CCTA)检查的29 455例就诊者,采集人口统计学和临床信息作为预测变量。数据按7∶3的比例随机拆分为训练集和测试集,以CCTA诊断冠状动脉狭窄大于50%作为阳性结局,在训练集中运用极端梯度增强机(eXtreme Gradient Boosting,XGBoost)算法,使用十折交叉验证和贝叶斯优化进行参数调优,得到机器学习模型CARDIACS(pretest probability model from Chinese registry in eARly Detection and rIsk stratificAtion of Coronary plaques Study);使用logistic回归得到模型LOGISTIC。在测试集中验证比较CARDIACS、LOGISTIC和指南推荐的模型UDFM(Updated Diamond-Forrester Model)、DFCASS(Diamond-Forrester and CASS)。结果:29 455例就诊者年龄(57.0±9.7)岁,女性占44.8%,阻塞性冠心病的患病率为19.1%(5 622/29 455)。在CARDIACS模型中,就诊原因、年龄和体重指数是最重要的预测变量。在独立的测试集中,CARDIACS的曲线下面积(AUC)为0.72(95% CI 0.70~0.73),优于LOGISTIC(AUC 0.69,95% CI 0.68~0.71, P=0.015)、UDFM(AUC 0.64,95% CI 0.62~0.65, P<0.001)和DFCASS(AUC 0.66,95% CI 0.64~0.67, P<0.001)。 结论:基于中国人群开发的全新的验前概率模型CARDIACS预测中国人群阻塞性冠心病的能力明显优于传统的模型,有望辅助稳定性胸痛临床决策。
...不再出现此类内容
编辑人员丨1天前
-
优化贝叶斯惩罚似然法的低计数PET重建模拟低剂量PET显像
编辑人员丨1天前
目的:研究贝叶斯惩罚似然法(BPL)图像重建及其优化算法是否能提升低计数全身PET重建图像质量。方法:回顾性分析2023年1月至2023年6月于华中科技大学同济医学院附属协和医院核医学科行 18F-FDG一体化PET/MR全身显像的8例[男5例、女3例,年龄(67.2±6.3)岁]患者的PET/MR图像。采用4种方式对list数据进行重建,分别为25%计数常规重建(组1)、100%计数常规重建(组2)、25%计数BPL重建(组3)及25%计数优化BPL重建(组4),获得32幅全身PET图像。测量4组全身PET图像不同ROI的SUV max、SUV mean、肿瘤代谢体积(MTV),计算病灶糖酵解总量(TLG)和图像质量评价参数[病灶/背景比(L/B)和图像信噪比(SNR)]。利用重复测量方差分析和Friedman检验比较以上参数在4组中的差异;利用Bland-Altman(BA)图对比BPL重建与优化后BPL重建结果分别与100%计数常规重建的定量差异。 结果:组间比较中,除肌肉SUV mean外( F=0.38, P=0.767),其余ROI的SUV max和SUV mean差异均有统计学意义( F值:8.15~36.08, χ2=18.15,均 P<0.01),MTV和L/B的差异均有统计学意义( χ2值:10.65、13.35, P值:0.014、0.004),而TLG( χ2=4.95, P=0.175)和SNR( F=2.64, P=0.076)的差异均无统计学意义。两两比较中,组2与组3的差异最明显(均 P<0.05)。与组2相比,组4中小脑皮质和病灶SUV max以及小脑皮质SUV mean无明显变化(均 P>0.05),MTV和L/B也无明显变化(均 P>0.05)。另外,与组1相比,组2肝脏和肌肉SUV max均下降(均 P<0.05),组4指标则无明显变化(均 P>0.05)。BA图显示,组4与组2的SUV、MTV、TLG定量值的差异明显小于组3与组2的差异。 结论:BPL重建能提升低计数PET中降低的病灶检出率,但会引起病灶定量值的明显改变。优化后的BPL重建能解决这一问题。
...不再出现此类内容
编辑人员丨1天前
-
机器学习优化能谱CT预测胃腺癌的浸润性
编辑人员丨3周前
目的 探讨机器学习(ML)算法结合能谱CT定量参数和临床模型在预测胃腺癌(GAC)患者淋巴血管浸润(LVI)和神经周围浸润(PNI)的潜在价值.方法 收集2017年12月-2022年5月经病理证实的GAC患者114例.研究参数涉及血清肿瘤标志物、CT-TN分期、CT评估壁外血管浸润(CT-EMVI)以及能谱CT定量参数.通过WEKA软件的Best-First算法进行特征筛选,并运用贝叶斯网络(BN)及支持向量机(SVM)算法建立模型.结果 相较于LVI/PNI阴性组,LVI/PNI阳性组中CT-T3~4期、CT-N阳性、CT-EMVI阳性、血清肿瘤标志物[糖类抗原(CA)72-4和CA19-9]更为常见,能谱CT参数也更高,差别均有统计学意义(P<0.05).经特征选择,关键变量包括CT-T分期、CT-EMVI、VP-NIC和EP-70 keV CT值.基于这些变量,分别使用BN和SVM构建临床参数模型、能谱CT参数模型和混合模型,共6个模型.6个模型均展现了高预测性能,无过拟合现象.BN的混合模型预测性能最佳,AUC值为0.890~0.933,Delong检验显示其在统计学上具有显著优势(P<0.05);而SVM的混合模型与另外2种模型间的差别无统计学意义(P>0.05).结论 结合临床和能谱CT参数的ML模型能够高效能评估GAC患者的LVI和PNI状态,其中BN混合模型的准确性最高.
...不再出现此类内容
编辑人员丨3周前
-
滇西北森林郁闭度估测模型
编辑人员丨2024/6/1
探究全球生态系统动力学调查(GEDI)多波束激光雷达数据估测区域森林郁闭度(FCC)的潜力,对于评估森林生态系统状态和林分环境具有重要作用.选取滇西北典型生态脆弱区香格里拉为研究区,以GEDI波形数据为信息源,提取46245个有林地光斑参数,使用经验贝叶斯克里金法(EBK)获取光斑参数在研究区未知空间的连续分布,结合54块实测样地数据,采用支持向量机的递归特征消除法(SVM-RFE)、随机森林(RF)和Pearson分析分别优选特征变量,基于贝叶斯优化(BO)随机森林回归模型(BO-RFR)、贝叶斯优化梯度回归模型(BO-GBRT)和偏最小二乘法(PLSR)研建森林郁闭度最佳估测模型.结果表明:(1)EBK 法预测精度高,估测结果可靠,R2:0.20-0.92,RMSE:0.004-2812.912,MAE:0.003-1996.258,MRE:0.007-4.423;(2)基于不同特征优选方法筛选的特征变量和数量略有差异,SVM-RFE法优选出6个参数(cover、pai、sensitivity、rv_al、rv_a4、rg_a4)的平均交叉验证精度达0.84,RF法以贡献度5%为阈值筛选出5个参数(cover、pai、pgap_theta_error、modis_treecover、modis_nonvegetated),Pearson 法以相关性大于 0.3 且在 0.01 水平显著优选出 5 个参数(cover、pai、rv_a5、rg_a5、pgap_theta_error);(3)不同特征变量优选方法筛选的建模参数研建估测模型精度差异性较大,以SVM-RFE和RF方法优选参数构建估测模型的精度更佳,SVM-RFE方法优选参数研建估测模型精度变化相对稳定,以RF方法中的BO-GBRT模型为最佳FCC估测模型(R2=0.85、RMSE=0.069,P=86.5%);(4)采用BO-GBRT模型估测研究区森林郁闭度和空间制图,与GEDI pai参数预测的FCC具有较高空间相关性达0.53,FCC均值分别为0.58、0.61,主要分布在0.4-0.7,分别占比65.45%、51.79%.研究区森林郁闭度主要处于中度郁闭,北部区域主要为高度郁闭区,与研究区植被覆盖度的空间分布具有一致性,说明使用GEDI数据估测森林郁闭度的方法具有可行性、结果具有可靠性.研究为使用GEDI数据高效、及时、低成本估测大空间尺度的森林水平结构参数的相关研究奠定了基础.
...不再出现此类内容
编辑人员丨2024/6/1
-
结合关联规则的隐结构分析构建证候状态辨识模型
编辑人员丨2024/1/20
目的 以原发性骨质疏松症(POP)肾阳虚证为例,构建中医证候状态定量化辨识模型,为证候诊断标准化研究提供方法学参考.方法 采用描述统计分析筛选出POP高频临床特征,通过关联规则算法得到POP强关联特征.在此基础上结合隐结构分析法建立隐结构(隐树)模型,对与POP肾阳虚证相关隐变量和显变量(特征)进行综合聚类,通过互信息与累积信息覆盖度等指标对聚类结果进行诠释,探究其主症、次症,根据各隐类中特征出现概率推断POP肾阳虚证状态类别.依据状态类别计算临床特征分值和辨识阈值,结合综合判断规则初步构建POP肾阳虚证状态辨识模型,最后以中医专业人员判断结果为金标准进一步评价模型的辅助辨识效果.结果 得到POP强关联的32个特征,进一步构建的隐树模型贝叶斯信息准则(BIC)评分为-15291.93.根据互信息和累积信息覆盖度推出POP肾阳虚证的主症为骨软、神疲、舌淡、小便清、夜尿频多、肢冷、脉沉细、苔白,次症为乏力、性欲减退、大便溏、尿频、腰膝酸软、畏寒.由POP肾阳虚证不同隐类中各临床特征出现的概率,推出POP肾阳虚证状态为S0类(无/轻度肾阳虚证)/S1类(中度肾阳虚证)/S2类(重度肾阳虚证).优化状态辨识初步规则,细化状态S1类,结果显示970例POP患者中,520例患者为无/轻度肾阳虚证、224例为中度偏轻度肾阳虚证、81例为中度偏重度肾阳虚证、145例为重度肾阳虚证.模型评估指标正确率为0.8835、灵敏度为0.7181、特异度为0.9437.结论 结合关联规则的隐结构分析可构建POP肾阳虚证状态辨识模型,且该模型具有良好的定量化辨识效果,可辅助临床医生提高中医诊断效率和准确性.
...不再出现此类内容
编辑人员丨2024/1/20
-
改进深度极限学习机在肺癌中医证型分类中的应用研究
编辑人员丨2024/1/13
目的 利用特征选择及Likert分级法量化肺癌病历数据,构建基于麻雀搜索算法优化的深度极限学习机模型,对肺癌中医病历数据进行证型分类与预测,为中医证型分类研究提供科学有效手段.方法 从江西中医药大学附属医院收集了2015年1月-2021年12月诊断为肺癌的497例病历,筛选412例病历作为研究对象.利用特征选择和特征重要性排序等方法归纳出不同证型的证型因子,并使用Likert分级法量化证型因子.构建基于麻雀搜索算法优化的深度极限学习机,对模型进行训练、测试.最后把本研究所建模型与其他机器学习模型按照3种评价标准进行比较.结果 本研究建立的SSA-DELM模型的平均分类准确率为88.44%,而采用支持向量机和贝叶斯网络的平均准确率分别为83.39%和84.53%.SSA-DELM模型在5种证型上的召回率及F1值大部分在80%以上,也优于其他传统的机器学习模型.结论 研究结果表明,利用特征选择结合Likert分级法量化后的肺癌病历数据,相比于0-1化处理的数据更能显现出数据的特征,提高了分类模型的准确率,SSA-DELM新模型相比其他传统的机器学习分类模型,有更好的表征学习能力及学习速度.该模型不仅为临床治疗肺癌的研究提供了科学的技术手段,也为中医辨证论治的信息化、智能化发展提供有益的借鉴.
...不再出现此类内容
编辑人员丨2024/1/13
-
基于机器学习预测患者地高辛血药浓度超出治疗窗上限的风险
编辑人员丨2023/8/19
目的:建立人血清中地高辛血药浓度超出治疗窗上限的风险预测模型,为地高辛的安全使用提供参考.方法:回顾收集2019年1月至2021年12月期间天津医科大学总医院地高辛血药浓度监测数据.371名患者数据按7:3随机分为训练集和测试集,训练集用于构建预测模型,测试集用于评价模型效果.采用极端梯度提升(XGBoost)特征重要性分析法选择最佳特征,Shapley加法解释(SHAP)算法分析特征与结果变量的相关性和趋势.使用逻辑回归(LR)、朴素贝叶斯(NB)、随机森林(RF)、XGBoost、梯度提升树(GBDT)5种机器学习算法用于模型构建.结果:默认参数下LR、NB、RF、XGBoost和GBDT模型的AUC分别为0.519 9,0.627 8,0.695 1,0.562 5和0.655 8.优化后的RF模型AUC为0.711 2.结论:机器学习模型预测人血清中地高辛血药浓度超出治疗窗上限风险的表现良好,并创新地利用SHAP算法对其进行解释.RF模型预测性能最佳,为识别地高辛中毒高风险患者提供参考.
...不再出现此类内容
编辑人员丨2023/8/19
-
基于多源遥感数据协同的滇西北森林郁闭度估测
编辑人员丨2023/8/19
森林郁闭度(FCC)是评价森林资源和生物多样性的重要参数,利用多源遥感协同手段以较小成本高精度实现区域FCC反演是当前研究热点.本研究以星载激光雷达ICESat-2/ATLAS为主要信息源,结合54块实测样地数据,采用贝叶斯优化(BO)算法改进后的随机森林(RF)、K-最近邻值法(KNN)、梯度回归(GBRT)模型获取光斑尺度ATLAS光斑内FCC,协同多源遥感影像Sentinel-1/2及地形因子基于BO算法优化后的全连接深度神经网络模型(DNN)进行区域尺度的滇西北香格里拉市FCC遥感估测.结果表明:在提取的50个ATLAS激光雷达光斑参数指标中,经RF特征变量优选后,6个特征参数(乔木冠层百分比、冠层顶光子相对高度的标准差、冠层高度最小值、区段内98%冠层高度值与冠层高度中位数的差值、冠层顶部光子数、表观反射率)贡献率较大,可作为光斑尺度遥感估测模型变量.在BO-RF、BO-KNN、BO-GBRT模型中,以BO-GBRT模型估测的FCC结果最优,留一交叉验证的决定系数(R2)为0.65、均方根误差(RMSE)为0.10、绝对残差均值(RS)为0.079,预测精度(P)为0.792,可作为研究区有林地74808个ATLAS光斑的FCC估测模型.以有林地ATLAS光斑尺度FCC值作为区域尺度BO-DNN模型的大样本数据,联合多源遥感因子进行研究区FCC估测,十折交叉验证的BO-DNN模型验证精度为R2=0.47、RMSE=0.22、P=0.558.使用BO-DNN模型估测及普通克里格(OK)插值的研究区FCC均值分别为0.46、0.52,主要分布在0.3~0.6,分别占比77.8%、81.4%.直接通过OK插值方法获取FCC效率较高(R2=0.26),但预测精度明显低于BO-DNN模型(R2=0.49).FCC高值区域在研究区由西北向东南贯穿分布,北部地区和东南部分别为FCC高值、低值主要分布区.基于ICESat-2/ATLAS高密集光斑进行山地FCC估测具有一定优势,以光斑尺度的小样本数据估测结果可作为区域尺度深度学习模型的大样本数据,能为光斑尺度上推至区域尺度低成本、高精度估测FCC提供一种参考.
...不再出现此类内容
编辑人员丨2023/8/19
-
基于块稀疏贝叶斯学习的多目标动态荧光分子重建
编辑人员丨2023/8/6
针对基于范数优化的多目标动态荧光分子重建稀疏性不足、定位精度低的问题,本研究提出了基于块稀疏贝叶斯学习的重建方法.该方法利用多观测动态荧光信号共享相同稀疏结构的特点,充分挖掘了信号的时空相关性信息和分块稀疏特性,将多观测模型联合稀疏重构问题转化为块稀疏贝叶斯学习问题,通过稀疏贝叶斯框架下的相关向量机稀疏学习模型获取稀疏解.实验结果表明,本研究算法相较于传统压缩感知算法具有更高的稀疏度和定位精度.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于GA-BP神经网络模型鉴别2型糖尿病性周围神经病变的分类模型研究
编辑人员丨2023/8/6
目的 以临床检查指标建立2型糖尿病性周围神经病变(DPN)的遗传算法优化反向传播(GA-BP)神经网络模型并评价其诊断性能.方法 收集重庆医科大学附属医院2016年1-12月收治的DPN患者2240例和非DPN患者2632例,采用SPSS 21.0对两组患者的41项临床检验指标进行单因素分析,选取有统计学意义的变量37项,采用R软件构建决策树、贝叶斯模型,采用MATLAB 2014a软件构建BP神经网络和GA-BP神经网络模型,通过各项评估参数比较这4个模型的优劣.结果 决策树模型的测试样本准确率为93.4%,贝叶斯模型为70.0%,BP神经网络模型为98.9%,GA-BP神经网络模型为99.5%;工作特征曲线下面积分别为0.93、0.72、0.99、0.99;约登指数分别为0.87、0.59、0.98、0.98.结论 GA-BP神经网络模型对DPN有很好的计算机辅助诊断作用,但仍须进一步进行临床试验.
...不再出现此类内容
编辑人员丨2023/8/6
