-
辽东山区日本落叶松一级枝条数量及密度预估模型
编辑人员丨6天前
枝条数量作为重要的枝条特征因子,对树冠结构特征、树木生长及木材质量具有重要的影响.本研究以辽宁省清原县大孤家林场日本落叶松人工林为研究对象,基于负二项分布模型构建包含水枝的日本落叶松一级枝条数量混合效应预估模型,又基于负指数模型构建包含水枝的日本落叶松一级枝条密度混合效应预估模型.结果表明:对于一级枝条数量模型来说,考虑样木水平的混合效应模型可以有效地降低异方差性和自相关性,拟合效果优于传统模型.模拟结果表明,树木的冠长率越大,枝条的数量越多.将最优一级枝条数量基础模型的截距作为随机效应参数的混合效应模型被确定为最优模型,其Ra2=0.552,均方根误差为7.242.对于一级枝条密度来说,考虑样木水平的混合模型同样降低了模型的异方差性和自相关性,枝条的密度随着冠长率的增大而增大.将最优的一级枝条密度基础模型的截距与着枝深度作为随机效应参数的混合效应模型被确定为最优模型,其Rae=0.792,均方根误差为4.447.本研究构建的日本落叶松枝条数量及密度模型为制定科学的森林经营方案以提高木材质量奠定了重要基础.
...不再出现此类内容
编辑人员丨6天前
-
基于随机森林算法的云南女性产后抑郁风险预测模型构建
编辑人员丨6天前
目的 建立针对云南省多民族人群的产后抑郁风险预测模型并识别预测因子.方法 于云南省某多民族聚居县对处于产后42天~1年的女性采用爱丁堡产后抑郁量表(Edinburgh Postnatal Depression Scale,EPDS)进行产后抑郁筛查.以是否存在产后抑郁症状(EPDS ≥9分)为结局指标,基于随机森林算法纳入人口经济学、社会心理学、产科学、新生儿、配偶及家庭、其他特征因素共52个影响因素,在训练集上构建云南多民族人群产后抑郁风险预测模型,在测试集上采用准确率、灵敏度、特异度、阳性预测值、阴性预测值及受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC曲线)下面积(Area Under Curve,AUC)评价该模型性能.结果 本研究纳入分析的女性为459名,产后抑郁检出率为11.55%,其中汉族7.56%、壮族13.94%、其他少数民族13.92%.重要性评分位于前14的变量为:焦虑、既往不良情绪史、夫妻感情、家人支持水平、照顾新生儿身心疲惫、妊娠风险分级、母婴同室、喂养模式、文化程度、配偶文化程度、夜间照顾新生儿次数、民族、孕次、年龄.该模型准确率为92.74%,特异度为95.50%,灵敏度为69.23%,阳性预测值为64.29%,阴性预测值为96.36%,AUC值为0.925.同时,分别以汉族、壮族和其他少数民族人群作为验证集进行内部验证,显示模型稳定性好.结论 基于随机森林算法建立的云南多民族人群产后抑郁风险预测模型性能良好,可用于预测少数民族地区女性产后抑郁风险因子,从而采取针对性干预措施.
...不再出现此类内容
编辑人员丨6天前
-
基于机器学习的流行性感冒中医辨证模型研究
编辑人员丨6天前
目的 通过机器学习方法对流行性感冒临床证候学资料进行训练,获得流感辨证模型.方法 收集2019年12月-2022年3月就诊于中日友好医院发热门诊的流行性感冒患者病历资料,使用数据采集系统进行数据处理,将不同数据处理过程产生的数据分别存储,以逻辑回归、决策树、朴素贝叶斯、支持向量机、多层感知机、lightGBM和随机森林为备选模型,通过Optuna进行超参数优化选择,并在各数据集中分别训练模型,以macro-F1评分为核心指标,对模型的预测性能进行评价.结果 整理得到训练样本1 011个,其中风热犯卫证453个、风寒束表证152个、表寒里热证406个;得到用于训练的数据集8个,包含数据80份.经训练,逻辑回归、决策树、朴素贝叶斯、支持向量机、多层感知机、lightGBM、随机森林模型的macro-F1评分分别为0.783 0、0.774 2、0.731 5、0.782 4、0.716 7、0.793 8、0.815 3.加权样本能显著提高平均模型性能,而主成分分析降维会降低平均模型性能.单一模型中,逻辑回归模型预测性能最佳;集成方法模型中,随机森林模型预测性能最佳.结论 在样本量较小的情况下,流行性感冒中医辨证模型使用逻辑回归、决策树、支持向量机和lightGBM较为适宜,随着样本量增加,逻辑回归、支持向量机、lightGBM和随机森林可能更为合适.不同数据处理方式会影响模型性能,对证型典型程度信息的采集有利于提高模型性能.
...不再出现此类内容
编辑人员丨6天前
-
肝细胞癌预后相关的炎症反应关键基因的筛选及其预后价值
编辑人员丨6天前
目的:筛选与肝细胞癌(hepatocellular carcinoma,HCC)预后密切相关的炎症反应关键基因,构建预后风险评分模型,并评估该模型在HCC中的预后价值.方法:从TCGA数据库获取HCC患者肝肿瘤组织及正常肝组织的mRNA表达数据作为训练集,从GEO数据库中获取HCC患者的mRNA表达数据作为验证集.筛选出与HCC预后相关的炎症反应相关基因,运用LASSO回归和随机生存森林(RSF)方法筛选与HCC预后相关的炎症反应关键基因.基于这些关键基因构建预后风险评分模型并验证,应用Cox比例风险回归评估该模型对患者预后的影响.构建列线图并进行一致性分析.结果:共筛选出15个与HCC预后相关的炎症反应基因,经LASSO回归和RSF分析,确定11个炎症反应关键基因,即IL18RAP、MEP1A、RIPK2、CYBB、SLC7A1、ADM、IL7R、P2RX4、ACVR2A、SERPINE1、SLC7A2.构建的预后风险评分模型在训练集和验证集上预测1、3、5年生存率,AUC值均超过0.60;Kaplan-Meier分析显示高风险组总生存期(OS)显著低于低风险组(P<0.01);PCA和t-SNE分析显示该模型能有效区分高、低风险患者.Cox回归分析提示预后风险评分是独立的预后因素,且与OS显著相关(P<0.01).列线图模型C-index为0.672,具有较高的预测精度,1年和3年校准曲线与标准曲线吻合度好,5年吻合度稍弱.结论:本研究成功构建并验证了一个基于炎症反应相关基因的风险评分模型,筛 选出的11个炎症反应关键基因(IL18RAP、MEP1A、RIPK2、CYBB、SLC7A1、ADM、IL7R、P2RX4、ACVR2A、SERPINE1、SLC7A2)与HCC进展密切相关,且在模型中显示出较强的预后预测能力.
...不再出现此类内容
编辑人员丨6天前
-
输尿管软镜钬激光碎石术治疗输尿管上段复杂性结石后双J管附壁结石形成的原因分析
编辑人员丨6天前
目的:分析输尿管软镜钬激光碎石术治疗输尿管上段复杂性结石后双J管附壁结石形成的原因.方法:选择2015年1月至2023年8月于首都医科大学附属北京潞河医院收治的105例输尿管上段复杂性结石患者,其中男58例,女47例,根据结石评估结果分为结石组(n=40)与非结石组(n=65).通过随机森林算法分析患者双J管附壁结石形成的影响因素.通过单因素和多因素分析双J管附壁结石形成的独立影响因素,并构建分类树模型.结果:结石组和非结石组CT值、术中出血量、双J管留置时间、白细胞计数(WBC)、C反应蛋白(CRP)、尿酸(UA)、血钙、尿pH值、尿蛋白、尿红细胞、尿白细胞、尿结晶比较差异均有统计学意义(t/χ2 值分别为4.361、2.502、6.815、12.176、24.398、15.595、6.517、2.069、6.881、4.524、3.883、4.699,均P<0.05).双J管留置时间、尿蛋白阳性、尿结晶阳性、UA为双J管附壁结石形成的独立危险因素(P<0.05).分类树模型显示,双J管留置时间是双J管附壁结石形成的重要预测因素,收益图和索引图显示模型预测良好.结论:双J管留置时间、尿蛋白阳性、尿结晶阳性、UA为双J管附壁结石形成的独立危险因素.临床应重点关注相关因素,及时制定预防策略,以期降低双J管附壁结石的发生风险.
...不再出现此类内容
编辑人员丨6天前
-
基于多序列MRI影像组学预测脑胶质瘤Ki-67表达水平
编辑人员丨6天前
目的:探讨基于多序列MR图像所构建的影像组学模型在预测脑胶质瘤Ki-67表达水平中的价值.方法:回顾性分析2017年1月—2023年5月经病理检查证实的114例胶质瘤患者的MRI图像和临床特征.根据肿瘤标本检测获得的Ki-67表达水平,将患者分为高表达组(n=54)和低表达组(n=60).将所有患者按7︰3的比例随机分为训练集79例(高表达组37例,低表达组42例)和测试集35例(高表达组17例,低表达组18例).使用ITK-SNAP软件,在CE-T1WI图像上沿胶质瘤边缘逐层勾画ROI,获取肿瘤全域容积ROI(VOI).然后使用"Pyradiomics"软件包,分别自T1WI、CE-T1WI、T2WI和T2-FLAIR图像上提取肿瘤VOI的影像组学特征.采用t检验和递归特征消除法进行特征筛选,利用随机森林方法建立预测Ki-67表达水平的临床-影像模型、影像组学模型及联合模型.采用ROC曲线下面积(AUC)和DeLong检验来评估和比较上述模型的效能.使用校准曲线和Hosmer-Lemeshow检验分析模型的拟合优度,并通过决策曲线分析(DCA)评估各个模型的临床应用价值.结果:临床-影像模型、影像组学模型和联合模型在训练集和测试集中的AUC分别为0.791(95%CI:0.685~0.874)和0.716(95%CI:0.538~0.855)、0.907(95%CI:0.820~0.961)和0.866(95%CI:0.708~0.957)、0.964(95%CI:0.896~0.993)和0.908(95%CI:0.760~0.979),以联合模型的的AUC最大.Delong检验结果显示,联合模型的预测效能优于临床影像模型(训练集P<0.001;测试集P=0.018),但与影像组学模型之间的差异无统计学意义(P>0.05).Hosmer-Lemeshow检验结果显示联合模型校准曲线的拟合度良好(P>0.05).DCA结果显示,当风险阈值为0.11~0.89时,联合模型的临床净效益高于影像组学模型.结论:基于临床、影像特征及多序列MRI影像组学特征构建的联合模型对术前预测胶质瘤Ki-67表达水平具有一定价值.
...不再出现此类内容
编辑人员丨6天前
-
医务人员血源性职业暴露危险因素分析:基于随机森林算法和logistic回归模型的效应对比
编辑人员丨6天前
目的 分析医务人员血源性职业暴露风险因素,为及时提出针对性干预措施,预防血源性职业暴露提供依据.方法 选取2016年1月—2023年6月呼伦贝尔市某三级综合医院上报的发生血源性职业暴露的103名医务人员为暴露组,选取同班次未发生职业暴露的625名医务人员为对照组,收集研究对象的相关资料,采用随机森林算法和多因素logistic回归分析分别构建影响医务人员发生血源性职业暴露的预测模型.结果 103例血源性职业暴露人员的主要暴露部位为手,有89例(占86.41%);主要暴露方式为锐器伤,有83例(占80.58%);主要暴露源为乙型肝炎病毒,有65例(占63.11%).暴露后立即上报的有65例(占63.11%),12 h以内上报的24例(占23.30%).logistic回归分析结果显示:相比年龄≥ 30岁,年龄<30岁的医务人员发生血源性职业暴露的可能性增加至4.142倍(P<0.05);相比工作年限≥ 5年,工作年限<5年的医务人员发生血源性职业暴露的可能性增加至1.696倍(P<0.05);相比中级及以上职称,初级职称医务人员发生血源性职业暴露的可能性增加至5.989倍(P<0.05);相比每年多次参加培训,每年只参加1次培训的医务人员发生血源性职业暴露的可能性增加至1.864倍(P<0.05);科室类别为急诊、重症及手术室的医务人员较其他科室医务人员发生血源性职业暴露的可能性增加至2.205倍(P<0.05).随机森林算法结果显示,重要性评分排名前6的影响因素分别是职称、年龄、工作年限、年职业防护培训次数、职业类型、文化程度.随机森林预测模型的准确率、精确率、召回率及F1分数(精确率和召回率的调和平均数)均要高于logistic预测模型,且随机森林预测模型的ROC曲线下面积(AUC)为0.829(P<0.001),也高于logistic回归模型的0.818(P<0.001).结论 随机森林模型对血源性职业暴露有更好的预测效能,但logistic回归模型有更直观的分析结果,两者联合使用能进一步提高预测的准确性.应加强对年龄小、工作年限短、职称低等重点人员的培训,制定标准化的措施来预防医务人员的血源性暴露.
...不再出现此类内容
编辑人员丨6天前
-
基于深度学习超声组学列线图评估浸润性乳腺癌侵袭转移的价值
编辑人员丨6天前
目的 探讨深度学习超声组学列线图评估浸润性乳腺癌侵袭转移生物学特性指标的价值.资料与方法 回顾性收集2021年1月—2022年12月茂名市人民医院180例经病理证实浸润性乳腺癌患者的超声影像资料,且病理报告了淋巴结转移(LNM)或淋巴血管间隙浸润(LVSI)或神经侵犯(PNI)状态,依据LNM/LVSI/PNI状态,3个指标均以8∶2划分为训练队列和验证队列.基于Pyradiomics影像组学和ResNet50深度学习提取器分别提取1 316个影像组学特征和2 048个深度学习特征.采用随机森林机器学习算法开发评估模型,并计算模型评分.基于影像组学和深度学习模型评分开发深度学习超声组学列线图.使用受试者工作特征曲线评估模型的性能,Delong检验分析不同模型的性能差异.结果 在LNM、LVSI、PNI状态评估中,所有队列列线图曲线下面积均表现中度以上评估性能(≥0.73),准确度均>0.70,LNM评估中,训练队列的曲线下面积为0.97,准确度为0.93,敏感度为0.88,特异度为0.96.Delong检验显示列线图评估性能在训练队列中优于影像组学模型(LNM,Z=2.04,P=0.04;LVSI,Z=2.80,P=0.01;PNI,Z=3.52,P<0.01),优于或与深度学习模型相似(LNM,Z=4.52,P<0.01;LVSI,Z=1.86,P=0.06;PNI,Z=0.31,P=0.76).结论 深度学习超声组学列线图可有效评估浸润性乳腺癌侵袭转移生物学特性指标.列线图整合影像组学与深度学习特征信息提高了评估性能.
...不再出现此类内容
编辑人员丨6天前
-
基于磁共振影像组学和语义特征对高级别胶质瘤和转移瘤的鉴别研究
编辑人员丨6天前
目的本研究旨在结合传统MRI序列及增强检查,提取多模态高通量影像组学特征并联合语义特征,使用不同的机器学习分类器构建不同的模型并绘制列线图来鉴别高级别胶质瘤(high-grade glioma,HGG)和单发性脑转移瘤(solitary brain metastasis,SBM).材料与方法本研究对101名患者的多参数MR图像进行了回顾性分析,由两位资深医师标定肿瘤感兴趣区,然后对每个序列分别提取影像组学特征后进行组合,共提取428组影像组学特征.为消除人为标定差异,进行组内相关系数一致性检验,并运用最大相关最小冗余算法选取最具相关性的特征,然后进一步通过最小绝对收缩和选择算子算法筛除冗余特征.本研究采用支持向量机、逻辑回归、随机森林及K近邻四种算法建立分类模型.结合放射科医生评估的七项语义特征,通过卡方检验和多因素分析去除差异无统计学意义的语义特征.然后结合组学特征建立综合模型并绘制列线图.最终,评价各模型的诊断能力,以确定最优分类器.结果HGG及SBM患者建立的影像组学模型中LR的受试者工作特征曲线下面积(area under the curve,AUC)值最高,训练集与测试集分别为0.90和0.90.语义特征建立的模型中随机森林模型性能最好,训练集和测试集AUC分别为0.82和0.87.语义特征联合影像组学评分后采用逻辑回归建立的模型性能最好,训练集和测试集AUC分别为0.91和0.92.结论本研究使用影像组学机器学习分类器并联合其他图像语义特征绘制列线图对HGG及SBM进行鉴别,这是一种非侵入性方法,具有较好的准确性,为临床决策和实践提供了较大的帮助.
...不再出现此类内容
编辑人员丨6天前
-
列线图与机器学习算法预测中老年龋齿的比较研究
编辑人员丨6天前
目的 对比列线图与不同机器学习算法构建中老年人龋齿预测模型的效能.方法 采用多阶段分层随机抽样法,选取南宁市、贵港市、崇左市510名中老年人为研究对象,进行问卷调查及口腔检查.采用单因素分析和Lasso回归筛选相关变量,使用多因素logistic回归分析确定最终独立影响因素.基于显著特征,建立列线图预测模型,并运用线性判别分析(LDA)、偏最小二乘算法(PLS)、距离多普勒算法(RDA)、广义线性模型(GLM)、随机森林(RF)、支持向量机(SVM)核函数(SVM-Radial)及SVM线性核函数(SVM-Linear)7种机器学习算法构建7种龋齿风险预测模型.采用受试者工作特征(ROC)曲线下面积(AUC)中位数评价各模型预测性能,以及不同变量筛选方法所构建模型的预测性能.结果 中老年人龋齿检出率为71.18%.经过特征筛选后最终保留5个预测因子,分别是年龄(OR=0.945,95%CI:0.917~0.973)、刷牙频率(OR=0.688,95%CI:0.475~0.997)、过去1年是否洗牙(OR=0.303,95%CI:0.103~0.890)、牙存留数(OR=1.062,95%CI:1.038~1.087)和口腔健康评估量表(OHAT)得分(OR=1.363,95%CI:1.234~1.505).各模型对比结果显示,RF算法所构建的预测模型表现最佳,AUC中位数为0.747,其次为列线图,AUC中位数为0.733.单因素+Lasso+多因素logistic(简称Lasso+logistic)筛选自变量构建预测模型的AUC中位数均高于RF算法筛选自变量构建的预测模型.结论 基于Lasso+logistic筛选变量,RF较列线图及其他机器学习算法在中老年龋齿预测中提供了更可靠的预测性能.
...不再出现此类内容
编辑人员丨6天前
