目的 利用随机森林算法与Logistic回归模型,建立脊柱结核的预测模型.方法 选取250例脊柱结核患者和250例非脊柱结核患者,收集17项临床指标.利用随机森林算法对纳入指标的重要程度排序,根据滑动窗口序贯向前选择法找出合适的变量个数;将变量纳入二元Logistic回归模型,分析与脊柱结核发病相关的指标;采用混淆矩阵评价所建立模型的预测效能.结果 重要性位列前10的指标为低白蛋白、脊柱后凸、血沉、椎旁或腰大肌脓肿、贫血、骨质破坏、C反应蛋白、盗汗、活动受限、体重下降.Logistic回归分析显示,白蛋白降低、脊柱后凸、血沉升高、椎旁或腰大肌脓肿、贫血、骨质破坏、C反应蛋白升高、体重下降均与脊柱结核有关(均P<0.05).所建立的模型对脊柱结核患者预测的正确率为94.0%,模型预测的总准确度达93.4%.结论 基于随机森林算法的Logistic回归模型预测脊柱结核具有较高的准确度.如患者存在血沉、C反应蛋白、白蛋白异常,以及脊柱后凸、脊柱破坏、椎旁或腰大肌脓肿,应高度警惕脊柱结核的可能.
作者:莫海娟;赖银娟;黄志碧;梁冰倩;陆华媛
来源:广西医学 2020 年 42卷 14期