-
基于属性知识嵌入的LDA模型在中药推荐中的应用
编辑人员丨5天前
目的:数据驱动的药材推荐方法帮助中医医师在真实的临床实践中更精确、更智能地制定科学的治疗处方,也可以为中医诊断和治疗的发展提供科学依据.方法:通过文本挖掘方法分析了 24 127条中医处方记录,在中医理论的基础上模拟生成处方的过程,并将症状和药材的丰富信息及其相互关系等领域知识纳入考虑.提出了一种基于属性知识网络嵌入的LDA(Latent Dirichlet Allocation)主题模型的中药推荐方法,中药的属性知识网络包含药材丰富的属性信息以及蕴含的药理作用,对主题模型进行了增强.结果:研究结果表明,在最佳嵌入系数下,模型的预测困惑度、准确性以及平均AUC相较于基线主题模型均有更好的表现.结论:所提出的方法有利于提升模型稳定性、药材推荐准确度,更好地承担诊疗模式挖掘等任务.
...不再出现此类内容
编辑人员丨5天前
-
绵羊腰椎CT纹理参数与骨质疏松关系的体外实验研究
编辑人员丨5天前
目的 建立绵羊体外腰椎骨质疏松模型,寻找具有鉴别意义的纹理参数并与双能X射线吸收法(DXA)测量的骨密度、骨灰分密度及骨灰度建立回归公式联系.方法 采用乙二胺四乙酸二钠(EDTA-Na2)溶液(0.4916 mmol/L)浸泡法,对120例绵羊腰椎L1~L3三联椎体进行浸泡脱钙,去除肌肉及附件骨,随机分成4组(A、B、C、D组),每组30例,室温下浸入10%甲醛溶液中24 h防腐.A、B、C、D组分别浸入制备好的EDTA-Na2溶液中脱钙0、4、9、15 d制备体外骨质疏松模型.对上述腰椎进行薄层CT扫描和DXA骨密度测量,并测量每个椎体的体积和椎体干重,之后于马弗炉中1100℃恒温煅烧6 h,测量骨灰分重量,计算骨灰分密度和骨灰度.采用MaZda纹理分析软件对上述CT图像椎体骨松质进行纹理分析,分别采用Fisher系数、分类错误概率联合平均相关系数、交互信息及三者的联合方法(FPM)进行纹理特征筛选,采用原始数据分析(RDA)、主成分分析(PCA)、线性分类分析(LDA)和非线性分类分析(NDA)对4组骨密度进行分类分析.对上述方法筛选的纹理参数分别与骨密度、骨灰度和骨灰分密度行相关分析,寻找与其相关性最强的纹理参数.以相关性最强的纹理参数为自变量,以骨密度、骨灰度和骨灰分密度为因变量进行一元和多元线性回归分析,获得回归方程.结果 随着脱钙时间的延长,CT图像显示骨皮质逐渐变薄,骨松质密度减低,骨小梁变稀疏.FPM结合NDA的鉴别能力最强,错判率仅为2.5%.其中灰度共生矩阵中的对比度(Contrast)与骨灰度呈强负相关(r=-0.938).灰度共生矩阵中的熵(Entropy)与骨灰分密度(r=-0.927)和骨密度(r=-0.896)呈强负相关.一元线性回归方程分别表示为:骨灰度=0.692-0.002×Contrast,骨灰分密度=0.802-0.121×Entropy,骨密度=1.301-0.200×Entropy.结论 绵羊腰椎CT薄层图像的部分纹理参数与骨密度相关参数间存在明显相关性,可以建立回归公式联系.
...不再出现此类内容
编辑人员丨5天前
-
列线图与机器学习算法预测中老年龋齿的比较研究
编辑人员丨5天前
目的 对比列线图与不同机器学习算法构建中老年人龋齿预测模型的效能.方法 采用多阶段分层随机抽样法,选取南宁市、贵港市、崇左市510名中老年人为研究对象,进行问卷调查及口腔检查.采用单因素分析和Lasso回归筛选相关变量,使用多因素logistic回归分析确定最终独立影响因素.基于显著特征,建立列线图预测模型,并运用线性判别分析(LDA)、偏最小二乘算法(PLS)、距离多普勒算法(RDA)、广义线性模型(GLM)、随机森林(RF)、支持向量机(SVM)核函数(SVM-Radial)及SVM线性核函数(SVM-Linear)7种机器学习算法构建7种龋齿风险预测模型.采用受试者工作特征(ROC)曲线下面积(AUC)中位数评价各模型预测性能,以及不同变量筛选方法所构建模型的预测性能.结果 中老年人龋齿检出率为71.18%.经过特征筛选后最终保留5个预测因子,分别是年龄(OR=0.945,95%CI:0.917~0.973)、刷牙频率(OR=0.688,95%CI:0.475~0.997)、过去1年是否洗牙(OR=0.303,95%CI:0.103~0.890)、牙存留数(OR=1.062,95%CI:1.038~1.087)和口腔健康评估量表(OHAT)得分(OR=1.363,95%CI:1.234~1.505).各模型对比结果显示,RF算法所构建的预测模型表现最佳,AUC中位数为0.747,其次为列线图,AUC中位数为0.733.单因素+Lasso+多因素logistic(简称Lasso+logistic)筛选自变量构建预测模型的AUC中位数均高于RF算法筛选自变量构建的预测模型.结论 基于Lasso+logistic筛选变量,RF较列线图及其他机器学习算法在中老年龋齿预测中提供了更可靠的预测性能.
...不再出现此类内容
编辑人员丨5天前
-
丙泊酚药物浓度对意识状态相关脑电图特征影响的研究
编辑人员丨5天前
目的:探索对丙泊酚药物浓度和意识状态改变敏感的脑功能特征。方法:选择拟行胸腹部手术治疗的男性患者6例,对所有患者使用靶控输注设备进行丙泊酚输注,初始药物浓度设置为1.0 mg/L,然后每6 min增加0.2 mg/L,直到患者达到无意识状态。同时,采集患者的脑电信号。将采集的脑电信号进行预处理并提取脑功能特征。构建药物浓度相同、意识状态不同和意识状态相同、药物浓度相同两个数据集,并使用线性判别分析(linear discriminant analysis, LDA)、逻辑回归(logistic regression, LR)和支持向量机(support vector machine, SVM)3种机器学习算法模型在不同的数据集上进行分类分析。结果:特征筛选结果显示功率谱-δ-顶区、排列熵(permutation entropy, PE)-δ-颞区和相位滞后指数(phase lag index, PLI)-α-顶区到顶区为对意识状态改变敏感的特征,使用这3个特征在LDA、LR和SVM机器学习算法模型上得到的意识状态分类正确率分别为(82±5)%、(83±5)%和(84±4)%;功率谱-β-额区、功率谱-β-颞区和功率谱-β-顶区对药物浓度改变敏感,使用这3个特征在LDA、LR和SVM机器学习算法模型上得到的药物浓度分类正确率分别为(77±4)%、(76±4)%和(80±4)%。功率谱-δ-顶区在药物浓度变化时没有明显变化( P>0.05),而在意识状态从有意识到无意识明显升高( P<0.001);PE-δ-颞区和功率谱-β-额区在从低药物浓度到高药物浓度和从有意识到无意识时均明显降低( P<0.001);PLI-α-顶区到顶区在低药物浓度状态下明显高于其在高药物浓度状态下( P<0.001),但是其在意识状态变化时并没有明显变化( P>0.05);功率谱-β-颞区和功率谱-β-顶区在意识状态变化时均没有出现明显变化( P>0.05),但是功率谱-β-颞区从低药物浓度到高药物浓度时明显升高( P<0.001),而功率谱-β-顶区从低药物浓度到高药物浓度时明显降低( P<0.05)。 结论:功率谱-δ-顶区可以很好地表征意识水平的变化同时避免药物浓度的影响,在精确监测麻醉深度上具有潜力。
...不再出现此类内容
编辑人员丨5天前
-
基于电子鼻技术的膀胱癌尿液VOCs标志物气体检测与识别
编辑人员丨5天前
目的:设计一款电子鼻,用于检测与识别膀胱癌尿液中的挥发性有机化合物(VOCs)标志物气体。方法:选取异丙醇、乙苯、乙酸和氨气作为目标气体,由8款金属氧化物气体传感器构建传感器阵列进行测试收集实验数据,并对不同特征归一化处理。通过递归特征消除(RFE)筛选出最佳特征子集,进一步引入主成分分析(PCA)和线性判别分析(LDA)降低数据维度便于可视化分析。此外,结合支持向量机(SVM)、随机森林(RF)、K最近邻(KNN)3种机器学习算法进行模型训练和验证。结果:特征数为12时,模型分类的准确率最高,特征子集由5个差值、5个灵敏度和2个积分组成,同时将数据降至12维;仅PCA无法区分4种气体,LDA分类效果明显好于PCA,除异丙醇与乙酸有小部分重叠区域,能够将乙苯、氨气很好地与前二者区分开,且样本点聚集在一起,聚类效果也更佳。SVM、RF和KNN的预测准确率分别为0.85、0.56、0.79,经过模型验证,PCA+SVM、LDA+RF和LDA+KNN的分类准确率分别为0.97、0.94、0.97。结论:设计了一款电子鼻,能够用于检测与识别膀胱癌尿液VOCs标志物气体。
...不再出现此类内容
编辑人员丨5天前
-
能谱CT影像组学特征鉴别肺癌结节与炎性结节的价值
编辑人员丨5天前
目的:探讨能谱CT影像组学特征在鉴别肺癌结节与炎性结节中的价值。方法:回顾性分析在苏州大学附属第一医院接受肺部能谱CT扫描的96例肺癌结节和45例炎性结节患者的资料。按照2∶1的比例随机分配为训练组(肺癌结节64例,炎性结节30例)和验证组(肺癌结节32例,炎性结节15例)。利用MaZda软件对训练组动脉期和静脉期70 keV单能量图像进行影像组学特征提取。采用费希尔参数法(Fisher)、分类错误率联合平均相关系数法(POE+ACC)和相关信息测度法(MI)对提取的特征进行筛选,得到3组最优特征子集。然后用线性(LDA)和非线性判别分析法(NDA)对最优特征子集进行分析,计算其鉴别肺癌结节和炎性结节的受试者操作特征(ROC)曲线下面积(AUC)、准确率、灵敏度、特异度、精准率和F1分数。利用人工神经网络(ANN)建立预测模型,并对验证组两种病变进行鉴别。使用Delong检验比较不同的最优特征子集AUC的差异。结果:在动脉期,MI-NDA法选择的最优特征子集鉴别训练组肺癌结节和炎性结节的AUC最高,为0.888(95%可信区间0.806~0.943),其准确率、灵敏度和特异度分别为88.3%、87.5%和90.0%。MI-NDA法与Fisher-NDA、(POE+ACC)-NDA法的AUC差异无统计学意义( Z=1.941, P=0.052; Z=1.683, P=0.092)。在静脉期,(POE+ACC)-NDA法选择的最优特征子集的AUC最高,为0.846(95%可信区间0.757~0.912),其准确率、灵敏度和特异度分别为87.2%、92.2%和76.7%。(POE+ACC)-NDA与MI-NDA的AUC差异无统计学意义( Z=1.354, P=0.18),而与Fisher-NDA的AUC差异有统计学意义( Z=2.423, P=0.015)。MI-NDA法选择的动脉期最优特征子集在训练组和验证组的AUC最高,分别为0.888(95%可信区间0.806~0.943)和0.871(95%可信区间0.741~0.951)。 结论:能谱CT影像组学定量特征可用于鉴别肺癌结节与炎性结节,具有较高的诊断价值。
...不再出现此类内容
编辑人员丨5天前
-
CT影像组学在预测肺癌表皮生长因子受体突变中的应用价值
编辑人员丨5天前
目的:探讨CT影像组学定量特征在预测肺癌表皮生长因子受体(EGFR)突变中的价值。方法:回顾性分析2013年9月至2018年10月在苏州大学附属第一医院确诊的144例有EGFR基因检测结果的肺癌患者的资料,男75例、女69例,中位年龄54(25~68)岁。其中,EGFR突变型81例,男39例、女42例,中位年龄52(25~64)岁;EGFR野生型63例,男36例、女27例,中位年龄56(32~68)岁。按照2∶1的比例随机分配为训练组和验证组。利用MaZda软件提取影像组学特征包括灰度直方图(GLH)、绝对梯度(GRA)、灰度共生矩阵(GLCM)、灰度游程矩阵(GLRLM)、自回归模型(ARM)和小波变换(WAV)等特征。采用费希尔参数法(Fisher)、分类错误率联合平均相关系数法(POE+ACC)和相关信息测度法(MI)3种特征选择方法对提取的定量特征进行筛选,分别选择10个相关的最优特征,得到最优特征子集。然后用线性判别分析法(LDA)和非线性判别分析法(NDA)对三组最优特征子集进行分析,计算出其鉴别肺癌EGFR突变型与野生型的准确度、敏感度和特异度,利用人工神经网络(ANN)对训练组准确度最高的最优特征子集建立预测模型,并利用建立的预测模型,对验证组肺癌EGFR突变型与野生型进行鉴别诊断。结果:MaZda软件提取训练组肺癌EGFR突变型与野生型图像定量特征,一共301个。Fisher-NDA和(POE+ACC)-NDA法选择的最优特征子集鉴别肺癌EGFR突变型与野生型的准确度最高,为93.8%。Fisher-NDA法最优特征子集预测模型鉴别验证组中肺癌EGFR突变型与野生型的准确度、敏感度和特异度分别为83.3%、86.7%和77.8%。结论:CT影像组学最优特征子集在预测肺癌EGFR突变中有较高的准确度,为预测肺癌基因表达提供了一种新的方法。
...不再出现此类内容
编辑人员丨5天前
-
基于LDA模型的卒中后认知障碍管理相关研究的主题挖掘与分析
编辑人员丨5天前
目的:分析卒中后认知障碍管理的研究现状和热点,为卒中后认知障碍管理提供依据。方法:系统检索2011年11月1日—2021年11月1日Web of Science数据库中与卒中后认知障碍管理相关的文献,从年份、期刊及国家等方面进行文献计量分析,同时采用狄利克雷分配(LDA)主题模型挖掘潜在主题,并确定主题关键词。结果:共纳入1 815篇文献,文献数量整体呈稳步增长趋势,来源出版物共计394种,载文量最大的期刊是 Stroke(61篇),美国是该领域研究的主要国家,发文量占34.93%(634/1 815)。通过LDA主题模型识别6个研究主题,分别为卒中后认知障碍患者各领域功能缺损及心理健康、神经心理筛查及评估工具、康复干预训练及效果评价、家庭照顾者的支持与健康促进、卒中后认知障碍的流行病学特征以及相关危险因素。 结论:卒中后认知障碍管理的研究总体呈上升趋势,通过对相关研究的主题挖掘与分析,有利于进一步为卒中后认知障碍管理的开展提供发展方向和信息支撑。
...不再出现此类内容
编辑人员丨5天前
-
基于实时超声图像引导技术和线性判别模型分析前列腺癌放疗分次内运动模式
编辑人员丨5天前
目的:基于经会阴超声(TPUS)实时扫描技术和线性判别分析(LDA)法,定性分析并自动判别前列腺癌放疗分次内运动模式,为个体化精确放疗奠定基础。方法:应用TPUS技术记录了61例前列腺癌患者共1265个分次近百万个实时监测数据,划分为稳定型、波浪型、小偏执型、银叉型、回归型、大偏执型和稽留型运动模式。对运动轨迹量化并提取特征参数,通过LDA法建立判别方程式,评估训练集和测试集的判别效果。结果:平均每位患者存在4种不同的运动模式,不稳定型占(35.00±21.49)%。随着治疗次数的增加,运动轨迹并未表现出越来越稳定的趋势,不同模式的出现极不规则。构建的线性判别模型对训练集和测试集的判别准确率分别为90.4%和89.5%,敏感性和特异性分别为84.9%和91.1%。结论:前列腺癌患者分次内运动模式多样且随机,具有不可预测的特点。LDA法可以有效地对分次内运动模式进行判别,同时在治疗过程中利用判别方程和中心坐标实现对未知样本的自动鉴别。
...不再出现此类内容
编辑人员丨5天前
-
基于自动乳腺全容积成像影像组学的机器学习模型鉴别BI-RADS 4类病灶良恶性的临床价值
编辑人员丨5天前
目的:探讨基于自动乳腺全容积成像(ABVS)影像组学的机器学习模型鉴别乳腺影像报告和数据系统(BI-RADS) 4类病灶良恶性的临床价值。方法:前瞻性收集2020年5-12月于西南医科大学附属医院(中心1)和广东省中医院(中心2)接受ABVS检查和组织活检的BI-RADS 4类病灶患者,分为训练集(中心1)和外部验证集(中心2)。将病灶的最大切面图像(ABVS横切面、矢状面和冠状面各一张)导入影像组学分析软件(MaZda),并提取影像组学特征。在训练集,七种特征选择方法和十三种机器学习算法进行两两结合,构建不同的机器学习模型,将诊断性能最优的六种模型在外部验证集进行验证并确定最终的机器学习模型。最后,评估有或无模型辅助下不同经验超声医师(R1、R2和R3,分别有3、6和10年经验)诊断效能和诊断信心的变化。结果:①研究纳入251个BI-RADS 4类病灶,其中训练集178个(良性91个,恶性87个),外部验证集73个(良性44个,恶性29个);②训练集中,诊断性能最优的六种机器学习模型分别是基于递归特征消除(RFE)的深度神经网络(DNN)模型,自适应提升(AdaBoost)模型,逻辑回归(LR)模型,线性判别分析(LDA)模型,集成算法(Bagging)模型和支持向量机(SVM)模型,ROC曲线下面积(AUC)依次为0.972、0.969、0.968、0.968、0.967和0.962;③外部验证集中,DNN-RFE模型仍具有最优的诊断性能,其AUC、准确性、敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV)分别为0.886、0.836、0.934、0.776、86.8%和82.5%;④模型辅助前,R1的诊断性能最差,其准确性、敏感性、特异性、PPV和NPV分别为0.680、0.750、0.640、57%和81%;模型辅助后,R1的上述指标分别提升至0.730、0.810、0.930、68%和94%,差异有统计学意义( P=0.039),而R2和R3与辅助前比较,差异无统计学意义( P=0.811,0.752);三名医师的总体诊断信心从2.8增加至3.3( P<0.001)。 结论:基于ABVS影像组学的机器学习模型能较好地区分良恶性BI-RADS 4类病灶,提升经验较少医师的诊断性能及其诊断信心。
...不再出现此类内容
编辑人员丨5天前
