-
基于机器学习的药品知识库构建研究
编辑人员丨1周前
目的:以药品说明书为数据基础,构建药品知识库。方法:对随机抽取的600份药品说明书进行人工标注,并划分为训练集和测试集,基于双向长短期记忆网络+条件随机场(Bi-LSTM+CRF)模型进行训练,完成医学实体的识别;以"相似度计算+规则映射表"的混合模型对提取出的实体进行标准化,完成后将药品信息导入Access数据库。结果:基于Bi-LSTM+CRF模型的命名实体识别任务中,除人群类实体外,其余实体中均取得了F值高于85%的良好效果;基于"相似度计算+规则映射表"的混合模型,实体标准化的准确率为88.23%。结论:本研究的机器学习模型效果与其他命名实体识别、实体标准化研究的模型效果相近,能够较好地完成药品知识库构建任务。
...不再出现此类内容
编辑人员丨1周前
-
基于规则+词典+条件随机场的中医医案实体识别研究
编辑人员丨1个月前
目的:针对中医医案中实体具有边界不清晰、类别易混淆等难点,提出了基于规则、词典、条件随机场相结合的实体识别模型.方法:构建中医术语词典,分析医案文本规则,构建特征函数,使用jieba工具对中医医案进行分词,人工标注医案中的5类实体作为训练集和验证集,实现基于条件随机场的医案实体识别研究;最后采用准确率、召回率、F1值对模型进行评价,以探究词典、不同实体类别、文本特征对实体识别结果的影响.结果:模型F1值达到了83.5%,实现了较好的识别效果;词典的加入对实体识别有着显著的促进作用;上下文特征对于模型识别效果影响最大;不同类别的实体识别结果差异较大,其中"方药"的识别效果最好,其次是"治法"和"体征","证型"与"症状"的识别效果最差.结论:本研究提供了一个有效的实体识别模型,这种方法能够极大地提高中医医案实体识别的准确度,也为未来的研究提供了有价值的参考.
...不再出现此类内容
编辑人员丨1个月前
-
基于特征融合的糖尿病命名实体识别
编辑人员丨1个月前
针对医学糖尿病领域命名实体识别中存在实体种类多样性、数据稀缺等问题,提出了基于特征融合的糖尿病命名实体识别方法.以BERT+BILSTM+CRF为基准模型,在3方面进行改进.首先,使用预训练模型RoBERTa-wwm-ext作为模型嵌入层,提供字符级嵌入,利用其在训练阶段进行全词掩码来获取含有先验知识的语义表示.其次,使用双向长短时记忆网络和迭代膨胀卷积神经网络并行提取特征,以获取不同粒度的特征.同时,结合注意力机制进行动态特征融合,从而更好地理解数据的关键信息,以获得更丰富的上下文特征.最后,采用条件随机场进行解码,获得最终的预测结果.该模型在包含18种实体类别的中文糖尿病数据集DiaKG上的F1值达到了79.58%,实验结果表明,与High-Order MKGragh模型相比,该模型的F1值提升了5.38%,充分说明了特征融合的方法能够有效识别糖尿病实体.
...不再出现此类内容
编辑人员丨1个月前
-
基于BERT-BiLSTM-CRF模型的中医治疗功能性胃肠病实体识别及应用
编辑人员丨1个月前
目的:探索分析BERT-BiLSTM-CRF模型抽取中医文献摘要中的实体的可行性及识别效果.方法:在知网数据中导出500条中医疗法治疗功能性胃肠病的论文摘要,对文本中的西医病名、临床表现、方剂、中药等11类实体进行BIO标注,基于BERT-BiLSTM-CRF模型进行训练及参数调整,而后对模型进行测试,并应用于实体识别.结果:模型测试的精确率为85.07%,召回率为88.48%,F1值为0.867 4,中药、方剂、西医诊断等实体类别的识别效果较好;模型应用中,自动化实体抽取结果整体较好,能够反映该领域文献的主要研究方向.结论:BERT-BiLSTM-CRF模型能够识别出论文摘要中大部分的实体,可以为知识图谱的自动化构建提供基础,同时也对中医药领域的自然语言处理应用提供了参考和借鉴.
...不再出现此类内容
编辑人员丨1个月前
-
基于ERNIE-BiGRU-Attention-CRF的电子病历命名实体识别方法
编辑人员丨2024/7/6
目的/意义 改善中文电子病历命名实体识别模型的性能,更好地开展医疗信息的组织和挖掘.方法/过程 构建ERNIE-BiGRU-Attention-CRF中文电子病历命名实体识别模型,首先采用ERNIE1.0 预训练模型生成具有语义特征的词向量,然后利用BiGRU捕获全局语义特征与语法结构特征,通过Attention机制进一步增强语义特征的捕获,最后连接CRF解码层输出全局概率最大的标签序列.结果/结论 在公开的医疗文本数据集CCKS2017 开展对比实验、消融实验,利用生成的模型进行实例分析,取得较好的识别效果.
...不再出现此类内容
编辑人员丨2024/7/6
-
基于预训练模型及条件随机场的中医医案命名实体识别
编辑人员丨2023/10/28
目的:通过建立一种基于预训练模型及条件随机场(CRF)的神经网络,解决目前中医医案命名实体识别效率一般的问题.方法:人工标注所选中医医案的10类命名实体作为训练集和验证集,并构建基于BERT、RoBERTa、ALBERT及CRF的神经网络,以探究对于中医医案命名实体识别任务的最佳预训练模型及CRF对其贡献大小.结果:基于RoBERTa-CRF构建的神经网络在中医医案命名实体识别任务中的性能最优,其对命名实体识别的整体准确率为99.33%,精确率为98.24%,召回率为98.51%,F1分数为98.38%.结论:基于RoBERTa-CRF构建的神经网络能有效实现中医医案命名实体识别,解决其效率一般的问题,并且通过设置恰当的分层学习率,CRF能有效处理命名实体标签间的依赖关系,可为中医医案的高价值数据挖掘奠定的坚实基础.
...不再出现此类内容
编辑人员丨2023/10/28
-
融合汉字部首的BERT-BiLSTM-CRF中医医案命名实体识别模型
编辑人员丨2023/8/19
目的/意义研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据.方法/过程提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测.将人工标注的400份共计5万余字的医案按照3:1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体.结果/结论该模型在测试集F1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案.
...不再出现此类内容
编辑人员丨2023/8/19
-
基于多特征融合的中文电子病历命名实体识别
编辑人员丨2023/8/6
目的 针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病历的信息挖掘和统计分析.方法 将手动标注的语料库分为训练集和测试集,借助NLPIR工具分割文本,选择CRF++工具进行实验.针对中文电子病历的数据特点,先选取基本特征和相应的特征模板,通过不同上下文窗口的对比实验确定其大小;再分别添加引导词特征和构词结构特征,对比两种高级特征对实验结果的影响.结果 仅选取基本特征,上下文窗口为7时,识别效果最好;添加高级特征后,最终疾病实体F值为92.80%,症状实体F值为94.17%.结论 条件随机场模型融合多种有效的特征,可以很好地识别出电子病历中的疾病和症状实体.本研究对电子病历的命名实体识别有重要的意义.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于新型深度全卷积网络的肝脏CT影像三维区域自动分割
编辑人员丨2023/8/6
肝脏分割对于肝肿瘤肝段切除及肝移植体积测量具有重要的临床价值.由于在CT影像中肝脏与邻近脏器的灰度值相似性很高,因此对肝脏区域的三维自动分割是一项具有挑战性的难题.为解决精准肝脏分割的问题,提出一种新型的深度全卷积网络结构3 DUnet-C2.该结构充分利用肝脏CT图像的三维空间信息,并有效结合肝脏区域的浅层特征和深层特征.特别地,还提出一种新的3DUnet-C2网络训练策略,通过选取清晰图像,并从图像中截取肝脏区域作为样本进行训练的方式,得到初步3DUnet-C2模型权重,并使用该权重来初始化3DUnet-C2的网络参数,从而使网络达到收敛.最后,针对3DUnet-C2网络分割肝脏边界不精准的问题,在原有3DUnet-C2网络模型的基础上,运用三维条件随机场构建3DUnet-C2-CRF模型来优化肝脏分割边界.为了验证所提出三维分割模型的性能,从ISBI2017 Liver Tumor Segmentation Challenge的数据集中选取100张CT图像用于训练、验证和测试,3DUnet-C2-CRF模型在随机选取的20张测试集上的分割准确率的Dice系数为96.9%,高于3DUnet和Vnet模型的Dice系数.实验结果表明,3DU net-C2-CRF模型具有更好的特征表达能力以及更强的泛化性能,从而可提升模型的分割准确率.
...不再出现此类内容
编辑人员丨2023/8/6
-
深度学习图像分割算法在胃癌病理切片中的可行性分析
编辑人员丨2023/8/6
目的 采用基于深度学习的胃癌病理切片分割算法实现对癌症区域的识别.方法 以U-Net网络为基本架构设计更深层次的胃癌病理切片分割算法模型Deeper U-Net (DU-Net) .采用区域重叠分割法将数据集分割成若干小块图片, 然后利用预先训练好的DU-Net网络模型对分割的小图片块进行初次分割, 并使用图片分类器清除假阳性样本, 重新合成新样本.采用重复学习的方法使用新样本进行多次重复训练, 将得到的结果应用全连接条件随机场 (CRF) 进行后续处理.最终得到胃癌分割图片并验证结果.结果 经过3次重复学习后, DU-Net网络模型的平均精度为91.5%, 平均交叉联合度量 (IoU) 为88.4%;相比于未经重复学习的基础DU-Net模型, 其平均精度提升了5.6%, 平均IoU提升了2.9%.结论 基于深度学习的胃癌病理切片分割算法实现了精准的分割, 提高了模型的泛化能力和鲁棒性, 可用于辅助胃癌病理诊断.
...不再出现此类内容
编辑人员丨2023/8/6
