-
基于深度学习的《脉经》中医术语命名实体识别研究
编辑人员丨2024/8/10
目的:基于深度学习方法,对《脉经》中的术语命名实体识别进行研究.方法:针对中医典籍《脉经》涵盖了大量专业术语、知识体系复杂且分词困难等问题,采用迁移学习与BERT相结合的方法,对《脉经》数据集进行预处理,并与BERT-CRF、BiLSTM-CRF、BERT-BiLSTM-CRF模型进行对比.结果:本实验构建的BERT-BiLSTM-CRF-部首特征模型命名实体识别的F1值为84.77%,相较于BERT-CRF、BiLSTM-CRF、BERT-BiLSTM-CRF模型,该模型在词向量的构建过程中,充分考虑了中医领域的专业性和特殊性,不仅针对上下文语境进行了学习,还针对实体词的部首特征进行了学习,效果最优.结论:利用BERT-BiLSTM-CRF-部首特征模型能够有效实现中医古籍术语命名实体类别识别,有效提高了中医古籍的实体识别准确率,为后续知识图谱构建奠定技术基础,亦为临床诊断提供高质量数据支持.
...不再出现此类内容
编辑人员丨2024/8/10
-
融合汉字部首的BERT-BiLSTM-CRF中医医案命名实体识别模型
编辑人员丨2023/8/19
目的/意义研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据.方法/过程提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测.将人工标注的400份共计5万余字的医案按照3:1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体.结果/结论该模型在测试集F1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案.
...不再出现此类内容
编辑人员丨2023/8/19
-
2018年天津市院内报告糖尿病首诊病例的流行病学特征
编辑人员丨2023/8/5
目的 了解天津市医疗机构院内报告糖尿病首诊病例的流行病学特征,为政府开展相应工作提供科学依据.方法 数据来源于覆盖天津全市各级医疗卫生机构的糖尿病发病监测体系.收集2018年1月1日至12月31日全市医疗机构首次就诊的糖尿病病例资料,包括一般信息、临床诊断类型、并发症和报告部门等.采用SPSS 19.0统计软件进行x2检验.结果 2018年天津市院内报告糖尿病病例共42 171例,报告发病率为389.89/10万,其中男性为351.00/10万,女性为428.45/10万.1型糖尿病、2型糖尿病、女性妊娠糖尿病和其他类型糖尿病的报告发病率分别为2.13/10万、288.32/10万、126.30/10万和36.03/10万.糖尿病类型主要为2型糖尿病,其次为妊娠糖尿病.城市居民糖尿病报告发病率为413.89/10万,农村居民为365.59/10万.在全部首诊报告病例中,不伴并发症者占80.10%,伴并发症者占19.90%.所报告的糖尿病新发病例共涉及183家医疗机构,其中一级医疗机构报告4 348例(10.31%)、二级医疗机构报告9 567例(22.69%)、三级医疗机构报告28 241例(66.97%),其他民办等医疗机构报告15例(0.03%).住院报告23 973例(56.85%)、门诊报告17 586例(41.70%)、急诊报告51例(0.12%)、其他部门报告561例(1.33%).结论 2018年天津市糖尿病新发病例以2型糖尿病和妊娠糖尿病为主.应持续开展糖尿病监测,并加大政策和人员投入,为针对性地开展糖尿病早期防控提供科学依据.
...不再出现此类内容
编辑人员丨2023/8/5
