-
基于语义距离的证素积分算法及其在高血压证素分析中的应用研究
编辑人员丨1个月前
目的 提出一种纯粹从知识层面量化证素辨证的算法,用以得出各种症状体征与证素之间的具体数量关系,并应用于高血压人群的证素分析.方法 使用正则表达式方法析出《中医临床诊疗术语》中症状体征与证素的语义关系用以构建知识图谱,并用语义距离算法构建证素辨证算法,基于所设计的算法,使用卡方检验、系统聚类、共现网络等方法分析高血压人群的证素分布情况.结果 通过知识图谱语义距离可以形成证素积分算法.高血压证素分析可得不同体质量指数(body mass index,BMI)的高血压人群组间证素脾、胆、气滞、血热、血虚、阴虚、动风差异有统计学意义(P<0.05),不同腰臀比的高血压人群组间证素肺、肾、湿、燥、痰、血热、气虚、血虚、精亏差异有统计学意义(P<0.05).病位证素心、肝、脾、肾在证素分析中聚为一类,病性证素阴虚、血虚、津液亏、精髓亏聚为一类,痰湿因素与各病位、病性证素有较强关联.结论 证素积分算法能够从一定程度上量化症状体征与中医证素的映射关系,为高血压不同体质量、腰臀比的辨证提供参考,揭示不同证素之间的关联,为高血压的准确全面辨证提供临床价值.
...不再出现此类内容
编辑人员丨1个月前
-
面向真实世界的知识挖掘与知识图谱补全研究(三):基于正则表达式对膀胱癌真实世界数据的结构化信息抽取
编辑人员丨2024/4/27
随着医疗大数据的发展,真实世界研究近些年来越来越受到重视,发展前景良好,但真实世界研究的实施仍存在一些挑战,引起学者们广泛讨论.真实世界数据的非结构化是目前最亟待解决的问题.本研究以正则表达式为基础,通过基于规则的信息抽取方法对武汉大学中南医院近几年膀胱癌患者的入院记录、病理报告、手术记录和影像记录等数据进行结构化信息抽取,并以准确率和召回率为指标评价其抽取效果,旨在为后续研究提供参考.
...不再出现此类内容
编辑人员丨2024/4/27
-
基于医案文本的名老中医诊疗知识图谱构建方法及应用
编辑人员丨2024/2/3
目的 以名老中医临床病案为研究对象,设计中医诊疗知识图谱构建方法并进行应用.方法 首先,设计深度学习和正则表达式相结合的医案文本实体抽取方法,对非结构化医案文本的疾病、症状、病机和中药实体进行自动抽取;其次,定义实体关系,利用HAN方法计算实体之间的相关性,形成"实体-关系-实体"三元组;最后,利用图数据库Neo4j进行知识存储、Gephi进行可视化展示并在名老中医诊治肺癌医案上进行应用验证.结果 知识抽取模型对医案实体抽取的精确率、召回率和F1分别为88.49%、90.02%、89.25%,各指标优于对比方法;通过实体相关性计算共提取了1077条三元组,并成功构建了知识图谱,能够反映名老中医诊治肺癌"病-症-机-药"之间的关系.结论 本文方法可以有效解决名老中医临床医案文本知识的抽取、组织和表达问题,实现了从医案文本到知识图谱的自动化构建过程,相关研究思路和方法可以为名老中医诊疗知识图谱构建提供参考.
...不再出现此类内容
编辑人员丨2024/2/3
-
应用正则表达式自动识别影像危急值的方法
编辑人员丨2023/8/6
目的 提出一种从医学影像检查报告中自动识别危急值并提示医师上报的方法,防止发生危急值漏报的情况,提高医疗质量.方法 根据危急值上报制度的要求,将医学影像检查的各种危急情况分别按照正则表达式的规范进行表述,形成危急值特征库,并设计算法实时检测诊断报告,发现危急值自动提示医师.结果 根据本方法开发了危急值自动识别软件并在南方医科大学南方医院试用6个月,软件运行效果良好.结论 应用正则表达式进行危急值特征库定义和识别算法设计的方法,能实现影像危急值的自动识别并提示医师.
...不再出现此类内容
编辑人员丨2023/8/6
-
非结构化电子病历中信息抽取的定制化方法
编辑人员丨2023/8/6
目的:电子病历数据中的主诉、现病史、既往史、鉴别诊断、影像诊断、手术记录等主体内主要采用中文自然语言文字描述,是临床医生实际诊疗细节的具体体现,包含了诊疗细节的大量、丰富信息.本研究目的在于建立一种从中进行有效信息提取并组织成可分析利用的形式,供目前医学数据处理、医学研究之用.方法:基于医院的真实电子病历数据,设计定制化的基于规则学习及信息抽取方法,采用三个步骤实现中文信息的抽取:(1)抽样标注,随机抽取600份电子病历的病史信息(包括现病史、既往史、个人史、家族史等),采用本研究开发的标注平台,对其中需要抽取的信息(以糖尿病史为实例)进行标注;(2)根据标注结果,进行抽取模版归纳,并将抽取模版进行重写,生成可以直接用于抽取的Perl语言正则表达式抽取规则,并利用这些规则进行实际信息抽取;(3)对抽取结果进行人工验证与自动化验证相结合的方法,对方法的有效性进行验证.结果:所设计方法已在国家医疗数据中心平台上实现,并针对糖尿病病史抽取在医院进行了单个科室的现场验证,2015年1 436份糖尿病患者病历的病史抽取结果为召回率87.6%、准确率99.5%、F分数(F-Score)0.93;全体糖尿病患者10%抽样病历共1 223份的抽取结果为召回率89.2%、准确率99.2%、F-Score 0.94,效果较好.结论:主要采用自然语言处理与基于规则的信息抽取相结合的方法,设计并实现了从非结构化的中文电子病历文本数据中抽取定制化信息的算法,与已有工作比对效果较好.
...不再出现此类内容
编辑人员丨2023/8/6
-
人工智能在医学诊断知识图谱构建中的应用研究
编辑人员丨2023/8/6
介绍人工智能在医学领域的应用,通过自然语言处理方法自动构建基于“疾病-症候-特征”3层结构模型的医学诊断知识图谱,具体阐述智能构建方法与构建过程,将其运用到临床决策支持系统中检测临床疗效,结果表明通过该方法构建的医学知识图谱具有效率高、疾病诊断正确率高等特点.
...不再出现此类内容
编辑人员丨2023/8/6
-
疾病诊断自动编码系统的设计与应用
编辑人员丨2023/8/6
为提高ICD-10疾病编码效率及编码质量,对临床医师的常用诊断进行预处理和分析,利用Oracle正则表达式建立ICD-10诊断代码与预处理后的诊断名称的对照关联,通过采用Regexp_like函数对临床诊断自动进行核对及编码.对编码正则表达式进行不断完善及优化后,编码成功率达到95%,编码符合率达到96%.使用疾病诊断自动编码系统完成编码自动化有助于规范编码流程管理,降低人力和时间成本,改善临床书写习惯,减少人为误差,有效的提升编码的效率及编码质量.在实际应用中疾病诊断编码是一个持续完善与优化的过程,能辅助诊断标准化并提升编码员的核查能力,正则表达式越准确,诊断编码成功率和符合率越高.
...不再出现此类内容
编辑人员丨2023/8/6
-
结合Tikhonov正则化方法的近红外漫射光血流成像技术
编辑人员丨2023/8/6
近红外漫射相关光谱与断层成像(DCS/DCT)是一类实现生物组织血流测量和成像的较新技术,其中图像重建方法与血流成像的质量密切相关.目前常用的解析表达式和有限元方法存在局限性,影响了血流重建图像的精确性和稳定性.本文根据一种新型的N-阶线性算法,并结合Tikhonov正则化方法提出了DCT的血流重建技术(称为Tikhonov-DCT技术).在本技术中,通过光子在组织中的蒙特卡罗仿真,被测组织的几何形态和内部特征得到了充分的利用.此外,Tikhonov正则化很大程度地改善了图像重建问题的病态性,提高了成像的精确性和稳定性.在真实头部模型进行的仿真结果表明,利用Tikhonov-DCT重建的异常组织血流数值和位置准确,边缘保持较好.本技术有潜力用于优化光学传感器位置和数量,以及应用于各种生理及临床中的血流成像中.
...不再出现此类内容
编辑人员丨2023/8/6
-
肝癌中医药防治三级监测平台的设计与实现
编辑人员丨2023/8/6
基于信息共享理念和大数据技术建立中医药防治肝癌三级预防的信息化平台.该平台基于Django的网络应用框架,采用表现层、业务逻辑层、数据访问层的"三层架构"结构,运用python语言和正则表达式自主研发而成.该平台的建立,旨在为中医药防治肝癌研究搭建医联体数据聚合和共享信息平台,为中医药防治肝癌三级监测体系提供个体化健康管理模型.
...不再出现此类内容
编辑人员丨2023/8/6
-
一种集成深度神经网络和正则表达式的基因变异命名实体识别算法
编辑人员丨2023/8/6
目的 基因变异命名实体的自动化正确识别是从生物医学文献中挖掘基因-变异-疾病关系知识的重要基础.该文提出一种以深度神经网络为主、结合维特比解码和正则表达式的组合算法,用于识别基因变异命名实体.方法 受单词分布式表示的启发,提出一种深度分词策略,即以字母的大小写、数字和特殊符号将单词分开来捕捉变异名称中各部分的结构信息,其中最小的分词单位定义为token;使用GloVe训练深度分词的token向量,一个单词的全部token向量用于训练该单词的词向量.以句子的词向量序列为输入,利用一个双向长短期记忆网络(Bi-LSTM)学习变异名称的一般形式并捕捉上下文信息,后接一个全联接层以提高拟合能力,得到词的标签概率序列作为初步输出;随后采用维特比算法对初步输出进行优化,最后增加正则表达式匹配的结果完成识别.结果 该算法经在NCBI tmVar语料库上训练和测试,取得了91.59%的F1值,高于目前国际上已公开报道的识别系统.结论 该算法避免了复杂的人工特征工程并表现出优越的性能,可用于快速定位生物医学文本中的变异实体,为进一步的关系抽取研究打下基础.
...不再出现此类内容
编辑人员丨2023/8/6
