-
医联体数据集成与共享平台设计
编辑人员丨1个月前
目的:设计医联体数据集成与共享平台,以提升医联体同质化管理水平和区域整体医疗服务水平.方法:该平台采用基于Hadoop生态的云平台架构,使用Java作为主要开发语言,以Apache HDFS和Apache MapReduce为主要底层技术.整个平台包括数据集成与治理、数据资源仓储、数据服务支持和安全对接中心四大核心模块.结果:采用该平台可实现医联体数据资源的整合和治理,同时提供面向管理、临床、科研的应用服务,充分挖掘医联体数据的应用价值.结论:该平台可完成医联体机构数据资源的整合,实现医联体数据价值释放与信息共享互联.
...不再出现此类内容
编辑人员丨1个月前
-
基于Hadoop环境BP改进算法的脉象识别应用研究
编辑人员丨2023/8/6
目的 分析脉象识别误差大小的影响因素,提高对海量脉诊数据的处理速度,探索减小脉象主观识别误差的方法.方法 运用基于Hadoop环境的MapReduce分布式计算方法改进BP算法,采用改进的BP算法对脉诊样本数据进行自学习,从而减小拟和误差.将中医电子脉诊仪采集的脉诊数据作为神经网络输入层,采用动量-学习率自适应调整快速BP算法对神经网络进行训练.结果 在训练集(75%)768 M共35890条数据中,单机模式正确预测29150条,正确率为81.22%;MapRedece并行改进的BP算法模式正确预测35841条,正确率为99.86%.结论 与传统BP算法相比,基于Hadoop环境的MapReduce分布式计算方法改进的BP算法模型拟合度误差更小,精确度更高.
...不再出现此类内容
编辑人员丨2023/8/6
-
大数据环境下的中医药数据管理策略
编辑人员丨2023/8/6
针对海量中医药信息中数据对象属性项的不确定性、数据表述的多样性、抽象性,导致传统数据管理模式无法对其进行有效管理的问题,提出基于大数据技术的中医药数据管理策略.该策略基于中医药数据的真实特性,利用大数据技术对存储对象属性的无模式特性来解决中医药信息中描述对象属性项的不确定性与数据表述不统一性问题、采用混合索引模式解决不同存储模式的数据在索引过程中的冲突问题、通过MapReduce高效并行处理能力解决海量数据查询处理.理论分析给出了中医药数据的管理框架及其关键技术,实验以几种常见的中医药和处方在中医药数据源中的真实描述作为测试对象,在Hadoop上对其性能表现进行了检验.实验结果显示,该模型能有效解决中医药信息数据的存储问题,且在查询效率、完备性以及抗灾能力方面有很好的表现.
...不再出现此类内容
编辑人员丨2023/8/6
-
大数据在监护仪质量控制数据分析中的应用研究
编辑人员丨2023/8/6
目的:应用大数据技术分析和挖掘监护仪质量控制的检测结果,以提升质控效能、强化医疗设备质控的精准管理.方法:针对积累的海量数据及其特点,提出数据分析所需的相关项目及关联因素,并结合MapReduce架构和Apriori算法进行数据挖掘.结果:从功能故障的分布、功能的数据分布和时间跨度内的误差变化率等方面分析了被检监护仪的运行情况,说明质控数据可在一定程度上反映设备对应的工况性能.结论:大数据分析可有效地辅助医工部门制订维修与预防性维护计划,在医疗设备的精细化管理方面具有较好的现实意义.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于Hadoop的中医药数据管理策略研究
编辑人员丨2023/8/6
目的 为解决传统方法采集、存储和处理海量中医药数据的低效问题,探索数据管理的新策略.方法 根据中医药数据的典型特征,设计基于Hadoop的分层管理架构,对串行数据挖掘算法进行MapReduce 化改进;部署单节点服务器和分布式集群,采用8组不同规模的数据集,进行数据采集实验和串并行算法实验.结果 数据传输时间在非分布式环境下通常超过3000 s,增幅较大,而在分布式集群下一般不超过300 s,增幅平缓;当数据规模超过一定范围后,与伪分布式和完全分布式下的并行算法比较,非分布式下串行算法的运行耗时急剧增加.结论 与传统单节点系统相比,基于Hadoop的中医药数据管理平台采集、存储及处理海量数据的效率明显提高,尤其适用于大规模非结构化或半结构化的中医药数据.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于Hadoop的互联网医药大数据的获取及应用
编辑人员丨2023/8/6
在大数据和医药背景下,搭建Hadoop框架,使用MapReduce编程模型,优化互联网数据挖掘框架.实现以“百度学术”搜索引擎网页数据为数据源,使用文本挖掘技术从数据量巨大且价值密度极低的网页信息中采集医药数据;在进行必要的数据清洗后,通过改进的模糊语意概率兴趣度模型进行医药数据挖掘,更高效地获取有价值的关联规则.并从药品-疾病、药品-药品以及疾病-疾病3个维度组合对挖掘的关联规则的药学意义进行解读.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于云计算的蛋白质折叠模拟计算
编辑人员丨2023/8/6
为了解决生物信息学中蛋白质折叠模拟计算的速度慢和软件老旧的问题,提出了基于云计算的蛋白质折叠并行化算法Cloud_ PERM.分析了PERM算法的运行流程及其面向MapReduce的子任务划分方式.Cloud PERM算法实现采用Hadoop云计算环境作为工作平台,其蛋白质序列数据的存储与管理、子任务调度及工作单元的执行都由MapReduce规范来透明的完成;实验结果表明:Cloud_PERM比PERM串行计算具有更快的计算速度,在吞吐量和可扩展性上也有明显的优势.Cloud_PERM可以使生物科研人员节省很多时间与精力,有益于新型蛋白质结构预测与生物特性的研究.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于Yarn云平台的生物基因多序列比对并行算法
编辑人员丨2023/8/6
为了解决生物信息学中基因多序列比对的计算速度慢和软件陈旧的问题,提出了基于Yarn (Yet Another Resource Negotiator)云平台的生物基因多序列比对并行计算方法Yam clustalW.分析了clustalW算法的数学模型及其面向MapReduce的任务划分方式,Yam_clustalW中综合考虑了基因的长度和数目,采用一种基于阈值刻度的任务划分方式.利用NCBI的GenBank生物基因数据作为案例程序进行了测试.实验结果表明:Yarn clustalW比起多序列比对clustalW串行计算方法具有更快的运行时间与加速比,可以使生物科研人员节省很多时间与精力,方便对于药物靶标的发现,缩短生物药物的开发周期.
...不再出现此类内容
编辑人员丨2023/8/6
