-
Python爬虫技术在信息流行病学中的应用
编辑人员丨2天前
Python网络爬虫技术是一种通过模拟用户的网络浏览行为以实现从网络中自动、大量提取信息的技术,是信息流行病学研究收集并整合多源异构信息数据的关键基础。Python网络爬虫可分为简单爬虫与大型爬虫,集数据采集与数据库构建于一体,语法简洁、灵活性高、学习成本低、维护成本低。它适用于信息流行病学的各种应用场景,通过对互联网中健康相关信息的分析,实现多种公共卫生监测、健康干预实施及效果评价、智慧寻医方略优化等目标。近年,我国政府开始鼓励对含互联网信息在内的多源大数据的整合利用,在此背景下,Python爬虫技术的应用场景势必会越来越多,相应的人才培养、技术革新建议纳入到公共卫生教育和科研体系之中。
...不再出现此类内容
编辑人员丨2天前
-
基于网络检索词频分析“百度知道”中公众对先天性出生缺陷相关信息的需求
编辑人员丨2天前
目的:基于网络检索词频分析“百度知道”中公众对先天性出生缺陷相关信息的需求。方法:由妇产科专家与流行病学专家讨论后,确定先天性出生缺陷相关检索词并制定检索策略,采用Python 2.7进行网络爬虫检索,在“百度知道”平台获得先天出生缺陷相关的提问句,再使用R 4.0.2软件进行文本数据处理,完成关键词的语义分析与词频统计分析,并绘制词云图和极坐标图来描述关键结果。结果:在“百度知道”平台中共检索到16 668条不重复的提问句,语义词词频数为15 371,其中,先天出生缺陷相关疾病名称与症状词频数占35.02%。此外,先天性心脏病相关词频构成比最高(26.09%)。出生缺陷检索词主题分析结果显示诊断和治疗语义词的平均词频数(49.55)明显高于病因及预防相关语义词平均词频数(12.47)。此外,检查、原因、治疗、发育、遗传等关键词在七类系统畸形相关语义词中的出现频率均较高。结论:我国公众对于先天性出生缺陷相关的疾病、及其病因、预防以及治疗方面的信息需求较高,其中尤以先天性心脏病在疾病相关词频中占比最高。
...不再出现此类内容
编辑人员丨2天前
-
青少年艾滋病防治投放的核心知识宣传信息与“百度知道”文本挖掘词频对比分析
编辑人员丨2天前
目的:分析国家针对青少年艾滋病防治投放的核心知识宣传信息与“百度知道”文本挖掘词频差异。方法:采用网络数据采集方法(即数据爬虫),采集并整理截至2018年6月11日“百度知道”上在线查询者关于艾滋病提问的相关信息;国家针对青少年艾滋病投放的核心宣传信息(简称核心知识宣传信息)由《大众人群艾滋病知识知晓率问卷》和《青年学生人群艾滋病知识知晓率问卷》,及14条针对青年学生艾滋病防治宣传教育核心知识构成。根据官方分类将所有数据分为预防,检测和治疗,危险性认识、症状和传播,法律法规、歧视与政策4类。利用中文文本分词、词频统计、对比分析和词频可视化呈现等文本挖掘方法比较去除无用词后以上两方面信息的差异。结果:“百度知道”信息中,预防,检测和治疗,危险性认识、症状和传播,法律法规、歧视与政策类词频数量分别为18 942、43 140、73 437和33 859个;核心知识宣传信息中,4类词频数量分别为371、241、208和136个。核心知识宣传信息的语义相关词词频中,占总词频比例最高的为预防类(32.3%,162个),最低的为法律法规类(14.1%,71个);“百度知道”信息的语义相关词词频中,最高的为检测与治疗类(51.7%,51 264个),最低的为预防类(11.4%,11 272个)。两方面信息完全重复词占核心知识宣传信息词频比例为59.3%~63.9%;完全重复词占“百度知道”信息4类词频比例相对较低,预防类、检测与治疗类均大于45%,症状和传播类为34.3%(14 781个),法律法规类最低,仅为17.0%(5 744个)。结论:对比官方投放和“百度知道”,法律法规类和预防类词频对比差异较大,建议在核心知识宣传中结合青少年需求和兴趣增补和改进相关内容。
...不再出现此类内容
编辑人员丨2天前
-
哮喘儿童家长的疾病需求研究
编辑人员丨2天前
目的:通过LDA(latent dirichlet allocation)主题模型结合半结构化访谈法对哮喘儿童家长的疾病需求进行研究,为开展符合其需求的医疗护理服务奠定基础。方法:采用数据挖掘的方法,研究对象为3个中文在线医疗社区中与儿童哮喘有关的提问记录,通过爬虫代码采集2014年1月—2019年6月的数据,进行数据清洗和分词后采用LDA主题模型挖掘主题特征。依据上述研究结果结合文献研究及专家讨论法制定访谈提纲,采用目的抽样法,选取2019年6—10月北京市2家医院儿童哮喘门诊中13名哮喘儿童家长进行半结构式访谈,通过Colaizzi 7步分析法对资料进行分析。结果:在线网络社区提问记录的主题特征分析显示,LDA模型将2 173条提问记录划分为8个主题,即第一、四主题为儿童哮喘症状及处理方法,第二、六主题为儿童哮喘治疗检查及就医选择,第三主题为家长对患儿病情的担忧,第五主题为哮喘的发病原因以及预后,第七主题为哮喘儿童的生活管理及中医药治疗,第八主题为过敏原的预防与长期用药安全性。半结构化访谈结果提炼出4个主题,即家长担心长期应用哮喘药物的副作用、家长在哮喘管理知识上的缺乏、家长对儿童哮喘病因与预后的困惑、家长在哮喘管理中产生的心理负担。结论:LDA主题模型可提取出在线医疗社区中的主题,结合半结构化访谈可深入探究特定疾病的患者需求。研究结果提示医护人员应针对规范用药、疾病日常管理以及疾病预后等内容进行哮喘儿童的健康教育,同时也应关注患儿及其家长的心理状态。
...不再出现此类内容
编辑人员丨2天前
-
中国四种非免疫规划疫苗接种费用支付政策的实施情况分析
编辑人员丨2天前
本研究基于Python网络爬虫技术系统检索得到肺炎球菌疫苗、人乳头瘤病毒疫苗、b型流感嗜血杆菌疫苗和轮状病毒疫苗的接种费用支付政策信息,结合我国2020年医保参保比例和人口数据,估计政策覆盖人群在疫苗适用人群中的占比。结果显示,我国疫苗接种费用支付政策主要包括免费接种和医保支付两大类,在四种非免疫规划疫苗中,免费接种政策仅涉及肺炎球菌疫苗和人乳头瘤病毒疫苗,其中13价肺炎球菌结合疫苗、23价肺炎球菌多糖疫苗和人乳头瘤病毒疫苗分别在1、10和15个省份为特定人群提供免费接种,各疫苗相应的政策覆盖人群及其在疫苗适用人群中占比分别为6月龄至2岁儿童(2.5%)、老年人(1.2%~21.5%)和在校初中女生(1.1%~12.2%);医保支付政策在14个省份实施,政策实施地区几乎均覆盖上述四种疫苗,政策覆盖人群在疫苗适用人群中占比为10.9%~41.5%。
...不再出现此类内容
编辑人员丨2天前
-
新时期北京市三级公立医院社会责任履行现状分析
编辑人员丨2024/8/10
目的:了解北京市三级公立医院2018-2022年社会责任履行情况及变化趋势,为促进公立医院更有的放矢提升社会责任履行水平提供参考.方法:按照资料可获取性原则抽取《北京市卫生工作统计资料汇编》中披露的40家北京市三级公立医院作为研究样本,运用Python 3.8软件自行设计网络爬虫程序爬取样本医院官方网站首页新闻栏目中2018年1月1日~2022年12月31日披露的所有新闻报道,采用内容分析法对医院社会责任进行量化及统计分析.结果:北京市三级公立医院在2018-2022年社会责任整体履行状况较好,呈现出先上升后降低的趋势;在紧急环境中基本社会责任履行情况优于高级社会责任,而在稳定环境中高级社会责任履行情况优于基本社会责任;基本社会责任也呈现先上升后下降的趋势,高级社会责任呈现出上升-降低的"波动"变化趋势;不同隶属公立医院社会责任行为内部结构比相似,但履行情况存在差异(P<0.05),不同性质公立医院社会责任仅在2020年存在差异(P<0.05).结论:一方面,三级公立医院应根据自身情况在保证落实基本社会责任的基础上进一步提升高级社会责任履行水平;另一方面,应加强不同隶属三级公立医院履行社会责任的力度.
...不再出现此类内容
编辑人员丨2024/8/10
-
自然语言处理在医疗设备采购参数制订中的应用价值研究
编辑人员丨2024/7/20
目的:构建智能化医疗设备采购参数生成系统,实现医疗设备采购参数制订表达清晰和需求匹配精准,提高招标结果的认可度和招标效率.方法:基于自然语言处理(NLP)、网络爬虫和机器学习方法,构建自动化数据更新机制,实现海量采购参数数据提取,并将实体识别方法用于既往采购参数数据分析,实现医疗设备信息及参数名称等实体自动化提取,基于相似性设备推荐及医疗设备模板派生方法,采用向导式交互工具构建智能化医疗设备采购参数生成系统.对比采用智能化医疗设备采购参数生成系统与4名具有3年采购经验的招标采购人员进行10份医疗设备采购参数文件制订的差异.结果:采用智能化医疗设备采购参数生成系统的医疗设备采购参数文件平均生成时长为15.23 min,而招标采购人员制订医疗设备采购参数文件平均时长为173.40 min.经招标采购专家评估,采用智能化医疗设备采购参数生成系统生成医疗设备采购参数文件效率及质量均优于3年采购经验招标采购人员制订的医疗设备采购参数文件.结论:智能化医疗设备采购参数生成系统应用于医疗设备采购参数制订,可实现医疗设备采购参数的专业信息采集、存储和管理,缩短医疗设备采购参数制订周期,为医疗设备招标采购从业人员提供智能化辅助生成工具,提高采购参数制订效能,提升医疗设备采购效率.
...不再出现此类内容
编辑人员丨2024/7/20
-
基于网络问答文本的公众HPV疫苗知信行现状及干预策略分析
编辑人员丨2024/5/11
目的 探究社会公众关于HPV疫苗的关注主题及演化趋势,提出对我国HPV疫苗接种预防宫颈癌的对策及建议.方法 2022年3月14日采用Python爬虫从"知乎"网站中抓取"HPV疫苗"话题下讨论、精华、等待回答中的全部问答文本,采用LDA主题模型分析挖掘公众的关注主题并对其基于知信行理论进行健康行为改变维度划分.结合主题强度指标和时间序列分析法,揭示各关注主题的演化脉络.结果 知乎用户对HPV疫苗相关问题的关注主题有8个;基于"知信行"健康行为改变模型理论,HPV感染及高危因素、HPV疫苗研发与上市、疫苗接种知识和HPV疫苗与宫颈癌预防属于认知维度的主题,HPV疫苗接种犹豫属于信念维度的主题,疫苗的种类及选择、国产与进口疫苗对比、HPV疫苗预约渠道属于行为维度的主题;按主题随时间的发展变化趋势,可将8个主题划分为缓慢发展型、快速增长型、成熟发展型和逐渐衰退型主题.结论 知乎用户关于HPV疫苗关注主题内容既全面又系统,认知维度和行为维度的主题是其核心需求主题;总体来看,用户的关注主题正逐渐从认知维度向接种行为维度转化.本文据此提出我国公众HPV疫苗接种预防宫颈癌的知信行干预策略.
...不再出现此类内容
编辑人员丨2024/5/11
-
R语言在环境流行病学数据处理中的应用
编辑人员丨2024/3/16
目的 探索 R语言 tidyverse程序包(package)在环境流行病学数据处理中的应用,实现基于个人地址信息的空气污染个体暴露评估,交流 tidyverse程序包使用经验.方法 计算机模拟南京市 2017-2019 年心脑血管死亡数据,从网络在线获取南京市 2017-2019 年气象、环境污染监测数据,通过 tidyverse中 dplyr程序包进行数据的筛选、连接、汇总等操作;使用 tidyr程序包进行数据的变形和转换;使用 purrr实现遍历循环;使用经纬度计算最近监测站点暴露和反距离插值暴露.结果 使用rvest程序包的爬虫技术批量获取气象、环境污染物监测数据等数据;使用 tidy、purrr程序包进行数据清洗;使用 geosphere程序包处理空间数据,通过计算最近站点和反距离插值的方式评估个体暴露.结论 R语言 tidyverse相较于基础包拥有一致的语法、高效的数据处理能力、易于掌握等优点;在环境流行病学研究中使用 tidyverse进行数据清洗、汇总统计、暴露计算等数据处理能有效地提高效率;本研究提供了采用 R语言 tidyverse程序包进行反距离加权计算等数据处理的计算机代码,实现了对个体逐日空气污染物暴露的评估方法,为进行空气污染物暴露评估提供了有效的工具.
...不再出现此类内容
编辑人员丨2024/3/16
-
市域空气质量及其健康风险预报平台的设计与开发
编辑人员丨2023/11/18
利用2014-2017年期间的天津市环境空气污染数据、气象数据和人群死亡监测数据,构建符合天津市环境空气污染特征和人群健康风险特征的空气质量健康指数(AQHI)模型.采用浏览器/服务器体系结构(B/S),以Java为主要开发语言,以Spring Boot为基础框架,集成Spring MVC、Spring JPA、Spring Security、Spring Cache等子框架,结合网络爬虫、抽取-转换-加载(ETL)、数据可视化等大数据分析技术,实现空气质量及其健康风险预报平台的开发.
...不再出现此类内容
编辑人员丨2023/11/18
