-
基于生物信息学和机器学习算法鉴定PDR铁死亡关键基因
编辑人员丨4天前
目的::联合生物信息学分析方法和机器学习算法筛选增殖性糖尿病视网膜病变(PDR)中铁死亡关键基因和治疗靶点。方法::从GEO数据库和FerrDb数据库中下载PDR转录组测序数据集、基因芯片数据集和铁死亡相关基因列表;筛选出铁死亡相关差异基因并行功能富集分析;通过WGCNA分析方法筛选PDR中铁死亡相关疾病特征基因;综合LASSO算法与SVM-RFE算法筛选出铁死亡关键基因并通过受试者工作特征曲线评估诊断能力;对铁死亡关键基因行GSEA分析;通过DGIdb数据库构建铁死亡关键基因的药物调控网络;应用CIBERSORT算法分析PDR中免疫细胞浸润分布特征。组间比较采用独立样本 t检验或Mann-Whitney U检验。Pearson相关分析用于不同基因模块与临床性状之间的相关性分析。 结果::从3 678个差异基因中筛选出83个铁死亡相关差异基因。功能富集分析结果显示,这些基因参与铁死亡、长寿调节、自噬等信号通路。通过WGCNA分析方法从中筛选出17个铁死亡相关疾病特征基因。联合LASSO算法与SVM-RFE算法从17个疾病特征基因中筛选出3个铁死亡关键基因为PPARA、ABCC5、TSC1,并证明这些基因有很高的诊断效能。单基因GSEA分别展示了3个关键基因高低表达组中富集到的信号通路。从DGIdb数据库中筛选出20个相关药物并构建3个关键基因的药物调控网络。CIBERSORT结果显示,M1巨噬细胞、中性粒细胞等在PDR样本中浸润程度较高。结论::本研究分析鉴定出PDR中3个铁死亡关键基因,为进一步研究PDR的病理分子机制和诊断治疗靶点提供了新的思路与参考。
...不再出现此类内容
编辑人员丨4天前
-
综合生物信息学分析探索与哮喘严重程度相关的生物标志物
编辑人员丨4天前
本研究利用综合生物信息学方法寻找能够预测哮喘严重程度的新生物标志物。于2022年6至12月,在武汉大学中南医院过敏反应科开展并完成该临床医学研究。从高通量基因表达(Gene Expression Omnibus,GEO)数据库中筛选并下载基因芯片数据集GSE43696,使用R语言“affy”包和“rma”算法完成基因芯片数据预处理。利用“edgeR”包和“limma”包筛选出正常对照者、轻中度哮喘患者和重度哮喘患者两两之间的差异表达基因(differentially expressed genes,DEGs),然后用“clusterProfiler”包对差异表达基因进行GO功能富集分析和KEGG通路富集分析,最后用STRING网站构建差异表达基因的蛋白-蛋白互作(protein-protein interaction,PPI)网络,进一步筛选差异表达基因。使用R语言“WGCNA”包对数据集GSE43696进行加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA),筛选出与哮喘严重程度显著相关的模块,将WGCNA分析结果与PPI筛选的差异表达基因取交集得到关键(hub)基因。利用数据集GSE43696和GSE63142对hub基因表达量进行验证,依据ROC曲线评估诊断价值,并通过基因集富集分析(gene set enrichment analysis,GSEA)进一步明确数据集GSE43696中hub基因的潜在功能。结果显示,共筛选出251个DEGs,其中正常组和轻中度哮喘组39个,正常组和重度哮喘组178个,轻中度哮喘组和重度哮喘组34个,主要参与对有毒物质的反应、对氧化应激的反应、细胞外结构组织、细胞外基质组织等生物过程。筛选出两个与哮喘严重程度显著相关的模块(red模块, P=7e-6, r=0.43;pink模块, P=5e-8, r=-0.51),最终得到6个hub基因,包括 B3GNT6、 CEACAM5、 CCK、 ERBB2、 CSH1和 DPPA5。通过数据集GSE43696和GSE63142的基因表达水平比较和ROC曲线分析进一步验证了这6个hub基因,可能与o-聚糖生物合成、α-亚麻酸代谢、亚油酸代谢和戊糖葡萄糖酸的相互转化等过程相关。综上,通过多种生物信息学分析方法,本研究鉴定出与哮喘严重程度显著相关的6个hub基因,为哮喘的病情预测和靶向治疗提供了可能的新方向。
...不再出现此类内容
编辑人员丨4天前
-
基于加权基因共表达网络分析运动性精子结构域包含蛋白2在类风湿关节炎中的表达及与疾病活动度的相关性
编辑人员丨4天前
目的:利用加权基因共表达网络分析(WGCNA)及实验验证寻找RA相关的关键基因。方法:从GEO数据库下载了RA患者基因芯片数据,构建基因网络,利用WGCNA将基因划分为不同的模块,将与RA临床症状相关的模块中的关键基因进行了基因本体论分析。随后使用GEO不同的数据集用受试者工作特征曲线(ROC)评价关键基因对RA诊断的准确性。此外,还通过实时荧光定量反转录PCR(RT-PCR)及蛋白质印迹法验证关键基因在RA中的表达,分析其与DAS28的关系。采用配对样本 t检验和Pearson相关性分析对结果进行分析。 结果:共筛选出5 413个基因构建了加权基因共表达网络,将基因分为23个模块。其中,黑色模块与RA临床症状密切,包含346个基因。富集分析及京都基因与基因组百科全书(KEGG)信号通路分析显示其要富集于对IL-6的正调控、IL-1β分泌、破骨细胞分化、NOD样受体信号通路、辅助性T细胞(Th)17细胞分化等多个与RA密切相关的通路。其中运动性精子结构域包含蛋白2(MOSPD2)与临床症状具有明显相关性,在血液单核细胞、骨髓单核细胞中高表达( t=2.238, P=0.032; t=3.153, P=0.006),在RA关节滑膜液中与血液中表达呈正相关( r=0.683, P=0.03)。ROC曲线分析表明,MOSPD2能区分RA和对照组(曲线下面积分别为0.855和0.726)。RT-PCR及蛋白质印迹法结果显示,MOSPD2在RA患者中表达上调( t=-3.96, P=0.02)。MOSPD2在血液中的表达水平与RA患者的DAS28呈正相关( r=0.8846, P=0.0462)。 结论:MOSDP2与RA患者临床症状密切相关,可能是诊断及治疗RA的靶点之一。
...不再出现此类内容
编辑人员丨4天前
-
加权基因共表达网络分析黏附基因在腹主动脉瘤中相关机制
编辑人员丨4天前
目的:通过加权基因共表达网络分析揭示腹主动脉瘤(AAA)发生的潜在机制。方法:对数据库编号GSE47472和数据库编号GSE57691两个AAA转录组测序数据合并,进行基因差异表达分析得到差异基因,加权基因共表达网络分析(WGCNA)得到中心基因,两者取交集得到差异中心基因,并对其进行功能富集分析。建立小鼠AAA模型进行定量聚合酶链反应(qPCR)验证差异中心基因表达。使用GraphPad Prism 8进行统计分析。Kolmogorov-Smirnov检验数据正态性,采用独立样本 t检验分析基因差异表达。 结果:共筛选出745个差异表达基因,建立16个基因共表达模块,其中中心模块包含119个基因,取交集后共得到60差异中心基因。对差异中心基因进行功能富集分析结果示AAA中平滑肌增殖分化功能和细胞黏附功能相关基因低表达。低表达的细胞黏附相关基因为钙黏着蛋白-2(CDH2),(钙黏着蛋白-13)CDH13,整合素相互作用蛋白-2(FERMT2),Rho关联含卷曲螺旋结合蛋白激酶1(ROCK1),层黏蛋白α5(LAMA5),进行qPCR验证其表达差异显著性。相对表达倍数分别为FERMT2=0.31 ( t=2.454, P<0.05),ROCK1=0.22( t=3.686, P<0.05),LAMA5=0.45( t=3.168, P<0.05),CDH13=1.36( t=0.103, P>0.05),CDH2=1.71( t=0.702, P>0.05)。 结论:FERMT2、ROCK1、LAMA5低表达可能通过介导血管平滑肌细胞与细胞外基质间黏附作用异常参与AAA形成。
...不再出现此类内容
编辑人员丨4天前
-
基于加权基因共表达网络分析挖掘脑胶质瘤预后标志
编辑人员丨4天前
目的:为胶质瘤患者识别有效的生物标志物。方法:从中国脑胶质瘤基因计划谱(CGGA)下载附有完整临床随访信息的464例胶质瘤患者mRNA表达谱。加权基因共表达网络分析(WGCNA)用于识别出与胶质瘤WHO分级相关的基因模块,并同时进行单因素及多因素Cox回归分析鉴别出与胶质瘤患者生存相关的基因。结果:在加权基因共表达分析中,Brown模块与脑胶质瘤WHO分级呈正相关( r=0.55, P<0.01)。选择单因素分析中与患者临床预后最显著相关的5个基因(TAGLN2,IGFBP2,METTL7B,ARAP3,PLAT)进行多因素生存分析并建立预后模型,计算风险评分。受试者工作特征曲线证实该风险评分在预测胶质瘤患者1、3、5年生存率上具有高精准度。上述生存分析结果均在癌症基因组图谱(TCGA)数据库中得到验证。 结论:本研究确定了五个独立的脑胶质瘤预后因素(TAGLN2,IGFBP2,METTL7B,ARAP3及PLAT)并建立了预后模型,为临床判断胶质瘤患者预后提供新的思路。
...不再出现此类内容
编辑人员丨4天前
-
外周血差异表达基因用于慢性主观性耳鸣客观分型的可行性研究:以高频耳鸣为例
编辑人员丨4天前
目的:探讨联合加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis,WGCNA)及随机森林算法构建基于外周血差异表达基因(differentially expressed genes,DEGs)的主观性耳鸣客观分型模型的可行性。方法:2019年10月至2020年6月期间,对中山大学附属第三医院37例慢性主观性高频耳鸣患者(代偿型21例,失代偿型16例)及20名健康志愿者通过高通量测序获得外周血DEGs。采用WGCNA构建不同表达模式的基因模块,并分析各自与耳鸣特征之间的关系。随后采用随机森林算法构建分型模型,并通过受试者工作特征曲线下面积(area under the curve,AUC)、准确度和F1-score对分型性能进行评价。结果:12 351个组间DEGs被分成9个基因模块,其中MEblue、MEgreen和MEbrown与健康志愿者组呈负相关,MEpink与耳鸣困扰组呈正相关。基于MEblue及MEpink分别构建“耳鸣-正常”及“代偿-失代偿”分型模型,AUC均>0.80,准确度均>90%,F1-score均>0.90,分型性能良好。结论:外周血DEGs是慢性主观性耳鸣客观分型的潜在生物学指标,而WGCNA和随机森林算法的联合应用是构建慢性主观性耳鸣客观分型模型的可行方案。但模型的外延、跨数据集性能的验证,以及模型算法的优化仍需进一步探索并完善。
...不再出现此类内容
编辑人员丨4天前
-
去势抵抗性前列腺癌神经内分泌转化的关键基因的研究
编辑人员丨4天前
目的:通过生物信息学方法研究去势抵抗性前列腺癌发展成为神经内分泌性前列腺癌的关键基因。方法:从cBioPortal数据库下载前列腺癌的转录本测序数据,使用R语言和加权基因共表达网络分析(WGCNA)软件包进行数据分析,明确癌症类型相关性最高的基因集。对该基因集进行基因本体论(GO)分析和京都基因与基因组百科全书(KEGG)分析,明确该群基因和细胞周期及细胞分裂的相关性。再利用STRING数据库计算该基因集内基因的相关性,导入Cytoscape软件中构建基因网络,并计算出处于网络核心的前10个基因。然后在GSE105416数据集中验证这10个基因的表达。最后选择关键基因UBE2C和NUF2做GSEA分析。结果:鉴定了10个在前列腺癌神经内分泌转化中的关键基因,分别是BUB1、CDCA8、CENPF、HJURP、KIF23、KIF2C、NUF2、PTTG1、TPX2和UBE2C。结论:本研究对前列腺癌的神经内分泌转化提供了新视角,鉴定出关键基因可作用于影响前列腺癌细胞的细胞周期和AR信号通路来影响其神经内分泌转化。
...不再出现此类内容
编辑人员丨4天前
-
生物信息学分析慢性阻塞性肺疾病在肺癌中的影响
编辑人员丨4天前
目的:基于生物信息学分析慢性阻塞性肺疾病(COPD)状态对非小细胞肺癌(NSCLC)的影响,以期揭示COPD状态对非小细胞肺癌的影响。方法:从癌症基因组图谱数据库中下载161例肺癌患者的相关信息并根据病理类型与肺功能结果进行分组。在同一病理下,比较有无COPD的两组的差异。京都基因与基因组百科全书(KEGG)和基因本体论(GO)分析用于功能富集分析,进行加权共表达网络分析(WGCNA)并构建蛋白互作网络(PPI)筛选核心枢纽基因。所有计量资料组间比较采用 t检验,计数资料组间比较采用 χ2检验。 结果:本研究纳入了161例肺癌患者的样本数据。有、无COPD在临床特征、体细胞基因突变频率以及免疫细胞浸润上差异无统计学意义( P>0.05)。在鳞癌及腺癌中,COPD组别中大量代谢有关通路上调,而细胞趋化能力的调节等通路下调。后续WGCNA及PPI分析鉴定出钠离子通道α2亚基(SCN2A)、富酪蛋白(STATH)、细胞色素P450家族成员(CYP1A2及CYP1B1)、γ-氨基丁酸A型受体亚基(GABRA1)紧密连接蛋白17 (CLDN17)、调节突触膜胞吐蛋白1 (RIMS1)、维生素D结合蛋白(GC)以及血浆铜蓝蛋白(CP)可能是潜在枢纽基因。只有在腺癌中,COPD组的患者年龄组成比率上[<60岁:80.8%(21/26);>60岁:19.2%(5/26)]相比无COPD组[<60岁:56.1%(32/57);>60岁:43.9%(25/57)],结果差异有统计学意义( χ2=4.693, P<0.05)。 结论:COPD状态对肺癌的预后,体细胞突变等无贡献,并提出9个潜在的COPD型肺癌关键枢纽基因。
...不再出现此类内容
编辑人员丨4天前
-
基于加权基因共表达网络分析筛选儿童神经母细胞瘤中MYCN扩增相关基因
编辑人员丨4天前
目的:通过生物信息学分析探究儿童神经母细胞瘤中与MYCN(N-myc)基因相关的共表达基因。方法:下载TARGET数据库神经母细胞瘤表达数据共179例,WGCNA分析筛选MYCN扩增共表达基因模块;针对目标基因模块个基因行GO、KEGG富集分析筛选MYCN扩增相关基因可能参与生物过程及信号通路;以MYCN扩增状态将神经母细胞瘤表达数据分为扩增组65例、非扩增组114例,行差异表达基因分析;筛选的差异表达基因同MYCN扩增相关基因取交集后运用K-M法行生存分析(log-rank检验),筛选预后相关基因,Logistics回归探究MYCN扩增状态同预后基因的关系。结果:WGCNA分析提示MEgreenyellow模块同MYCN基因扩增状态相关性最强( R=0.46, P<0.05),为共表达基因,包含基因1 216个,富集分析提示MYCN扩增共表达基因多参与RNA相关通路(RNA的转运、剪切、修饰,RNA相关酶的活性等过程);差异表达基因分析显示,MYCN扩增组相较于非扩增组,基因表达上调47个,表达下调123个;WGCNA分析同差异表达基因取交集筛选出22个关键基因,行生存分析显示同预后相关的基因( P<0.05)有12个,其中DDX1与其他关键基因相关性相对较弱,或为神经母细胞瘤独立预后因素。 结论:LINC00839、ATP结合盒亚家族C4(ABCC4)、亚甲基四氢叶酸脱氢酶(NADP +依赖)2(MTHFD2)、磷酸甘油酸脱氢酶(PHGDH)、序列相似性家族13 A(FAM11A)、磷酸丝氨酸转氨酶1 (PSAT1)、假尿苷酸合酶7(PUS7)、DEAD-box解旋酶1(DDX1)、溶质载体有机阴离子转运蛋白家族5A1(SLCO5A1)、Junctophilin 1(JPH1)、溶质载体家族16 1(SLC16A1)、MYCN Opposite Strand(MYCNOS)为神经母细胞瘤中MYCN扩增的共表达基因,与较差的预后相关,是神经母细胞瘤潜在的治疗靶点及预后指标。
...不再出现此类内容
编辑人员丨4天前
-
基于内质网应激基因膀胱癌预后风险模型的构建
编辑人员丨4天前
目的:构建与膀胱癌预后相关基于内质网应激基因的临床基因模型。方法:在分子特征数据库(MSigDB)中筛选到9 165个与内质网应激相关的基因集,运用生物信息学技术对癌症基因图谱(TCGA)数据库中405个膀胱癌样本和25个正常膀胱组织样本的基因表达序列进行差异基因表达分析得到5 689个膀胱癌差异表达基因,两者取交集得到1 556个基因,然后进行WGCNA分析、STRING数据库及Cytoscape软件cytoHubba插件进行蛋白互作网络分析、LASSO回归分析、多因素Cox回归分析获取5个关键基因并构建风险模型预测膀胱癌患者的总生存期。后进行Kaplan-Meier生存分析及ROC分析以研究该模型的预测准确性。结果:两者取交集后共得到1 556个与内质网应激相关膀胱癌差异表达基因,WGCNA分析得到158个与膀胱癌预后相关的差异表达基因。Cytoscape软件CytoHubba插件计算每个基因的Degree评分,提取Top50的差异表达基因并进行LASSO回归分析、多因素Cox回归分析得到5个关键基因:KIF2C、TEAD4、DARS2、VEGFA、CTHRC1,并构建预后风险模型,根据模型表达式计算各样本的风险评分。以风险评分中位数将膀胱癌患者分为高、低两组。进一步Kaplan-Meier生存分析显示不同亚组间的总生存期差异有统计学意义( P<0.05)。且ROC分析显示该模型对膀胱癌患者总生存期预测准确性较高。 结论:KIF2C、TEAD4、DARS2、VEGFA、CTHRC1是与膀胱癌预后相关的内质网应激基因,且构建的预后风险模型在对膀胱癌患者总生存期的预测方面表现出较为优异的准确性。
...不再出现此类内容
编辑人员丨4天前
