科研星球

9分文献解读,利用基因相关网络分析确定特发性肺纤维化的调控因素

今天跟大家分享一篇发表在Throx(IF=9.6+)上的文献。文章利用 Lung Tissue Research Consortium dataset以及GEO dataset,分析并确定了特发性肺纤维化(IPF)的基因调控网络及其与肺功能的关系,并确定了与生存相关的模块。


题目:Gene correlation network analysis to identify regulatory factors in idiopathic pulmonary fibrosis

利用基因相关网络分析确定特发性肺纤维化的调控因素


摘要



本文利用Lung Tissue Research Consortium dataset的262个特发性肺纤维化(IPF)数据为实验组,GSE47460数据集作为对照组,分别随机分为非重叠的两组进行交叉验证差异基因的表达。通过差异表达基因,对两个IPF组应用一致性加权基因共表达分析(WGCNA),识别出了两组IPF重叠的共表达基因模块,然后分别进行肺功能、生物学功能和转录因子调控等方面分析。并进一步识别相关的转录因子及microRNA,构建模块、转录因子及microRNA的调控网络。最后采用多变量Cox比例风险模型,利用外周血基因表达数据集(GSE93606)评估IPF的临床相关性,确定了与生存相关的模块。




流程图



640.png


1. 数据的获取和整理

所有数据均来自Lung Tissue Research Consortium dataset以及GEO dataset(GSE47460,GSE72967和GSE93606)。


2. 差异基因表达

作者将每组IPF与两组对照组分别进行比较,确定差异表达基因。在15180个基因中,有10 237个基因在至少一次比较中被鉴定为显著,6425个基因在所有四次比较中被鉴定为显著(见图2A)。随后对这些基因进行主成分分析,结果显示IPF组和对照组的样品有重叠,且有良好的分离指规数及调控(见图2B)。


下载.jpeg

图2


3.WGCNA构建基因共表达网络识别与IPF相关的模块

使用R/Bioconductor,对两组IPF差异共表达基因进行一致性WGCNA分析,作者确定了与IPF相关的16个模块,其中6个模块在IPF中上调,10个模块下调(见图2C)。模块与临床特征相关性结果显示:肺功能与9个模块相关;DLCO与ME3、ME4、ME5、ME14呈负相关,与ME2、ME10、ME13、ME16呈正相关;FVC与ME4、ME5、ME9呈负相关,与ME10、ME16呈正相关。而对照样本中不存在显著的相关性,结果见图3。


640 (1).png

图3


4. 模块的生物学功能分析

为进一步明确各模块密切相关的生物学功能,对模块内基因进行功能及通路富集分析,结果如下:免疫应答(ME5、ME7、ME9、ME11、ME12);细胞外基质或收缩纤维(ME3, ME6, ME13,ME14);特定肺结构的发育途径(ME1 ME2);细胞分裂,DNA复制和DNA修复(ME4);细胞代谢和分解代谢过程(ME8, ME15,ME16)以及表面活性物质代谢(ME10),结果见表3。


1.png
表3

5.  模块调控分析

为明确各模块的生物调控网络,作者首先通过Cytoscape 的iRegulon V.1.3 插件鉴定各模块转录因子,随后利用GSE47460和GSE72967数据集识别与各模块相关的microRNA (miRNA)的表达,并使用multiMIR数据库目标数据集(miRTarBase)识别与每个模块的miRNAs相关的目标基因。最终,16个模块分别富集了25个转录因子和21个miRNA,并在Cytoscape中绘制了模块和转录因子的调控网络,以确定模块之间共有的调控因子(见图4)。


4.png

图4

注:每个模块的富集转录因子(白色)和相关miRNA(黄色)网络。疾病中上调的模块用矩形表示,疾病中下调的模块用六边形表示。生物功能分类为免疫反应(蓝色)和纤维化(绿色),其余模块标记为紫色。


6. 生存分析

为明确各模块与生存率的关系,作者以GSE93606数据集的57例IPF患者外周血RNA表达谱为独立队列,采用多变量Cox’s比例风险模型评估了各个模块在预测生存率方面的影响。在16个模块中,发现4个模块与生存显著相关(ME1 p=0.038, ME8 p=0.008, ME9 p=0.042, ME12 p=0.041)。多因素Cox的风险比例模型应用于这四个模块,分析显示ME1与生存率的相关性最大(见图5)。

图5A:GSE93606 IPF数据集外周血RNA表达数据的Discriminative dimension reduction (DDR)图,采用K-means聚类将样本分为两组(黄色和紫色);

图5B:基因表达热图;

图5C:外周血中模块ME1基因高低表达两组(k-means聚类)的Kaplan-Meier曲线;
5.png

图5




结语



既往有使用转录组分析IPF的相关研究,但所使用的方法通常是单独测试基因,而在体内,基因功能是通过具有类似生物学功能的共表达基因网络来实现的。基于此,作者通过公共数据库,确定了IPF中相关调控因子的相关基因表达网络,为该疾病的病理过程提供了新的见解。文章思路清晰,技术路线明确,为WGCNA分析联合基因表达调控网络分析的一个较好的模板,值得一品。


文章来源:科研发文助手

没有账号?