科研星球

GSCA(Gene Set Cancer Analysis)强大的生信分析网站,完全使用指南

GSCA(Gene Set Cancer Analysis)是一个综合单基因分析、多基因分析、免疫浸润分析、突变分析、药物敏感性分析的交叉式综合性癌症分析数据库,包含了TCGA和GDSC的33种类型癌症数据。之前我们对旧版的GSCA做过详细的使用讲解,而最近,GSCA数据库进行了全新的升级,原本的绿色主调也全部改为红色,功能也更加强大。


在更新版本中,网站进一步加强了基因组(基因表达,SNV,CNV和甲基化)和免疫基因组(包括24个免疫细胞)的分析。此外,网站将基因与临床信息750多种小分子药物紧密结合,因此我们可以挖掘候选生物标志物和有价值的小分子药物,为更好的进行实验设计和进一步的临床试验提供了帮助。



GSCA网址:http://bioinfo.life.hust.edu.cn/GSCA/#/ 


点击链接,进入网站首页我们可以看到GSCA数据库主要分为四个模块,包括基因表达模块免疫模块突变模块药物敏感性模块

0.png

一、表达模块

在表达模块中,我们既可以做单基因分析也可以做多基因/基因家族分析。
我们以多基因分析为例:
1.单击Expression模块
2.输入想要分析的基因集,例如“PCTP,PODXL,PPY,PTGS2,RCAN1,SLC4A7,THBD”。
3.选择要进行研究的癌症类型,可以是一种或多种,例如“LUAD,LUSC,KIRC,KIRP”。
4.选择分析类型。
5.点击“submit”得出分析结果。

0 (2).png

1.基因差异表达
气泡图展示了肿瘤组织与癌旁组织之间基因集的表达差异。气泡的颜色变化代表肿瘤组织与正常组织之间基因表达倍数的变化。分析结果以FC> 2和显著性FDR<0.05为过滤条件,气泡的大小表示FDR值大小。

0 (1).png

点击左侧表格中癌症名称如图中“BLCA”,会展示出该基因在这种癌症中的差异表达柱状图。

0 (3).png

点击左侧表格中某个基因的名称,会展示出该基因在33种癌症中的差异表达情况。

0 (9).png

2.基因表达与生存的相关性
该模块能够展示基因高表达和低表达患者的OS和PFS差异。颜色越红表示预后越差,气泡的大小代表统计显著性。被黑色轮廓线圈起的点表示Logrank P<0.05。

0 (8).png

通过单击左侧结果列表种某个基因按钮如“AFP”,可以获取某癌症中该基因高表达和低表达患者的Kaplan-Meier生存曲线。

0 (5).png

3.基因表达与癌症分期之间的关系
该模块展示了基因表达差异与癌症分期间的相关性。气泡颜色代表FDR值的大小。被黑色轮廓线圈起的点表示FDR<0.05。

0 (4).png 
通过单击左侧结果列表中的某个基因按钮,可以得到该基因在某癌症不同分期的表达情况。

0 (6).png

4.基因表达与癌症亚型之间的相关性
该模块展示了不同癌症亚型中基因表达的情况。气泡颜色代表FDR值的大小。

0 (7).png

单击左侧结果列表中基因名,可以通过箱形图获了解该基因在不同癌症亚型中的详细表达分布。

0 (10).png

5.GSEA(基因集富集分析)
条形图展示了所输入的基因集在这些癌症中的富集得分。

0 (11).png

通过单击左侧结果列表中的某个癌症按钮,即可得到富集图。

0 (12).png

6.GSVA评分和生存的相关性
结果图展示了高GSVA评分和低GSVA评分患者预后情况,气泡颜色代表HR值,被黑色轮廓线圈起的点表示Logrank P<0.05。

0 (13).png

通过点击左侧结果列表中某一癌症类型按钮可以查看具体的Kaplan-Meier生存曲线图,包括OS和PFS。

0 (14).png

   二、免疫模块

在免疫模块中,我们探索免疫细胞浸润与基因组特征之间的相关性,包括:mRNA表达、SNV、CNV和甲基化。

0 (15).png

1.基因表达与免疫浸润的相关性

气泡的颜色代表相关性的大小,颜色越红代表成正相关,蓝色越蓝代表成负相关。气泡大小表示显著性的大小。被黑色轮廓线圈起的点表示FDR<0.05。

0 (16).png
0 (17).png

通过单击表格中的任意基因按钮,可以得到单个基因与免疫细胞相关性的散点图。

0 (18).png

我们不仅可以查看mRNA 表达与免疫细胞的相关性,我们还可以考察SNV、CNV、甲基化与免疫的相关性,操作方法与上面相同。

   三、突变模块

在该模块中,我们可以分析基因集在不同癌症中的突变情况,此外我们还可以分析基因突变与患者预后和基因表达量的相关性。

0 (19).png

1.SNV(单核苷酸变异)
热图向我们展示了基因集在不同癌症中的SNV频率。

0 (20).png

通过单击左侧结果列表中的某个基因按钮,可以显示基因突变具体位点,类型和数量。

0 (21).png

还可以展示基因水平的变异数量和类型以及TI和TV突变详细信息。

0 (22).png

2.单基因SNV与生存
该模块提供了基因突变型和野生型患者的预后情况。气泡颜色越红代表风险越高,气泡的大小代表统计显著性的大小。被黑色轮廓线圈起的点表示FDR<0.05。
0 (23).png

点击结果列表中的任意基因按钮,可以得到该基因野生型和突变型的Kaplan-Meier生存曲线。

0 (24).png

   三、药物模块

在药物这个模块中,我们可以研究mRNA表达与药物IC50之间的相关性。主要研究的药物数据库有两个GDSC和CTRP。

0 (25).png

气泡图展示了基因表达与药物敏感性的关系。气泡的颜色代表mRNA表达与IC50之间的相关性,气泡大小与FDR显著性成正相关,被黑色轮廓线圈起的点表示FDR<0.05。


0 (26).png

到这里GSCA的网站使用教程就结束了。GSCA是一个具有超多功能的综合型癌症分析数据库,解放了被R语言束缚的双手,不会编程也照样能发高分的SCI,GSCA也是做泛癌分析的最佳工具,泛癌分析数据量大,耗时长,易出错,其分析过程十分耗费时间和精力,使用GSCA数据库可以快速出图,不必反复整理冗杂的数据,点一点鼠标瞬间出图。

同时GSCA也是基因集/基因家族分析的超强工具,不仅可以做表达分析和预后分析,还可以做免疫、突变和药物敏感性分析,绝对吸引审稿人的眼球,GSCA真的是一个科研人员快速发文利器!



没有账号?