科研星球

在线聚类分析网站,COMSUC使用指南

对于高维度的数据分析而言,例如RNA-seq的数据。我们在得到数据想要解释不同分组之间的差异的基因。往往都需要逐渐的降维来进行解释。最普遍的方法通过差异分析—富集分析这样的也算是一种逐步降维的操作。这样这样的分析,也有可能聚焦到很多个目标当中,比如一个通路当中有很多个基因。因为为了更好的解释高维度的数据,也就有了基因分型这样的分析方法。


简单来说的基因分型,就是各种算法的无监督的聚类分析。对于一个RNA-seq的数据,基于每个样本当中不同的基因特征,把所有检测的样本分成不同的组(亚型)。例如昨天介绍的那个文献,就是基于免疫相关基因把胰腺癌分成了5个亚型


0.jpeg


对于聚类分析而言,如果要实现的话,用的最多的还是R或者python。涉及到代码的话,就需要一定的门槛。所以今天就给大家介绍一个在线的用于基因聚类分析的网站:COMSUC http://comsuc.bioinforai.tech/analysisTab 


0 (1).jpeg


内置算法和数据集


如果只是用来分析一些,基本的公共数据的话。例如,TCGA、ICGC、TARGET。在COMSUC当中提供了原始的数据。所以可以用来直接分析。


0 (3).jpeg

当然如果想要特异性的分析一些数据的话,那上传自己的数据。具体格式要求的话,可以参照数据库里面的介绍:[http://comsuc.bioinforai.tech/manualTab/Html/General  ]


另外对于不同的聚类得到的结果是不一样的。至于说那个聚类算法好,这个具体分析具体看。在这个数据库当中,一共提供了8种不同的算法可以使用。


0 (2).jpeg

同时在共识聚类当中,也提供了三种算法。

0 (5).jpeg



数据库使用


对于数据库的时候的话,如果是使用内置数据集。就基于我们的想要分析的内容进行适当的选择即可。例如,我想要分析:TCGA在ACC癌当中基于mRNA数据来进行Kmeans聚类分析的结果

0 (4).jpeg

结果展示的话,主要是成分成四个部分。


  1. 1.样本网络展示,这这个部分,我们可以查看不同样本之间基于聚类的网络是什么样子的。同时,我们在网站的右边还可以自定义可视化结果。以及下载相关的图片。

  2. 0 (6).jpeg

  3. 2.样本相关性分析图,除了网络图展示不同样本之间的关系之外。还可以展示不同样本之间的相关矩阵
    0 (7).jpeg

  4. 3.如果是使用TCGA数据的话,里面有预后信息。我们还可以分析不同分型和预后的关系。
    0 (8).jpeg

  5. 4.不同分型之间存在差异基因。由于基因分型其实就是不同的分组。所以基于不同的分组我们可以寻找差异基因。这里也就展示了那些基因是有差异的。


  6. 0 (9).jpeg


  7. 以上就是这个数据库可以展示出来的结果。对于数据库分析的所有结果。我们都可以通过Download下载下来。


  8. 0 (10).jpeg


总结

这个网站,给我们提供了可以不用代码就可以进行基因分型分析的方法。如果想要进行相关的基因分型分析的话。可以尝试一下这个网站哦。


没有账号?