科研星球

多组学在线分析工具,OmicsAnalyst

随着高通量测序技术种类的越来越多,我们经常会拿到相关样本的不同组学的数据。那拿 TCGA 的数据库而言,对于同一个患者,就检测了RNA-seq, miRNA-seq, 甲基化芯片等等多组学的数据。对于这样有多组学数据的情况,除了基本的单一组学的分析,也可以尝试着融合多个组学一起分析。所以,今天就介绍一个多组学分析的工具。OmicsAnalyst (https://www.omicsanalyst.ca/OmicsAnalyst/home.xhtml)

0 (1).png

OmicsAnalyst 使用

数据上传

在进入 OmicsAnalyst 的网址之后,我们点击其中的 GET STARTED 就可以使用进行分析了。由于是从开开始分析的工具,所以第一步也就是来上传原始数据。在 OmicsAnalyst 当中主要支持五种高通量测序的数据分析。在数据上传的同时,OmicsAnalyst 还对上传的数据进行了一些简单的处理比如:缺失值处理,低表达数据过滤,组间分析

0.png

由于也是在线工具类的,不会特别的智能,所以也一定要满足这个工具的要求。具体的上传的数据格式可见:https://www.omicsanalyst.ca/OmicsAnalyst/docs/FaqView.xhtml

这里我们使用tcga数据库当中的RNA-seq以及miRNA-seq数据进行后续分析。

数据质量检查

对于上传的数据,第一步也是要对上传的数据来一个整体的观察。探索性数据分析的话,一般也就是来看一下数据分析以及通过降维分析来观察数据之间的分组分布。在 OmicsAnalyst 当中,我们可以观察数据的密度分布以及通过 PCA以及t-SNE 来观察降维之后各个样本的分布。

0 (2).png

以上就是简单的观察上传的数据的分布,并不能通过观察之后如果发现批次效应之后进行批次去除。所以建议这里上传去除批次之后的数据。

结果展示

相关网络构建

对于不同组学之间的关联性分析,可以通过相互作用网络来进行构建。具体的过程主要是先通过单变量或者多变量分析来选择差异特征(基因)。进一步对不同组学当中有差异的特征进行相关分析。
在进行的计算过程中,包括了多种进行相关分析的算法来进行分析。

0 (8).png

经过分析。就可以得到不同组学当中的的相关网络了。

0 (4).png

聚类热图分析

在这个分析结果当中,可以观察基于多组学的数据各个样本的聚类分析的结果。这样的结果可以用来当作多组学的分子分型。

0 (5).png

在聚类热图当中,除了可查看不同基因的聚类结果。同时也可以对这些基因结果进行富集分析。进一步如果有感兴趣的通路也可以标注在热图上。

0 (3).png

降维分析

之前的质量评估的时候,通过降维分析来了解不同组学的数据特征。现在的降维是在多组学数据融合的基础上来进行降维的。

最后可以在一个三维的散点图上观察降维分析的结果。

0 (7).png

总的来说

以上就是这个工具的主要使用过程了,OmicsAnalyst 主要还是用于对多组学的数据联合分析的时候,寻找多组学之间的联系(相关分析)或者通过聚类来寻找相关的多组学基因分型的时候可以使用。



没有账号?