科研星球

直接出lncRNA与预后相关的生存曲线图的工具,lnCAR数据库使用指南

640.png


lnCAR数据库(https://lncar.renlab.org/)是由中山大学的学者开发,相关文章(PMID: 30786995)于2019年4月发表在Cancer Research杂志(2019IF=9.727)上,截至2021-02-02该文章已引用6次(数据来源:PubMed )。


640 (1).png


从标题我就能知道该数据库的数据来源是芯片,这也意味着该数据库做出的图可以直接和TCGA、oncomine等数据库相互印证。下图展示了lnCAR数据库所使用到的所有资源信息及其链接。


640 (2).png


目前,lnCAR数据库收集整理了来自GEO数据库中的10种肿瘤(膀胱癌、乳腺癌癌、宫颈癌、结肠癌、食管癌、胃癌、肝癌、肺癌、卵巢癌和前列腺癌)的52306个样本的差异表达分析和12883个样本的生存分析。


下图汇总了该数据库目前的各个癌种的差异分析和生存分析的样本数。通过这个数据库,我们可以快速查阅感兴趣lncRNA在不同癌症、不同条件的差异表达情况以及生存预后信息。


640 (3).png


在lnCAR数据库中,开发者们系统地收集了GEO数据库中上述的10种肿瘤下相关数据,包括与肿瘤状态、分级、分期、转移、治疗、生存期等相关临床参数的数据。开发者们只保留有明显临床信息的样本,并对芯片数据进行重注释和表达值的标准化,之后再进行差异表达分析和生存分析。


开发者们将差异表达分析分为以下几种情况:癌症与正常对照组、高分期与低分期、高分级与低分级、转移与原发性、药物治疗与对照组以及其他特征。其他特征指的是肿瘤特异性特征,如乳腺癌中的雌激素受体、孕激素受体和HER2状态;肺癌和食管癌中的吸烟和饮酒状态。开发者们用limma包进行不同条件下的差异表达分析。


开发者们收集的生存数据包括:总生存率(OS)、无复发生存率(RFS)、无转移生存率(MFS)和无进展生存率(PFS)。开发者们是用survival包来进行生存分析的。


640 (4).png


上图展示了该数据库的内部运算流程。下面,我们就一起来看一下这个好用的数据库吧!


640 (5).png


进入到EXPLORE模块下,主要有差异表达分析和生存分析两大类。页面默认展示了多个基因(首字母排序)在数据库收录的10个癌种中在癌症与正常对照组的差异表达。在热图的左上角可以进行癌种(包括亚类)限制,在右侧可以直接进行检索。我们这里以HOTAIR在三阴性乳腺癌为例进行演示。


640 (7).png


点击表达值的选项框(就是上图的“5.2101”)即可进入详情页面,主要包括基本信息、转录信息、差异表达信息和外部实验验证四部分。


640 (6).png

640 (8).png


点击结构下面的超链接还可以直接查看二级结构,并对其进行下载保存(目前支持.svg、.png和.json三种格式)。


640 (9).png


差异表达信息页面显示了该lncRNA在不同数据集中的主要信息,在表格的右上角也可以进行不同类型格式的下载和保存。


640 (10).png


在任意一个数据集的view下面的超链接我们可以直接看到该lncRNA在该数据集中的表达情况的柱状图,在图形的右上角可直接进行下载保存。


640 (12).png


除了差异表达的柱状图,还提供了共表达网络、KEGG通路分析和ceRNA网络图,感兴趣的小伙伴可以关注一下。


640 (11).png640 (13).png640 (14).png


外部实验验证部分,可以看到该lncRNA的验证方法和相关文献和详细描述。数据库居然还有外部验证,是不是很惊喜啊?


640 (15).png


接着,我们来看生存分析。同样以HOTAIR在三阴性乳腺癌为例进行演示,这里我们选择的是OS。


640 (18).png


点击表达值的选项框(就是上图的“0.2253”)即可进入详情页面,主要包括基本信息、转录信息和生存分析三部分,其中基本信息和转录信息两部分去差异表达里面的一致。我们直接来看生存分析。


640 (16).png


在任意一个数据集的view下面的超链接我们可以直接看到该lncRNA在该数据集中的生存分析图,在图形的右上角可直接进行下载保存。


640 (17).png


该数据库的另外一个模式就是My lncRNA,主要是对新发现的lncRNA进行检索。


下载.jpeg


我们以乳腺癌和chr12:53962000-53975000;53980000-53990000为例进行演示。


下载 (1).jpeg

下载 (2).jpeg

下载 (3).jpeg


结果展示与EXPLORE模块结果类似,只是在差异表达分析的展示里面少了给ceRNA。


总的来说,lnCAR是一个全面的数据库,专门用于通过重新注释芯片探针来显示人类癌症的差异表达谱和预后状况。lnCAR数据库将差异表达分析、生存分析、共表达分析、KEGG通路富集分析和ceRNA分析和相结合,探讨感兴趣的lncRNAs(包括注释的lncRNA或任何用户定义的lncRNA)的功能。


除了基本的转录信息、结构和保守评分外,开发者们还将低通量数据,如实时PCR和northern杂交,整合到lnCAR中作为验证数据集。此外,该数据库还嵌入了多个统计图,用于可视化分析结果。




撰文丨阿波没有罗,来源于解螺旋


没有账号?