科研星球

APA相关的数据库SNP2APA使用指南

APA是一种重要的转录后调控,它识别不同的多聚腺苷酸化信号(PASs),产生具有不同3’-UTR的转录产物,从而影响一系列生物过程和功能。最近的研究表明,一些单核苷酸多态性(SNP)可能通过调节APA而促进肿瘤的发生和发展。然而,SNP和APA在人类癌症中的相关性在很大程度上仍然未知。华中农业大学的龚静教授研究团队开发了SNP2APA数据库(http://gong_lab.hzau.edu.cn/SNP2APA/)来提高我们对人类癌症中基因变异和APA的理解。


0.png

SNP2APA数据库的开发者来自华中农业大学,数据库相关文章(PMID: 31511885)于2020年1月发表在Nucleic Acids Research期刊(2020IF=16.971)上。截至2021-08-14该数据库相关文章已引用7次(数据来源:PubMed)。

0 (1).png

0 (2).png

开发者们使用来自TCGA和TC3A的9082个样本的基因型和APA数据,系统地鉴定了影响32种癌症类型APA事件的SNP,并将其定义为APA数量性状位点(APA quantitative trait loci,apaQTL)。结果,共鉴定出467942个顺式apaQTL和30721个反式apaQTL。通过整合APAQTL与生存和全基因组关联研究(GWAS)数据,开发者们进一步确定了2154个与患者生存时间相关的apaQTL和151342个位于GWAS基因座的apaQTL。此外,开发者们还利用PAS基序预测工具设计了一个在线工具来预测SNP对PAS的影响。

0 (7).png

根据前面提到的数据库的流程,我们知道该数据库就主要包括了以下四种数据类型:顺式apaQTL(cis-apaQTLs)反式apaQTL(trans-apaQTLs)生存相关的apaQTL(survival apaQTLs)和位于GWAS基因座的apaQTL(GWAS-apaQTLs)

0 (3).png

这里显示了不同apaQTL的数量以及其在32种癌种中的分布情况。

现在我们直接以顺势apaQTL来进行操作。

0 (4).png

页面显示了该数据库的cis-apaQTLs的筛选条件,即FDR<0.05并且|r|≥0.3。
首先在癌种的下拉菜单选择相应的癌种(这里选择的是乳腺癌BRCA)。

0 (5).png

只输入癌种信息,我就就会得到一个包含了所有顺势apaQTL在该癌种中的列表。该表一共有11列,从左至右依次为癌种、SNP ID、SNP位置、等位基因、APA事件、APA的基因名、APA位置、beta值(是数据库线性回归统计后的数值)、P值、r值和浏览。
0 (6).png

点击浏览列下面的Box Plot即可显示该SNP的柱状图,右上角还有直接下载的按钮。

0 (8).png

当然,该数据库也支持用户直接下载列表里面的所有数据。

0 (9).png

接下来我们再来看一下生存相关的apaQTL(survival apaQTLs)。

同样,首先在癌种的下拉菜单选择相应的癌种(这里选择的是膀胱尿路上皮癌BLCA)。
0 (10).png
筛选后得到3个BLCA的生存相关的apaQTL。数据的呈现形式与之前的顺势apaQTL类似,一共包含了10列信息,从左至右依次为癌种、SNP ID、SNP位置、等位基因、样本量、生存分析的统计KM的P值、AA的OS的中位生存时间、Aa的OS的中位生存时间、aa的OS的中位生存时间和浏览。

0 (11).png

点击浏览列下面的KM Plot即可显示该SNP的生存曲线,右下角还有直接下载的按钮。

0 (12).png

同样,也支持全部数据的excel表格下载。

0 (13).png

当然,我们可以直接在首页的下面页面下载所有的相关数据。

总的来说,开发者们帮我们整理了来自TCGA和TC3A数据库的32癌种的相关数据,并整合为不同的apaQTL。用户只需要进行简单的检索就能直出发表级的图片,可以说是非常友好的了。

文章来源:解螺旋

没有账号?