科研星球

lncRNA查询数据库,LncRNome使用指南

今天我们介绍一个lncRNA查询数据库----LncRNome数据库,方便大家在检索的时候可以将内容互相比对,增加可信度。俗话说的好,小孩子才做选择,大人我全都要。过完了六一,成熟的你还不把他纳入囊中吗?

数据库的网址为
http://genome.igib.res.in/lncRNome/

大家在使用的时候也不要忘记引用参考文献哦~
lncRNome: a comprehensive knowledgebase of human long noncoding RNAs.[J]. Database the Journal of Biological Databases & Curation, 2013.



一、LncRNome数据库基本介绍

LncRNome数据库由隔壁疫情正陷入水深火热的印度人民所构建,也不知道是啥原因,自2012年开发以来就更新过一次,从此再无动静,让人匪夷所思,可以说是这个数据库最大的槽点了吧。祝他们早日战胜疫情,世界和平,Love & Peace~


回到正题,LncRNome是一个综合性的注释人类长链非编码RNA的数据库,包含超过17000多个lncRNA的信息,涵盖了lncRNA类型,染色体位置,生物学功能以及疾病相关等内容。此外,数据库还提供了lncRNA—蛋白互作的资料以及突变信息。有一说一,对于这个这么老的数据库我还忍痛介绍它最主要的一个原因就是,它根据CLIP-seq数据集提供了蛋白互作的内容,补充了LncBook数据库的缺憾。上周阿波没有罗老师关于CatRapid数据库的推文介绍了如何预测lncRNA结合蛋白,但是这个数据库它慢啊,所以这里给大家提供一个新的备选~数据库所收纳的12种不同类型的lncRNA可以参考下图:


0 (6).png



二、LncRNome数据库使用说明

入网址http://genome.igib.res.in/lncRNome/,进入数据库主页面:


0 (2).png


大家有没有发现,LncRNome数据库居!然!没!有!菜!单!栏!整个数据库需要我们做的就是:敲几个字母或者点一点,换言之,仅检索模块可供我们使用。检索模块又分为两个部分,分别是最上面的“Search for lncRNAs”检索框以及下面的一溜“Browse”功能。“Browse”可以按染色体序号、lncRNA类型、以及结构进行检索。



1

“Search for lncRNAs”


在进行lncRNA检索前,大家可以参照下方的示例分子事先明确可以输入的ID类型有哪些,包括lncRNA ID,转录本ID等。


0 (8).png


我们以示例分子HOTAIR为例,点击“提交”:


0 (4).png


页面刷新后可以看到结果页面一共分为6个板块:“General”,“Sequence & Structure”,“Interaction & Processing”,“Variations & Conservation”,“Epigenetic Modifications”以及“Browser”等。当前页面介绍了HOTAIR的基本信息,包括HOTAIR的名称、类型、染色体定位、正/反义链、长度、相关疾病以及文献等信息。大家可以重点关注一下最后关于这个lncRNA的描述,疾病关联以及互作内容,对于探究lncRNA的机制有极大帮助:


0 (5).png


点击“Sequence & Structure”可以查看lncRNA的序列以及二级结构。序列信息从UCSC浏览器下载得到,二级结构则由Vienna包(版本1.8.5)分析得到。


0 (9).png


点击“Interaction & Processing”可以查看HOTAIR可以结合的蛋白以及结合位点:


0 (10).png


点击“Variations & Conservation”可以查看lncRNA的SNP突变信息(来自dbSNP数据库)以及Phastcons保守性评分:


0 (11).png


点击“Epigenetic Modifications”可以查看HOTAIR表观遗传修饰的信息,包括PBMC细胞系中组蛋白甲基化位点:


0 (12).png


“Browser”功能目前无法使用,因此不予以展示。


点击检索框旁的“Advanced Search”可以使用高级检索,通过对染色体起始位置,lncRNA类型等进一步限制从而检索:


0 (13).png



2

 “Browse”功能


看过“Search”功能下的结果展示页面,其实该数据库其他功能返回的页面均大同小异。我们接下来看一下如何使用“Browse”功能即可。


在“Browse by Chromosomes”处,点击相应的染色体编号即可查看该染色体可以转录出的lncRNA有哪些。


0 (14).png


我们点击第一条染色体查看,页面刷新后显示了1号染色体上所有转录出来的lncRNA,点击第一列“Transcript ID”下的超链接可以进一步查看详细信息,结果同前,不再赘述。


0 (15).png


这里还有一个小trick,用户可以通过勾选下方感兴趣的lncRNA前方的白色小方框进行

选择,然后点击上方菜单栏的“Retrieve Fasta”批量下载序列文件:


0 (16).png


用户还可以根据lncRNA类型来进行检索。数据库所收录的lncRNA类型如下图所示。

结果页面同前所述,此处不再赘述。


0 (17).png


0 (6).png


LncRNome数据库比较新颖的是,还可以根据lncRNA的结构进行检索,如lncRNA是

否包含发卡结构(Hairpins)或者四链体结构(Quadruplexes)。数据库开发团队早先发现lncRNAs中的G-四链体结构(G-Quadruplexes)具有潜在的调控功能,因此使用Quadfinder对lncRNA中是否具有该结构进行了预测。发卡结构则是由HairpinFetcher预测得到。


0 (18).png


好啦,LncRNome数据库我们就介绍到这里了~再次提醒一下大家,这个数据库收录的信息有点落后,所以大家可以作为备胎,切不可放在正宫地位,用来作为其他数据库的参考资料那是再好不过了~


没有账号?