科研星球

MNDR:ncRNA与疾病相关的综合数据资源与分析平台详细使用教程

众所周知,非编码RNA(ncRNA)的功能与疾病密切相关。近年来,ncRNA作为肿瘤靶点和药物靶标等参与到多种疾病的诊疗方案中,与之相关的疾病研究如癌症中某些长非编码RNA(lncRNA)可能存在潜在的治疗靶标以及具有特定的临床应用,如已有研究报道一些microRNA(miRNA)在耐药性中起重要作用。对于更喜欢精准吃瓜的科研小伙伴来说,除了在海量文献中一篇篇查找以外,何不先看看这个能够提供超过100万条哺乳动物(划重点)ncRNA与疾病相关的综合数据资源与分析平台-MNDR (mammal ncRNA–disease repository)呢?网址送上:http://www.rna-society.org/mndr/。




数据信息


总条目>100万条;物种:11种;ncRNA类型:5种;疾病种类:1614种;其次提供了多种验证方式实验验证、计算预测)和拓展信息(互作/定位等)最后该平台还内嵌了3种在线预测工具。不难发现,平台关注的不仅仅是这里有什么,还有你想要什么。
640 (2).png        
640 (1).png




如何精准吃“瓜”?


先看主页,了解一下都有哪些有意思的功能。整个平台界面看上去还是比较整洁有序,顶端设置了功能栏,下面分4个区域排列了平台介绍、数据统计、最新公告和相关项目。
640 (9).png 
接下来就可以开始体验平台的应用性如何了~
精准吃瓜第一步:Search-Exact Search
对于不喜欢弯弯绕绕的小伙伴,直接精确搜索应该是最为喜欢的了,关键词Keyword有四种类型可供选择(ncRNA SymbolncRNA IDDisease NameDisease Ontology ID/MeSH ID)。
640 (3).png 
关键词输入规则如下图所示,想精确搜索又总是记不住标准名称也不怕,可以点击红色字体的相应数据库链接跳转,进行确认后复制粘贴回该网站就好啦。
 640.png
一个关键词对应的数据还是很多怎么办,我们还有可以用来进一步限定搜索范围的选项:(1)Category:ncRNA的类型;(2Species:物种;(3)Data Source:数据来源,分为实验验证和计算预测两种;(4)Experimental Method:实验方法,分为全部、强实验验证方法、弱实验验证方法三种,关于强弱方法的区别参见“Statistics”页面中的表格“Experimental methods associated ncRNA-disease entries”。(5Score:打分,辅助筛选任意置信度的数据条目,对打分感兴趣的小伙伴可以参见“Help”页面“Q8 Detailed description of the MNDR Scoring System”。
640 (4).png 
精准吃瓜第二步:顺藤摸瓜
以感兴趣的疾病为关键词举个例子:如下组合'acquired immunodeficiency syndrome' & 'All'& 'Homo sapiens' & 'Strong Experimental Evidence' & 'Experiment Validation' & '0.5 ~ 1.0'.”进行精确搜索,共获得12条数据结果,条目中带“*”的为MNDR统一收集整理的数据。以第一条“MALAT1”为例,点击“Detail”下的“more”选项,可以查看详细信息。
640 (8).png 
详细信息包括但不限于:MNDR ID、该条数据的置信度得分、ncRNA基本信息、相关疾病信息、ncRNA互作信息、定位信息、药物互作信息、实验证据以及参考文献描述等,涉及不同公共数据库来源的信息提供可跳转链接,能够比较全面地获取所需基本信息和延伸内容。
 640 (5).png
下图中所有红色框选出来的信息都提供外部网站来源链接跳转功能。如果涉及药物互作信息,还提供了每种药物相应的PubChem Compound数据库链接及互作信息数据库链接。
640 (6).png 
 640 (7).png




 大范围选“瓜”,以备不时之需?


模糊查询与精确查询的区别大体在于
1、 输入有限制
ncRNA限“Category”,疾病限“Name”,不可使用ID输入且没有打分范围可选;
640 (10).png 
2、 输出结果有区别
(1) 先选择一个相对研究较少的snoRNA的example #1SNORD115”为例,按照强实验验证证据和全部物种来筛选后,首先获得的是3条包含“SNORD115”的查询结果,分别来源于两个物种:Mus musculusHomo sapiens
640 (11).png 
这里我们可以考虑的是物种间的同源性和疾病之间的关系作为研究方向的一个切入点。
 640 (12).png
640 (13).png
(2) 以miRNA为例,输入Keyword: 'miR-13'; Species: 'All'; Category: 'miRNA'; Data Source: 'Strong Experimental Evidence'组合查询后,获得138条包含该关键词的的查询结果。
 640 (14).png
640 (15).png
640 (16).png
可以看到搜索结果包含了不同物种的不同阶段的miRNA,根据这些不同miRNA查看结果信息,获得相应miRNA参与的各种疾病相关信息。可考虑作为研究ncRNA与疾病发生发展过程相关的时空特异性分析的备选和参考信息。
 640 (17).png
(3) 如果以疾病:obesity、物种:ALL、数据来源为Strong Experimental Evidence为例,筛选结果为7条。可以看出其与精确查询结果相比间的覆盖范围显著增大、物种也明显增加,因此使用者在选择查询方式时更应根据研究目的不同有选择性地开展相应查询。
 640 (18).png

批量查询
顾名思义,批量查询可以一次性输入多个ncRNA或者疾病名称,也可以上传文件进行查询。
640 (19).png
以平台提供的example为例进行批量查询。获得按照得分降序排列的条目合集,如果条目较多,可以选择右上角的“Download”按钮下载全部结果数据,用于进一步分析。 
 640 (20).png
关于Browse
大规模撒网现场,根据疾病、ncRNA类别和物种三种浏览模式分为三大类,各取所需、应看尽看,推荐浏览后下载使用。
 640 (25).png



 还有哪些ncRNA有潜力成为疾病相关的“瓜”?


没有预测数据的数据库是不完整的,同样没有提供预测工具的数据资源平台也是耍流氓(咳咳,搞错了,重来)。生物技术的蓬勃发展带来了永远也看不完筛不尽的生物数据,在进行数据收集整理以及呈现应用的过程中,数据库的功劳不可小觑。同样,通过应用这些数据开发的预测工具也为生物学的进步提供了更为广阔的发展空间。MNDR v3.1平台提供了三款预测工具,分别对应了miRNA SPM)、lncRNASIMCLDA)和circRNADeepDCR)与疾病相关性预测工具,三种预测工具目前都仅支持人类单个ncRNA的预测。
 640 (22).png
以SPM为例,可通过直接输入ncRNA序列或上传.fasta格式文件(或者以fasta格式编写存储的.txt文件)的方式进行预测。
 640 (23).png
按照平台默认输入的例子进行预测,结果显示预测排名前五的疾病名称。
640 (24).png 



 与小伙伴们一同愉快吃“瓜”!


使用者可通过平台上的“Submit”版块和“Download & API”版块实现数据上传、下载,互通有无。
 640 (25).png
 640 (26).png
如果在使用过程中有疑问可以通过“Help”了解更多详情或阅读文末参考文献。
 640 (27).png
参考文献:
1. MNDR v3.0: mammal ncRNA–disease repository with increased coverage and annotation. Nucleic Acids Research. 2020. doi: 10.1093/nar/gkaa707.


没有账号?