科研星球

最详细 NCBI数据库基础使用教程

NCBI作为大名鼎鼎的科研信息数据库,想来大家都耳熟能详,其功能更是强大到无微不至,因而,对该数据库的合理使用无疑会让科研汪们在科研路上如虎添翼。在此,小编就用一文带你走进NCBI数据库。本篇文章分为两个部分,第一部分:入门,初识NCBI数据库;第二部分:技能,了解NCBI常见的4种使用方法。一起来看看吧!


PART 1  初 识 NCBI


官方网址:https://www.ncbi.nlm.nih.gov/ 


NCBI 开发有 Genbank 等公共数据库,提供 BLAST 、Entrez 、OMIM 、 Taxonomy  等工具,可对国际分子数据库和生物医学文献进行检索和分析,并开发用于分析基因组数据和传播生物医学信息的软件工具。 

NCBI 还支持与推广多种医学及科技方面的数据库,如:三维蛋白质结构的分子模型数据库 ( MMDB) 、孟德尔人类遗传( OMIM )等。


进入官方网址,可看到如下界面:

0.png

接下来,小编简单介绍一下NCBI包含的部分数据库,从而方便大家在构思研究思路时,能使用得当的数据库进行查找相关数据。总体来说,可以分为六大类,如下图所示:

0 (1).png
0 (2).png



具体介绍如下



0 (4).png
0 (3).png

0 (5).png
0 (6).png
0 (8).png
0 (9).png





PART 2   NCBI 常见的4种使用方法


查找基因序列、mRNA序列

进入NCBI 主页,在 search 后面选择 Gene,输入需要查找的基因的名字,点击search,查看结果。

以基因P53为例,搜索结果如图:
0 (7).png



点击红框部分,进入并下拉,可以看到大量的信息,如下图:
0 (10).png
0 (11).png





上传数据到NCBI

NCBI对可提交的数据类型有详细列表,不同类型的数据分别提交到不同的数据库。

具体可查看:
http://www.ncbi.nlm.nih.gov/guide/howto/submit-sequence-data/ 
0 (12).png



由于测序平台应用在不同类型的项目上会有不同分析结果,所以分析数据的提交要根据测序项目类型来定。


1.  建立一个属于自己的NCBI登录账户,用以提交数据。

打开下方链接:

 https://www.ncbi.nlm.nih.gov/account/ 

点击图中标注的“Register for a NCBI account”,进入到注册页面,如实填写信息;

0 (13).png


如何创建My NCBI账户,也可详细见:

http://www.ncbi.nlm.nih.gov/books/NBK3842/#MyNCBI.Registering_with_My_NCBI 


2. 为提交的数据申请BioProject和BioSample号。

一个BioProject代表一项测序研究项目,它可包含多次实验(experiments):

Step1:打开https://submit.ncbi.nlm.nih.gov/  ,点击“BioProject”进入新建页面;

Step2:点击“New submission”,进行提交;

Step3:根据研究项目实际情况,填写一系列信息,每填写完一个步骤,都要点击页面下方的continue,保存已填写的信息。点击“submit”即可;


3. 在NCBI网站上登录自己的账户,进入数据提交的Submit界面后,点击相应的数据库进行数据的提交。https://submit.ncbi.nlm.nih.gov/  )



如何用NCBI批量下载基因序列 

1. 登入NCBI主界面,在下拉菜单里选择nucleotide,将基因的Accession number都排列在一起,用空格隔开,不要有回车符;

例如:NM_181571 NM_012319 NM_016651 NM_007678NM_004642 NM_145918 NM_024504 NM_014847 NM_004196 NM_002295:
0 (14).png


填好后Search,然后会出现这样一个界面:

0 (15).png




2. 点击上面的summary下拉标记,在Format选项中选择FASTA;

0 (16).png


点击Apply,就会出现下一个界面:

0 (17).png



3. 点击右上角的Send下拉标记,选中CompleteRecord和File,然后在下面Format中选择FASTA,Sort by不变(默认),最后点击Create File保存数据即可;
0 (18).png



如何用NCBI下载物种的全基因组序列 

1. 打开NCBI,在下拉栏里选择Genome,之后输入下载物种的拉丁名;

以拟南芥Arabidopsis thaliana为例:

搜索结果如下图所示:
0 (19).png



2. 点击上图的“GenomeAssembly and Annotation report”进入下面的界面:

0 (20).png



一般来说,选择level这一列中测序水平最高的一组就是黑色部分占据面积最多的。


3. 点击Assenbly这一列中的基因组编号,可进入全基因组下载界面;
0 (21).png



4. 点击该界面的右侧,即可进行全基因组的下载;
0 (22).png


参考资料


  1. https://wenku.baidu.com/view/f86d817165ce0508763213df.html

  2. https://www.cnblogs.com/yahengwang/p/9550410.html

  3. https://mp.weixin.qq.com/s/7EPj0lJGz2gesnLK_k_oGg




相关推荐:
没有账号?