科研星球

汇总了多个数据库的基因信息查询网站,GeneCards超详细使用指南

在进行基因相关研究的时候,我们经常需要查询了解基因的相关功能,才能知道我们要往哪里进行下一步研究。对于基因功能的查询,我们介绍过ncbi的gene数据库,同样的之前的gene id转换的时候我们也提到过,关于基因信息的汇总除了gene数据库还有ensembl、uniprot等等很多数据库,各个数据库都提供了不同的基因信息。我们在查询的时候,总不能说把各个数据库都查询一遍吧?所以今天就给大家介绍一个汇总了多个数据库的基因信息查询网站: 

GeneCards (https://www.genecards.org/  )

GeneCards 是一个汇总了150个网络数据库的基因功能查询数据库。通过这个数据库我们可以查询到一个基因各个方面的基本功能(主要注意的是这个数据库只能查询人的基因信息哈)。



下载.jpeg

这类汇总性的数据库,最担心的是数据库的不更新,但是由于genecards所在的公司还有很多功能是付费的,算是一个营利性的机构,所以为了机构的名声,他们也会长时间更新的,目前已经到了4.14版本了。



下载 (1).jpeg


由于查询的信息比较多,所以我们分两期来进行讲解。



PART 1

数据库使用


数据库的使用很简单,就是输入我们想要检索的基因即可。这里我们可以输入基因名、ensembl ID、uniprot ID都可以,例如我们这里输入MYC。

下载 (2).jpeg

检索完之后,我们就可以看这个基因相关的信息了。对于基因的信息,数据库分成了很多个部分。现在基本上分成基因基本信息以及基因实验相关的产品信息。我们这里主要的就来介绍数据库包括那些基本信息。



下载 (3).jpeg




PART 2

基因信息汇总 Summaries


很多数据库对于基因的功能都会有简单的汇总介绍,通过这句话我们基本上能大概的了解这个基因的基本功能。在Summaries这个模块当中,genecards汇总了多个数据库对于这个基因功能的总结,我们通过这个就可以知道多个数据库对于这个基因是什么评价的了。



下载 (4).jpeg



PART 3

基因结构及调控信息


按照中心法则,一个基因有三个不同的身份:分别是DNA、mRNA、蛋白。对于这三个身份都有信息。因此genecards也基于三个不同身份有了三个不同的模块: GenomicsTranscriptsProteins


Genomics

在基因组这个模块当中,我们可以看到目标基因在基因组当中的位置及长度。


下载 (5).jpeg


另外,由于基因组对于基因表达的调控,主要是通过转录调控来实现的,所以数据库总结了很多转录调控的信息。我们在这里就可以查询到这个基因可能收到哪些转录因子的调控。



下载 (6).jpeg


Transcripts

由于可变剪切的存在,基因的mRNA会产生很多的剪切异构体,所以这个数据库汇总了多个数据库对于剪切异构体的ID,以及相对应的可能剪切方式。



下载 (7).jpeg


另外,我们在做相关的基础实验的话,需要对这个基因的mRNA进行处理,具体处理的话就需要用到公司的试剂。所以这里也 汇总了相关可能用到的试剂,例如CRISPR、miRNA等等。


下载 (8).jpeg


Proteins

对于基因蛋白,同样的也是汇总了蛋白的基本信息。另外关于蛋白的调控,也存在翻译后调控,所以 GeneCards 利用 UniprotKB,neXtProt 和 GlyConnect 三个数据库注释了相关的翻译后调控信息,另外还通过PhosphoSitePlus注释了其磷酸化位点。


下载 (9).jpeg


对于蛋白相关的功能研究,我们会用到相关的抗体,所以这里也总结了关于各个公司抗体的型号。



下载 (10).jpeg




PART 4
基因功能


上面对于基因的介绍是它本身在染色体上的基本特征,了解了基本特征,我们还要进一步的去了解这个基因有什么功能,毕竟功能决定这个基因的研究价值的。GeneCards方面,对于基因功能的注释包括了包括了:Localization、 Pathways、 Function

Localization

一个基因的功能经常是由他们的定位决定的,基因在细胞核和细胞质形式的功能不一样的,所以我们就把基因的定位放到基因功能上了。GeneCards对于基因功能的定位使用的是compartments、HPA数据库。另外关于GO数据库,也提供了细胞组分的分类,所以GeneCards把关于这个基因的go的信息也就纳入进来了。


下载.jpeg

Function

提到GO数据库的话,这个数据库还提供了其他两种信息,另外的分子功能就直接放到的功能这个部分了。


下载 (1).jpeg


Pathways

对于一个基因而言,他的功能也是通过相关的信号通路来发挥作用的。GeneCards收集了目前主流的一些数据库关于这个基因的信号通路信息,例如: KEGGReactome等等。在这里,我们就可以了解到很多关于基因通路的信息。


下载 (2).jpeg




PART 5
基因和临床的相关性


由于我们做的很多基因相关的研究是要来解释疾病的发生原理的,所以往往还是要看这个基因和疾病的相关性。GeneCards提供了两个和疾病有关的模块,分别是:DisordersDrugs

Disorders

在Disorders这个模块下,汇总了这个基因和哪些疾病是有关系的。当然这种的汇总是基于以往的研究来的,所以如果没有看到和我们研究的疾病有关系,那也不一定说明真的是没关系,这里的数据主要来自于malacards。关于malacards的介绍,我们明天再说。


下载 (3).jpeg

Drugs

药物在体内发挥作用也是需要通过基因的变化来产生的,所以我们可以通过这个模块了解有哪些药物影响这个基因的表达。数据库总结了DrugBank,ClinicalTrials,ApexBio,DGIdb和Novoseek五个数据库的结果,我们可以很容易的看到这个基因的和哪些药物有关系以及可能的激活机制。


下载 (4).jpeg



PART 6
相似基因


有时候我们除了了解了这个基因的功能本身的功能之外,还想要研究这个基因在不同物种的进化关系,以及相同物种这个基因和哪些基因相似,这个在数据库也是有的OrthologsParalogs

  • 我们可以在Orthologs查看,不同物种之间相同基因之间的相似度。


下载 (5).jpeg


  • 可以在Paralogs查看,这个基因和其他哪些基因高度同源。


下载 (6).jpeg




PART 7
目前发表的文章


研究完基因的功能之后,最后还是要看这个基因一共发表了多少篇文章的。这个可以看见Publications当中看到,检索的是所有相关的文章。我们可以在进一步检索当中输入关键词,查看和某一个疾病相关的研究都有多少篇。


下载 (7).jpeg


数据库总结

对于基因的研究在这个数据库已经汇总的很多了。而且对于一个刚刚入科研门槛的人,如果不清楚基因研究都研究那些方面,那如果能把这个数据各个方面都弄懂的话,也不失为一种入门的方法。这两天我们对于GeneCards的介绍就到这里,明天我们来介绍一下综合性查询疾病相关信息的数据库: MalaCards。


没有账号?