科研星球

转录因子万精油数据库KnockTF使用指南

不管是研究肿瘤还是非肿瘤的,不管是生物学专业做基础研究的,还是医学专业做疾病机制研究的,只要你还在研究分子机制,转录因子(TF)一定是每个实验汪都需要了解的方向。对基因敲除或敲降前后的基因表达谱进行分析是研究TF及其靶基因的功能的一项重要策略。目前,已发表的研究也积累了大量关于敲除或敲降TF后的基因表达谱数据。因此,全面且有效地收集和处理这些数据可进一步挖掘数据的价值,也为大家提供研究的便利。


2021年1月,哈尔滨医科大学的李春权教授课题组在国际著名的《Nucleic Acids Research》杂志上发表了他们开发的KnockTF数据库(我们也曾在《送你个数据库,多年获得1亿元国自然》的推送中介绍过他们开发的LncSEA,在《用这个重磅数据库升级你的思路和论文,IF up up up》中介绍过ATACdb)


KnockTF数据库网址为:http://www.licpathway.net/KnockTF/index.html


下面本工将为大家介绍一下这款万金油数据库:


进入主页后,大家可以看到顶上方主要有“Browse”、“Search”和“Analysis”三个模块。下图红色方框为快速搜索栏,大家可在此直接输入TF名来搜索结果。


0.png



Browse模块


在这个模块,大家可以通过左边的“Data Source”、“Biosample Type”、“Tissue Type”、“TF Superclass”和“TF”这五个选项来过滤筛选数据集。右边的表格则展示了各个数据集的详细情况,包括TF名、敲降/敲除的方法、组织类型、生物样本类型、profile ID、平台和pubmed ID。点击红色箭头所示的图标可以保存下载表格的所有信息,右上方的search方框还提供搜索栏辅助大家快速找到合适的数据集。

0 (1).png

点击“Dataset ID”这栏的蓝色字体,可跳转到该数据集的页面,首先显示的overview页面,展示了该数据集的概况,右边的网络图展示了最显著的差异表达基因,差异的类型和数目可以在下拉栏里选择。

0 (2).png

然后展示了靶基因的差异表达结果

0 (4).png

下游靶基因的通路富集结果,点击蓝色字体可以跳转显示该通路的富集图,还可以下载保存。

0 (5).png

0 (6).png

另外还可对该转录因子的上游基因通路注释并下载保存相关结果。

0 (3).png

最后,数据库还展示了靶基因的差异表达热图和转录因子在各个数据库中表达量的柱状图。

0 (7).png

0 (8).png


Search模块




这个模块提供了四种搜索方式帮助大家定位找到相关的数据。

分别是通过搜索转录因子TF靶基因敲除/敲降方法组织类型。根据TF搜索时,需输入TF名、TF类型和TF的Superclass(超类),根据靶基因搜索时,则需输入基因名类型、基因名和Fold Change。得到搜索结果后,查看详细信息的方式同上一模块一致。

0 (9).png


Analysis模块


这个模块分为两个部分,一个是亚网络(Subnetwork)分析,另一个是转录因子富集

亚网络分析部分,大家可以提交一个基因列表来提取转录调控子网络,这个子网络由所提交的基因和它们在TF差异表达基因网络中相邻一步(one-step)的基因组成。该网络中的粗线表示这个interaction有ChIP-seq数据支持。如下图所示,黄色环表示所提交的基因,深蓝色表示靶基因,红色表示TF。

0 (10).png

转录因子富集部分,KnockTF可以将大家提交的基因映射到TF-差异表达基因网络,并对提交的基因与各TF调控的所有差异表达基因进行超几何检验。举个栗子,在这个例子中,我们提交了60个基因,这60个基因与转录因子ESR1的靶基因基因比较,发现这60个基因全都属于ESR1的靶基因,用韦恩图表示则如下图所示。

0 (11).png

0 (12).png

而与转录因子TFAP4的靶基因相比较,只有57个已提交的基因属于TFAP4的靶基因。韦恩图则如下图所示,可以看到TFAP4的靶基因很多,而已提交的基因中,绝大多数都落在了TFAP4的靶基因范畴。

0 (13).png

最后,大家也可以在Download界面下载该数据库已有的数据,自己下载后进行分析和筛选。可供下载的数据有:每个数据集的表达谱、所有数据集的差异表达基因,还有每个基因的启动子、超级增强子和经典增强子。

0 (14).png

关于KnockTF数据库的介绍就到这里了,祝大家能利用好数据库,用别人的数据,发自己的文章!


文章来源:解螺旋

没有账号?