科研星球

一个网站搞定所有生物信息学需求,Expasy使用指南

随着越来越多的数据库、软件工具和在线服务被建立起来,方便了生命科学及医学领域的基础研究和临床研究人员的工作。但是面对这么多的选择,一个个记录网址是很不方便的,研究效率也会变低,因此提供单一接入点的门户应运而生,即一个网站提供所有生物信息学需求。接下来为大家介绍一个生物信息学资源门户——Expasy (官网:https://www.expasy.org/  )。


关于Expasy


Expasy是SIB瑞士生物信息学研究所(The SIB Swiss Institute of Bioinformatics)的生物信息学资源门户。Expasy创建于1993年8月,起初叫做“ExPASy,蛋白质分析专家系统”,提供蛋白质研究支持使其重点,2011年6月,改名为SIB Expasy生物形态资源门户网站,是SIB开发的生物信息学资源的多样化目录。

Expasy的重新设计过程依赖于用户为中心(User-Centred Design)的设计原则,并结合了用户研究“谁是目标受众?”的问题和用户体验“用户如何与应用程序交互?”的问题,现在Expasy已经更新到3.0版本,发布于2020年10月。

Expasy包括什么?


Expasy提供超过160个数据库和软件工具的访问,例如用于蛋白研究的UniProtKB/Swiss-Prot数据库和蛋白互作的STRING数据库,囊括一系列生命科学和临床研究领域,从基因组学、蛋白质组学和结构生物学,到进化和系统发育、系统生物学和医学化学,并且Expasy自动与每个资源的最新版本保持一致,确保信息是最新的,不怕过时。

下图是Expasy的主页,界面很简洁,包括三部分:搜索框、左侧的筛选设置及卡片形式列出的资源。

左侧的筛选设置包括六大类和十一小类:基因与基因组(基因组学、基因组、转录组学)、蛋白质和蛋白质组、进化与系统发育(进化生物学、群体遗传学)、结构生物学(药物设计、药物化学、结构分析)、系统生物学(糖组学、脂质组学、代谢组学)、文本挖掘与机器学习。

资源的卡片上提供了名称、简介、右上角的类型标识(数据库或工具)和左上角的分类标识。

0.jpg


如何使用Expasy?


Expasy作为囊括超过160个数据库和软件工具的生物信息学资源门户,主要的使用手段就是进行检索,其检索包括两种类型:常规搜索和跨资源搜索。以“COVID-19”为例进行检索,得到如下结果

0 (1).jpg

数字2是常规搜索检索结果,浏览Expasy中的数据集和在线工具资源。

常规搜索可以通过名称、关键字、类别或描述搜索资源。例如,当用户在搜索栏中键入“COVID-19”时,会产生一个与COVID-19相关的数据库和软件工具列表,例如ViralZone、COVID-19 Scenarios、COVID-19 UniProtKB。用户可以根据资源卡片提供的信息,选择自己需要的资源。

数字1是跨资源搜索结果,它允许并行查询网页访问数据库,并展示结果。跨资源搜索可以直接在19个SIB数据库内进行检索,除了全文检索外,搜索引擎还会自动识别某些类型的格式化数据,例如UniProtKB登录号、PDB ID、Ensembl ID。这可以减少搜索时间,还展示了部分结果。

下表是可以进行跨资源搜索的数据库(不完全统计)。

0.png


详细资源介绍


点击资源卡片,可以看到相应资源的具体细节。以“ViralZone”为例,下图是ViralZone的主要界面。

0.jpg

在这一界面可以看到名称、具体描述、资源类型、类别、演示视频、网址、SIB操作资源、许可条款、类型关键字(“你能用这个资源做什么?”和“在Expasy中浏览这些关键字”)、可能感兴趣的其他资源等信息。用户可以了解数据库的大概功能,通过演示视频进行学习,点击网址访问相应的资源,可以通过感兴趣的资源找到潜在的内容。

Expasy是资源的集合网站,有160个数据库和软件工具,一个个介绍限于篇幅是不太合适的,大家对生物信息学的资源有需求的话,可以先去Expasy上进行检索,选择满足自己需求的资源进一步了解。

参考文献:
Séverine Duvaud, Chiara Gabella, Frédérique Lisacek, Heinz Stockinger, Vassilios Ioannidis, Christine Durinx, Expasy, the Swiss Bioinformatics Resource Portal, as designed by its users, Nucleic Acids Research, 2021;, gkab225, https://doi.org/10.1093/nar/gkab225


没有账号?