科研星球

药物信息综合数据库PubChem完全使用指南

数据库概览


进入PubChem主页(https://pubchem.ncbi.nlm.nih.gov/),该数据库属于NCBI旗下,目前更新至2021年,收录11100万种化合物结构信息存储于PubChem Compound子数据库,27100万种用户上传的化合物数据存储于PubChem Substance子数据库,29800万种实验结果或文献支持的化合物生物活性数据存储于PubChem BioAssay子数据库,还有3200万篇相关文献和250万相关专利,以及90426个靶基因、96561个靶蛋白和23915条通路信息,上述数据来源总计799个。PubChem数据库包含大量化合结构信息、理化性质及生物活性、毒性和安全性数据,并提供详实的文献或专利支持,广为生物医药与生物化学交叉领域的科研人员所青睐。


0.png


0 (1).png


点击主页菜单栏About,该页面展示数据库详细介绍。值得注意的是,该数据更新之后不再提供PubChem Entrez检索功能,取而代之的是一个统一的检索界面,如果对新界面不熟悉仍可以旧版本界面来访问,或者在主页检索框下方勾选use Entrez,不过目前在旧版本的Entrez检索结果不支持后来添加到PubChem的内容,例如专利信息。


0 (3).png

0 (4).png


0 (5).png


0 (9).png


另外需要关注的是,该页面What’s in PubChem部分有各种数据类型的详细介绍,各个数据类型访问链接如表所示。


0 (4).png


0 (7).png


点击主页菜单栏Blog,该界面展示PubChem数据库近期的数据更新信息,在右侧栏RECENT POSTS预览。


0 (8).png

0 (6).png





数据库核心功能及操作演示


PubChem数据库数据检索功能有三种方式:关键词检索、结构式检索和批量检索。



 1 

关键词检索


在主页检索框输入关键词进行快速检索,检索词支持输入化合物名称、化学式、CAS ID号、SMELE和InchI表达式,或基因名,并提供Covid-19专题检索功能。


0 (11).png


以阿司匹林aspirin为例,检索结果有121条化合物结构信息,包括阿司匹林单体和混合药物,有25条通路数据,1998条药物活性数据,近7万文献或专利。


0 (10).png


点击Compounds目录下第一条查看详情。首先映入眼帘的是aspirin信息概览,包括PubChem CID、化合物结构、化学安全分类、分子式、同义词、分子量和数据更新时间,并提供aspirin药理功能注释和肝毒性信息,提供NCI Thesaurus、LiverTox和DrugBank数据库链接。右侧栏为该页面所展示的信息目录。


0 (12).png


0 (13).png


接下来介绍各部分详细信息:Structure部分展示aspirin的2D、3D和晶体结构,右上角可下载结构信息文件或保存图片,可在数据库检索结构类似的化合物。


0 (14).png


Names and Identifiers部分展示aspirin的各种表达式、别名和标识符。IUPAC Name为2-乙酰氧基苯甲酸(2-acetyloxybenzoic acid),InChI=1S/C9H8O4/c1-6(10)13-8-5-3-2-4-7(8)9(11)12/h2-5H,1H3,(H,11,12),SMILES:CC(=O)OC1=CC=CC=C1C(=O)O,并提供CAS、EC、ICSC和UNII等数据库ID,以及各种同义词。


0 (15).png


0 (16).png


Chemical and Physical Properties部分展示aspirin理化性质,比如溶解度。


0 (17).png


0 (18).png


Spectral Information部分展示aspirin的光谱信息,包括核磁共振谱、质谱、红外紫外光谱和拉曼表面光谱等。


0 (19).png


0 (20).png


0 (21).png


0 (22).png


0 (23).png


Related Records部分,可查看aspirin相关研究进展,


0 (24).png


Chemical Vendors提供aspirin供应商信息。


0 (25).png


Drug and Medication Information部分展示aspirin的临床信息,包括适应症、WHO指南信息、药物成分、临床试验和某些药物特性及使用注意事项等信息。


0 (26).png


0 (27).png


0 (28).png


0 (29).png


Pharmacology and Biochemistry部分展示aspirin的药理学性质,ADEM药代动力学和药物作用机制。


0 (30).png


0 (31).png


0 (32).png


0 (33).png


Toxicity部分展示aspirin的毒理学特征,包括肝毒性、致癌性、中毒症状及急救措施。


0 (34).png


Associated Disorders and Diseases部分展示来自CTD数据库的aspirin相关疾病信息。


0 (35).png


Literature部分展示aspirin的相关文献。


0 (36).png


0 (37).png


0 (38).png


0 (39).png


接下来比较重要的一部分:Biomolecular Interactions and Pathways,展示aspirin的靶基因、靶蛋白及结构、通路、药物相互作用和药物食物相互作用等信息。


0 (40).png


0 (41).png


0 (42).png


0 (43).png


0 (44).png


0 (45).png


再然后,Biological Test Results部分展示药物活性信息。


0 (46).png


另外,在上一级检索结果页面,点击Similar Structures Search可以检索与aspirin结构类似的化合物,结果中点击Setting可设置相似度对结果进行筛选。


0 (47).png


0 (48).png



 2 

以结构式进行检索


点击Draw Structure进入检索界面,以检索阿司匹林为例,绘制结构图,可以点击下方Help查看绘图指南。检索结果包括同一性、相似性、子结构和上层结构,进入各化合物详情页面,内容基本与前文类似。


0 (49).png

0 (50).png


0 (51).png


0 (52).png



 3 

批量检索


点击UPLOAD ID LIST进入检索界面,下载示例数据,选择数据类型,上传示例数据文件,点击Search Pubchem With This List,得到检索结果,右侧可批量下载。


0 (53).png


0 (54).png



新版PubChem功能展示


1. Periodic Table,点击进入元素周期表,可整体上浏览各元素信息,点击任意元素查看详情,内容基本与前文类似。


0 (55).png

0 (56).png


2. Knowledge panels,为了方便快速找到化合物、基因和疾病之间的交互关系,引入Knowledge panels知识面板,分为Chemical–chemical co-occurrences、Chemical–gene co-occurrences和Chemical–disease co-occurrences三个子板块,可直接点击下面网址访问。


0 (57).png


3. PubChem Pathway,提供与某通路相关的化合物、蛋白质、基因和疾病交互信息,替代了不再更新的NCBI BioSystems数据库功能。


0 (58).png


PubChem数据库功能强大,应用范围极为广泛,在此提供两篇案例文献供大家学习:PMID 33918209 IF=4.410;PMID 33927214 IF=4.371。


以上就是PubChem数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!


Kim S, Chen J, Cheng T, et al. PubChem in 2021: new data content and improved web interfaces. Nucleic Acids Res. 2021;49(D1):D1388–D1395. doi:10.1093/nar/gkaa971




没有账号?