蛋白质结构数据库(Protein Data Bank,简称PDB)是一个专门收录蛋白质及核酸的三维结构资料的数据库。由Worldwide Protein Data Bank监管。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。虽然PDB的数据是由世界各地的科学家提交的,但每条提交的数据都会经过wwPDB工作人员的审核与注解,并检验数据是否合理。PDB及其提供的软件现在对公众免费开放。
UniProt 是由欧洲生物信息学研究所(European Bioinformatics Institute)、美国蛋白质信息资源(Prontein Information Resource)以及瑞士生物信息研究所(Swiss Institute of Bioinformatics)等机构共同组成的UniProt协会(UniProt Consortium)编辑、制作的一个信息资源,旨在为从事现代生物研究的科研人员提供一个有关蛋白质序列及其相关功能方面的广泛的、高质量的并可免费使用的共享数据库。相对于其它蛋白质数据库,UniProt最大的优点是对每种蛋白的结构区域和功能给出了详细的描述,是结构设计的重要参照数据库。除此以外,UniProt数据库能与其它资源相互联系的, 是目前为止收录蛋白质序列目录最广泛、 功能注释最全面的一个数据库。
IMGT®, the international ImMunoGeneTics information system® 是一个国际型免疫分子数据库。 Marie-Paule Lefranc创建于1989年,收集了各种已知的,临床期的和已经上市的抗体类分子的序列数据库。序列包括各种动物源(人源,鼠源,各种脊椎动物和无脊椎动物)的抗体,也包括各种免疫分子亚型 (immunoglobulin superfamily (IgSF), MH superfamily (MhSF) and related proteins of the immune system (RPI))。IMGT除了序列数据外,还提供抗体的结构分析,临床研究进展,抗体技术情报等信息。
SAbDab数据库是英国牛津蛋白质信息中心根据开源创新协议设立的抗体数据库,数据库搜集了PDB蛋白质三维结构数据库中的所有抗体结构数据(目前约3747个抗体),并维持在每个星期更新一次的进度。除了三维结构收集外,数据库还对应每个抗体收集了它们的抗原亲和结合力数据(KD),抗体氨基酸序列以及功能标注。另外牛津蛋白质信息中心还开发了抗体结构预测软件SAbPred,值得关注。
abYsis是著名的抗体数据库,常用于抗体不同种属序列比对,人源化序列分析,抗体序列搜索等。
美国国家生物技术信息中心(National Center for Biotechnology Information,简称NCBI)设置有与生物技术和生物医学相关的一系列数据库,是生物信息学工具和服务的重要资源。基因银行(GenBank)是其中一个开放获取的序列数据库,对所有公开可利用的mRNA核苷酸序列与其翻译的蛋白质进行收集并注释。
美国国家生物技术信息中心(NCBI)的基因银行(GenBank)也有一个专门的蛋白质序列库,收集了已知的各种生物的蛋白质系列,包括各种蛋白亚型。
这个是Sanger研究所和麻省总医院公开的数据库,将所有化学药物,包括临床试验阶段的候选药物在所有细胞系上的IC50进行了测试和公布。可以查询药物对所有细胞的敏感性,也可以查询细胞对所有化合物的敏感性,很有用。