PDB (文件格式)

PDB文件格式(PDB為蛋白質數據庫英語名稱「Protein Data Bank」縮寫),顧名思義是一種由蛋白質數據庫最先採納,用於儲存蛋白質三維結構的文件格式。這種文件格式詳細記錄了 蛋白質中每個原子的坐標信息、蛋白質二級結構信息,以及原子之間的相互作用等信息,同時附有簡要的蛋白質的名稱與生物學性質信息。

PDB
副檔名
.pdb, .ent, .brk
網路媒體型式
chemical/x-pdb
格式類型化學文件格式

歷史

1976年,研究人員認為應該有一種人類可直接閱讀的保存蛋白數據文件,將這種文件上傳到數據庫中將會有利於研究人員相互交流不同蛋白質的結構信息,因此發明了PDB文件格式。PDB文件固定有80列,這是因為當時早期電腦的打孔卡最多只支持在一行打80個孔[1]。此後,PDB文件經過了一些調整,截至2011年7月,最新的PDB格式版本是3.30[2]

例子

以下是一個人工合成的多肽的PDB文件:

HEADER    EXTRACELLULAR MATRIX                    22-JAN-98   1A3I
TITLE     X-RAY CRYSTALLOGRAPHIC DETERMINATION OF A COLLAGEN-LIKE
TITLE    2 PEPTIDE WITH THE REPEATING SEQUENCE (PRO-PRO-GLY)
...
EXPDTA    X-RAY DIFFRACTION
AUTHOR    R.Z.KRAMER,L.VITAGLIANO,J.BELLA,R.BERISIO,L.MAZZARELLA,
AUTHOR   2 B.BRODSKY,A.ZAGARI,H.M.BERMAN
...
REMARK 350 BIOMOLECULE: 1
REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C
REMARK 350   BIOMT1   1  1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   1  0.000000  1.000000  0.000000        0.00000
...
SEQRES   1 A    9  PRO PRO GLY PRO PRO GLY PRO PRO GLY
SEQRES   1 B    6  PRO PRO GLY PRO PRO GLY
SEQRES   1 C    6  PRO PRO GLY PRO PRO GLY
...
ATOM      1  N   PRO A   1       8.316  21.206  21.530  1.00 17.44           N
ATOM      2  CA  PRO A   1       7.608  20.729  20.336  1.00 17.44           C
ATOM      3  C   PRO A   1       8.487  20.707  19.092  1.00 17.44           C
ATOM      4  O   PRO A   1       9.466  21.457  19.005  1.00 17.44           O
ATOM      5  CB  PRO A   1       6.460  21.723  20.211  1.00 22.26           C
...
HETATM  130  C   ACY   401       3.682  22.541  11.236  1.00 21.19           C
HETATM  131  O   ACY   401       2.807  23.097  10.553  1.00 21.19           O
HETATM  132  OXT ACY   401       4.306  23.101  12.291  1.00 21.19           O
...

參見

參考資料

  1. ^ Berman, Helen M. "The protein data bank: a historical perspective." Acta Crystallographica Section A 64.1 (2007): 88-95.
  2. ^ Atomic Coordinate Entry Format Version 3.3. wwPDB. July 2011 [2023-06-08]. (原始內容存檔於2015-01-24).