Банк даних білків (англ. Protein Data Bank, PDB) — сховище для тривимірних структурних даних білків і нуклеїнових кислот. Ці дані, зазвичай отримані методами рентгеноструктурного аналізу і ЯМР-спектроскопії, постачаються біологами і біохіміками зі всього світу. В цій базі даних вони знаходяться у публічному домені та можуть використовуватися безкоштовно.
Історія та організація
Банк даних білків було засновано в 1971 році і , співробітниками Брукгейвенської національної лабораторії. В 1998 році, управління Банком даних було передане (англ. Research Collaboratory for Structural Bioinformatics, RCSB). Адміністрація організації знаходиться на території Університету Ратгерс, її керівником зараз є .
Міжнародна організація Всесвітній Банк даних білків [ 7 квітня 2015 у Wayback Machine.] (англ. Worldwide Protein Data Bank, wwPDB) складається з організацій по всьому світу, що займаються внесенням даних до бази та розповсюдженням накопиченої інформації (PDB). Членами організації зараз є (США), PDBe [ 18 вересня 2019 у Wayback Machine.] (Європа) і PDBj [ 18 вересня 2020 у Wayback Machine.] (Японія). Група BMRB [ 20 жовтня 2020 у Wayback Machine.] (США) приєдналася до wwPDB в 2006 році. Місією wwPDB є підтримка єдиного архіву даних всіх структур біологічних макромолекул та вільне розповсюдження цієї інформації.
Крім того, організацією підтримуються та приводяться до спільного формату багато інших баз даних, що містять інформацію щодо функції білків та їх еволюції.
Коли база даних була заснована, вона містила структури 7 білків. З того часу число структур швидко і майже експоненціально зростає. Сам факт цього росту став предметом окремих досліджень та аналізу growth rate [ 28 квітня 2007 у Wayback Machine.].
Дані
Станом на 26 вересня 2006 року, база даних містила 39 051 тривимірних структур з атомною роздільною здатністю, з них 35 767 структур білків, решта — структури нуклеїнових кислот, нуклеопротеїнів та кількох інших молекул. Зараз щороку додається близько 5 тис. структур. Дані зберігаються в форматі , розробленому спеціально для цієї цілі.
Проте, жодна з структур не містить точного розташування всіх атомів великих біомолекул, хоча, за винятком атомів водню, ці координати можуть бути отримані з великим ступенем достовірності. Дані про послідовності (амінокислот або нуклеотидів) не зберігаються в цій базі, ці дані зберігають в значно більших базах даних, таких як (англ. International Nucleotide Sequence Database Collaboration) або .
станом на 11 вересня 2007 року, «Список даних PDB» на сайті RCSB [ 4 липня 2007 у Wayback Machine.] містив наступну статистику:
Білки | Нуклеїнові кислоти | Нуклеопротеїни | Інше | Всього | |
---|---|---|---|---|---|
Рентгеноструктурний аналіз | 36223 | 983 | 1684 | 24 | 38914 |
ЯМР-спектроскопія | 5665 | 781 | 134 | 7 | 6587 |
Електронна мікроскопія | 105 | 10 | 38 | 0 | 153 |
Інші методи | 80 | 4 | 4 | 2 | 90 |
Всього | 42073 | 1778 | 1860 | 33 | 45744 |
Відмітьте, що теоретичні моделі більше не приймаються до PDB.
22461 структури в PDB мають файл . 3138 структури в PDB мають файл даних ЯМР. Сучасний стан бази щотижня оновлюється на сайті [1] [ 4 липня 2007 у Wayback Machine.].
Формат даних
За роки існування, пройшов через численні зміни. Оригінальний формат диктувався шириною комп'ютерних перфокарт.
- (англ.) — тут можуть бути знайдені специфікації формати, це перший сайт, який слід відвідати перед переглядом даних.
- PDBML [ 29 грудня 2007 у Wayback Machine.] (англ.) — представлення даних PDB в форматі XML.
- ftp.rcsb.org [ 9 червня 2018 у Wayback Machine.] (англ.) — Необроблені дані можуть бути скачані із цього сайту.
- [2] (англ.) — Файли формату PDB можуть бути отримані через HTTP з цього сайту.
- http://www.pdb.org/pdb/files/4hhb.xml.gz (англ.) — Файли формату PDBML (XML) можуть бути отримані через HTTP з цього сайту.
- ftp.ebi.ac.uk/pub/databases/rcsb/ (англ.) — Альтернативне розташування архіву PDB.
- www.pdb.org [ 7 вересня 2015 у Wayback Machine.] (англ.) — Статистика PDB.
Застарілі формати викликають багато проблем, тому створені проєкти переводу даних:
- (англ.) — на сайті NCBI
- wwPDB [ 7 квітня 2015 у Wayback Machine.]
MMDB використовує ASN.1 (та перевод цього формату в XML). Члени wwPDB — RCSB PDB, MSD-EBI і PDBj спільно працюють над створенням єдиного формату в усьому архіві. Хоча дехто сумнівається в доцільності, інші стверджують, що без цього багато даних можуть бути важкими для використання.
Кожна структура в PDB отримує чотирьохбуквений ідентифікатор, PDB ID. Ці дані не слід використовувати для ідентифікації молекули, тому що часто одна молекула має кілька структур в базі даних (отриманих за різними умовами та в різних конформаціах), які мають різні ідентифікатори.
Коли структура потрапляє до бази даних, співробітники wwPDB перевіряють та анотують її. До бази подіються тільки експериментальні, але не теоретично передбачені структури.
Зараз багато фондів, що фінансують дослідження, та наукових журналів вимагають обов'язкової подачі даних до PDB.
Використання даних
Структурні дані можуть бути візуалізовані за допомогою багатьох програм, таких як [en], , , , , , плагінів для браузерів VRML та , програми для настільних комп'ютерів [en]. Вебсайт RCSB PDB містить багато посилань на такі програми для використання для освіти, структурної геноміки та інших цілей.
Посилання
- . Архів оригіналу за 4 липня 2008. Процитовано 31 січня 2008.
{{}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title ()
Джерела
Друковані
- H.M. Berman, K. Henrick, H. Nakamura (2003): Announcing the worldwide Protein Data Bank. Nature Structural Biology 10 (12), p. 980 PMID 14634627.
- H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne: The Protein Data Bank. Nucleic Acids Research, 28 pp. 235–242 (2000). PMID 10592235
- Bernstein FC, Koetzle TF, Williams GJ, Meyer Jr EF, Brice MD, Rodgers JR, Kennard O, Shimanouchi T, Tasumi M. The Protein Data Bank: a computer-based archival file for macromolecular structures. J Mol Biol 1977;112:535-542. PMID 875032.
- E.F. Meyer «The First Years of the Protein Data Bank», Protein Science 6:1591-1597 (1997)
- Sussman, JL, Lin, D, Jiang, J, Manning, NO, Prilusky, J, Ritter, O & Abola, EE. Protein data bank (PDB): a database of 3D structural information of biological macromolecules. Acta Cryst 1998; D54:1078-1084. PMID 10089483.
Онлайн
- The Worldwide Protein Data Bank (wwPDB) [ 7 квітня 2015 у Wayback Machine.] — parent site to regional hosts (below)
- PDBe [ 18 вересня 2019 у Wayback Machine.] (англ.) — головна сторінка
- (англ.) — головна сторінка
- Protein Data Bank Japan [ 18 вересня 2020 у Wayback Machine.] (англ.) — головна сторінка
- A PDB Wiki [ 2 червня 2008 у Wayback Machine.] (англ.) — вебсайт спільної аннотації
Інші посилання
- ExPASy — Swiss-Prot і TrEMBL [ 30 січня 2008 у Wayback Machine.]
- DNA Sequence Collaborator's Page [ 24 жовтня 2007 у Wayback Machine.] Міжнародна колаборація нуклаотидних послідовностей
Посилання на бази даних ферментів
- [3] на сайті групи Кіма Гендріка (Kim Henrick) в EBI, частини MSD [ 22 січня 2008 у Wayback Machine.]. ініціатива SIFTS [ 22 січня 2008 у Wayback Machine.].
- PDB.
- Пошук на сайті бази даних ферментів BRENDA.
- [6] [ 25 лютого 2008 у Wayback Machine.] PDBSProtEC:
Інструменти для візуалізації молекул
- — PyMol [ 2 серпня 2019 у Wayback Machine.] (англ.) — головна сторінка
- — (англ.) — головна сторінка
- STING [ 22 липня 2007 у Wayback Machine.] (англ.) — головна сторінка
- — RasMol [ 4 лютого 2008 у Wayback Machine.] (англ.) — головна сторінка
- (англ.) — головна сторінка
- Swiss-PDB Viewer [ 26 вересня 2007 у Wayback Machine.] (англ.) — головна сторінка
- (англ.) — головна сторінка, відкритий код, Java
- — QuteMol Home Page [ 13 квітня 2022 у Wayback Machine.] (англ.) — головна сторінка, відкритий код, Windows і Mac
- StarBiochem [ 20 липня 2018 у Wayback Machine.] (англ.) — головна сторінка, Java, інтегрований пошук в PDB
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bank danih bilkiv angl Protein Data Bank PDB shovishe dlya trivimirnih strukturnih danih bilkiv i nukleyinovih kislot Ci dani zazvichaj otrimani metodami rentgenostrukturnogo analizu i YaMR spektroskopiyi postachayutsya biologami i biohimikami zi vsogo svitu V cij bazi danih voni znahodyatsya u publichnomu domeni ta mozhut vikoristovuvatisya bezkoshtovno Istoriya ta organizaciyaBank danih bilkiv bulo zasnovano v 1971 roci i spivrobitnikami Brukgejvenskoyi nacionalnoyi laboratoriyi V 1998 roci upravlinnya Bankom danih bulo peredane angl Research Collaboratory for Structural Bioinformatics RCSB Administraciya organizaciyi znahoditsya na teritoriyi Universitetu Ratgers yiyi kerivnikom zaraz ye Mizhnarodna organizaciya Vsesvitnij Bank danih bilkiv 7 kvitnya 2015 u Wayback Machine angl Worldwide Protein Data Bank wwPDB skladayetsya z organizacij po vsomu svitu sho zajmayutsya vnesennyam danih do bazi ta rozpovsyudzhennyam nakopichenoyi informaciyi PDB Chlenami organizaciyi zaraz ye SShA PDBe 18 veresnya 2019 u Wayback Machine Yevropa i PDBj 18 veresnya 2020 u Wayback Machine Yaponiya Grupa BMRB 20 zhovtnya 2020 u Wayback Machine SShA priyednalasya do wwPDB v 2006 roci Misiyeyu wwPDB ye pidtrimka yedinogo arhivu danih vsih struktur biologichnih makromolekul ta vilne rozpovsyudzhennya ciyeyi informaciyi Krim togo organizaciyeyu pidtrimuyutsya ta privodyatsya do spilnogo formatu bagato inshih baz danih sho mistyat informaciyu shodo funkciyi bilkiv ta yih evolyuciyi Koli baza danih bula zasnovana vona mistila strukturi 7 bilkiv Z togo chasu chislo struktur shvidko i majzhe eksponencialno zrostaye Sam fakt cogo rostu stav predmetom okremih doslidzhen ta analizu growth rate 28 kvitnya 2007 u Wayback Machine DaniStanom na 26 veresnya 2006 roku baza danih mistila 39 051 trivimirnih struktur z atomnoyu rozdilnoyu zdatnistyu z nih 35 767 struktur bilkiv reshta strukturi nukleyinovih kislot nukleoproteyiniv ta kilkoh inshih molekul Zaraz shoroku dodayetsya blizko 5 tis struktur Dani zberigayutsya v formati rozroblenomu specialno dlya ciyeyi cili Prote zhodna z struktur ne mistit tochnogo roztashuvannya vsih atomiv velikih biomolekul hocha za vinyatkom atomiv vodnyu ci koordinati mozhut buti otrimani z velikim stupenem dostovirnosti Dani pro poslidovnosti aminokislot abo nukleotidiv ne zberigayutsya v cij bazi ci dani zberigayut v znachno bilshih bazah danih takih yak angl International Nucleotide Sequence Database Collaboration abo stanom na 11 veresnya 2007 roku Spisok danih PDB na sajti RCSB 4 lipnya 2007 u Wayback Machine mistiv nastupnu statistiku Bilki Nukleyinovi kisloti Nukleoproteyini Inshe Vsogo Rentgenostrukturnij analiz 36223 983 1684 24 38914 YaMR spektroskopiya 5665 781 134 7 6587 Elektronna mikroskopiya 105 10 38 0 153 Inshi metodi 80 4 4 2 90 Vsogo 42073 1778 1860 33 45744 Vidmitte sho teoretichni modeli bilshe ne prijmayutsya do PDB 22461 strukturi v PDB mayut fajl 3138 strukturi v PDB mayut fajl danih YaMR Suchasnij stan bazi shotizhnya onovlyuyetsya na sajti 1 4 lipnya 2007 u Wayback Machine Format danihZa roki isnuvannya projshov cherez chislenni zmini Originalnij format diktuvavsya shirinoyu komp yuternih perfokart angl tut mozhut buti znajdeni specifikaciyi formati ce pershij sajt yakij slid vidvidati pered pereglyadom danih PDBML 29 grudnya 2007 u Wayback Machine angl predstavlennya danih PDB v formati XML ftp rcsb org 9 chervnya 2018 u Wayback Machine angl Neobrobleni dani mozhut buti skachani iz cogo sajtu 2 angl Fajli formatu PDB mozhut buti otrimani cherez HTTP z cogo sajtu http www pdb org pdb files 4hhb xml gz angl Fajli formatu PDBML XML mozhut buti otrimani cherez HTTP z cogo sajtu ftp ebi ac uk pub databases rcsb angl Alternativne roztashuvannya arhivu PDB www pdb org 7 veresnya 2015 u Wayback Machine angl Statistika PDB Zastarili formati viklikayut bagato problem tomu stvoreni proyekti perevodu danih angl na sajti NCBI wwPDB 7 kvitnya 2015 u Wayback Machine MMDB vikoristovuye ASN 1 ta perevod cogo formatu v XML Chleni wwPDB RCSB PDB MSD EBI i PDBj spilno pracyuyut nad stvorennyam yedinogo formatu v usomu arhivi Hocha dehto sumnivayetsya v docilnosti inshi stverdzhuyut sho bez cogo bagato danih mozhut buti vazhkimi dlya vikoristannya Kozhna struktura v PDB otrimuye chotirohbukvenij identifikator PDB ID Ci dani ne slid vikoristovuvati dlya identifikaciyi molekuli tomu sho chasto odna molekula maye kilka struktur v bazi danih otrimanih za riznimi umovami ta v riznih konformaciah yaki mayut rizni identifikatori Koli struktura potraplyaye do bazi danih spivrobitniki wwPDB pereviryayut ta anotuyut yiyi Do bazi podiyutsya tilki eksperimentalni ale ne teoretichno peredbacheni strukturi Zaraz bagato fondiv sho finansuyut doslidzhennya ta naukovih zhurnaliv vimagayut obov yazkovoyi podachi danih do PDB Vikoristannya danihStrukturni dani mozhut buti vizualizovani za dopomogoyu bagatoh program takih yak en plaginiv dlya brauzeriv VRML ta programi dlya nastilnih komp yuteriv en Vebsajt RCSB PDB mistit bagato posilan na taki programi dlya vikoristannya dlya osviti strukturnoyi genomiki ta inshih cilej Posilannya Arhiv originalu za 4 lipnya 2008 Procitovano 31 sichnya 2008 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Obslugovuvannya CS1 Storinki z tekstom archived copy yak znachennya parametru title posilannya DzherelaDrukovani H M Berman K Henrick H Nakamura 2003 Announcing the worldwide Protein Data Bank Nature Structural Biology 10 12 p 980 PMID 14634627 H M Berman J Westbrook Z Feng G Gilliland T N Bhat H Weissig I N Shindyalov P E Bourne The Protein Data Bank Nucleic Acids Research 28 pp 235 242 2000 PMID 10592235 Bernstein FC Koetzle TF Williams GJ Meyer Jr EF Brice MD Rodgers JR Kennard O Shimanouchi T Tasumi M The Protein Data Bank a computer based archival file for macromolecular structures J Mol Biol 1977 112 535 542 PMID 875032 E F Meyer The First Years of the Protein Data Bank Protein Science 6 1591 1597 1997 Sussman JL Lin D Jiang J Manning NO Prilusky J Ritter O amp Abola EE Protein data bank PDB a database of 3D structural information of biological macromolecules Acta Cryst 1998 D54 1078 1084 PMID 10089483 Onlajn The Worldwide Protein Data Bank wwPDB 7 kvitnya 2015 u Wayback Machine parent site to regional hosts below PDBe 18 veresnya 2019 u Wayback Machine angl golovna storinka angl golovna storinka Protein Data Bank Japan 18 veresnya 2020 u Wayback Machine angl golovna storinka A PDB Wiki 2 chervnya 2008 u Wayback Machine angl vebsajt spilnoyi annotaciyi Inshi posilannya ExPASy Swiss Prot i TrEMBL 30 sichnya 2008 u Wayback Machine DNA Sequence Collaborator s Page 24 zhovtnya 2007 u Wayback Machine Mizhnarodna kolaboraciya nuklaotidnih poslidovnostej Posilannya na bazi danih fermentiv 3 na sajti grupi Kima Gendrika Kim Henrick v EBI chastini MSD 22 sichnya 2008 u Wayback Machine iniciativa SIFTS 22 sichnya 2008 u Wayback Machine PDB Poshuk na sajti bazi danih fermentiv BRENDA 6 25 lyutogo 2008 u Wayback Machine PDBSProtEC Instrumenti dlya vizualizaciyi molekul PyMol 2 serpnya 2019 u Wayback Machine angl golovna storinka angl golovna storinka STING 22 lipnya 2007 u Wayback Machine angl golovna storinka RasMol 4 lyutogo 2008 u Wayback Machine angl golovna storinka angl golovna storinka Swiss PDB Viewer 26 veresnya 2007 u Wayback Machine angl golovna storinka angl golovna storinka vidkritij kod Java QuteMol Home Page 13 kvitnya 2022 u Wayback Machine angl golovna storinka vidkritij kod Windows i Mac StarBiochem 20 lipnya 2018 u Wayback Machine angl golovna storinka Java integrovanij poshuk v PDB