GenBank — публічно доступна база даних нуклеотидних послідовностей і супровідних анотацій для більш як 300 000 видів. Дані вносяться як окремими лабораторіями, так і великомасштабними проектами повного секвенування геномів, також доповнює GenBank послідовностями із виданих патентів. Розробкою і розповсюдженням GenBank займається Національний центр біотехнологічної інформації. Ця база даних разом із DDBJ та ENA (англ. European Nucleotide Archive), з якими вона щоденно обмінюється даними, входить до Міжнародної співпраці баз даних нуклеотидних послідовностей. Станом на серпень 2014 року GenBank містив 939 775 079 106 пар основ.
GenBank можна використовувати через систему Entrez NCBI, яка інтегрує інформацію із широкого спектра баз даних NCBI. NCBI Nucleotide поділений на три розділи: CoreNucleotide (основна частина), dbEST (Expressed Sequence Tags) і dbGSS (Genome Survey Sequences). Сервіс дозволяє порівнювати послідовності GenBank між собою та із послідовностями з інших джерел.
Поділ на розділи
GenBank категоризує послідовності до кількох розділів в залежності від організму джерела або способу отримання даних.
Розділ | Опис | Кількість даних у релізі 203 (8/2014) |
---|---|---|
PRI | Послідовності приматів | 6697769597 |
ROD | Послідовності гризунів | 4467459537 |
MAM | Послідовності інших ссавців | 951689720 |
VRT | Інші хребетні | 3188004508 |
INV | Послідовності безхребетних | 3085847038 |
PLN | Рослинні послідовності | 9012205825 |
BCT | Бактерійні послідовності | 187345 |
VRL | Вірусні послідовності | 2125907663 |
PHG | Послідовності бактеріофагів | 146804958 |
SYN | Синтетичні послідовності | 976696717 |
UNA | Неанотовані послідовності | 187345 |
WSG | Дані (англ. Whole genome shotgun) | 774052098731 |
ENV | Зразки із навколишнього середовища | 4297282924 |
PAT | Запатентовані послідовності | 14647872659 |
TSA | Дані секвенування транскриптому методом дробовика | 9323352861 |
HTC | Дані високопродуктивного секвенування кДНК | 671972485 |
HTG | Дані високопродуктивного секвенування геномної ДНК | 25386830568 |
GSS | Genome survey sequences | 24293870378 |
EST | Expressed sequence tags | 42086482490 |
STS | Sequence tagged sites | 640701468 |
Поділ на розділи за організмами є історичним і не відображає сучасної класифікації. Через це, а також тому, що частина послідовностей певного організму можуть перебувати у розділі за технологією (наприклад, EST або HTG), для пошуку даних за організмом слід використовувати NCBI Taxonomy Browser [ 19 травня 2020 у Wayback Machine.].
Ідентифікатори і номери доступу послідовностей
Кожному запису, що складається із послідовності і супутньої інформації, присвоюється унікальний номер доступу, спільний для трьох баз даних, що співпрацюють (GenBank, DDBJ, ENA). Цей номер можна знайти у рядку ACCESSION
відповідного запису. Він не змінюється впродовж всього часу існування запису, навіть якщо дані оновлюються. Натомість, зміни відображаються за допомогою суфікса номера доступу, що позначає версію. Початковою версією послідовності завжди є '.1'. Кожній версії нуклеотидної послідовності також присвоюється унікальний NCBI ідентифікатор — GI, його можна знайти у рядку VERSION
, наприклад U49845.1 GI:1293613
. Коли дані про послідовність оновлюються, нова версія отримує інший GI, а версія номера доступу інкрементується. З номером доступу без вказання версії можна знайти найновіші дані. Записи GenBank рекомендується цитувати із використанням номера доступу із вказанням версії.
Завантаження вмісту
Що два місяці NCBI випускає новий повний реліз GenBank, який можна безкоштовно завантажити через FTP. Крім того, щоденно виходять оновлення також вільні до завантаження.
Примітки
- Benson DA, Clark K, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW (2015). GenBank. Nucleic Acids Res. 43(Database issue):D30-5. doi:10.1093/nar/gku1216. PMID 25414350.
- . NCBI. Архів оригіналу за 9 листопада 2015. Процитовано 11 листопада 2015.
- Jonathan Pevsner (2009). Bioinformatics and Functional Genomics (вид. 2nd). Wiley. с. 14-23. ISBN . Процитовано 11 листопада 2015.
{{}}
: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url ()
Посилання
- . NCBI. Архів оригіналу за 9 листопада 2015. Процитовано 11 листопада 2015.
- . NCBI. Архів оригіналу за 10 вересня 2015. Процитовано 11 листопада 2015. — зразок запису на GenBank
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
GenBank publichno dostupna baza danih nukleotidnih poslidovnostej i suprovidnih anotacij dlya bilsh yak 300 000 vidiv Dani vnosyatsya yak okremimi laboratoriyami tak i velikomasshtabnimi proektami povnogo sekvenuvannya genomiv takozh dopovnyuye GenBank poslidovnostyami iz vidanih patentiv Rozrobkoyu i rozpovsyudzhennyam GenBank zajmayetsya Nacionalnij centr biotehnologichnoyi informaciyi Cya baza danih razom iz DDBJ ta ENA angl European Nucleotide Archive z yakimi vona shodenno obminyuyetsya danimi vhodit do Mizhnarodnoyi spivpraci baz danih nukleotidnih poslidovnostej Stanom na serpen 2014 roku GenBank mistiv 939 775 079 106 par osnov Sotij reliz GenBank na CD disku GenBank mozhna vikoristovuvati cherez sistemu Entrez NCBI yaka integruye informaciyu iz shirokogo spektra baz danih NCBI NCBI Nucleotide podilenij na tri rozdili CoreNucleotide osnovna chastina dbEST Expressed Sequence Tags i dbGSS Genome Survey Sequences Servis dozvolyaye porivnyuvati poslidovnosti GenBank mizh soboyu ta iz poslidovnostyami z inshih dzherel Podil na rozdiliGenBank kategorizuye poslidovnosti do kilkoh rozdiliv v zalezhnosti vid organizmu dzherela abo sposobu otrimannya danih Rozdil Opis Kilkist danih u relizi 203 8 2014 PRI Poslidovnosti primativ 6697769597 ROD Poslidovnosti grizuniv 4467459537 MAM Poslidovnosti inshih ssavciv 951689720 VRT Inshi hrebetni 3188004508 INV Poslidovnosti bezhrebetnih 3085847038 PLN Roslinni poslidovnosti 9012205825 BCT Bakterijni poslidovnosti 187345 VRL Virusni poslidovnosti 2125907663 PHG Poslidovnosti bakteriofagiv 146804958 SYN Sintetichni poslidovnosti 976696717 UNA Neanotovani poslidovnosti 187345 WSG Dani angl Whole genome shotgun 774052098731 ENV Zrazki iz navkolishnogo seredovisha 4297282924 PAT Zapatentovani poslidovnosti 14647872659 TSA Dani sekvenuvannya transkriptomu metodom drobovika 9323352861 HTC Dani visokoproduktivnogo sekvenuvannya kDNK 671972485 HTG Dani visokoproduktivnogo sekvenuvannya genomnoyi DNK 25386830568 GSS Genome survey sequences 24293870378 EST Expressed sequence tags 42086482490 STS Sequence tagged sites 640701468 Podil na rozdili za organizmami ye istorichnim i ne vidobrazhaye suchasnoyi klasifikaciyi Cherez ce a takozh tomu sho chastina poslidovnostej pevnogo organizmu mozhut perebuvati u rozdili za tehnologiyeyu napriklad EST abo HTG dlya poshuku danih za organizmom slid vikoristovuvati NCBI Taxonomy Browser 19 travnya 2020 u Wayback Machine Identifikatori i nomeri dostupu poslidovnostejKozhnomu zapisu sho skladayetsya iz poslidovnosti i suputnoyi informaciyi prisvoyuyetsya unikalnij nomer dostupu spilnij dlya troh baz danih sho spivpracyuyut GenBank DDBJ ENA Cej nomer mozhna znajti u ryadku ACCESSION vidpovidnogo zapisu Vin ne zminyuyetsya vprodovzh vsogo chasu isnuvannya zapisu navit yaksho dani onovlyuyutsya Natomist zmini vidobrazhayutsya za dopomogoyu sufiksa nomera dostupu sho poznachaye versiyu Pochatkovoyu versiyeyu poslidovnosti zavzhdi ye 1 Kozhnij versiyi nukleotidnoyi poslidovnosti takozh prisvoyuyetsya unikalnij NCBI identifikator GI jogo mozhna znajti u ryadku VERSION napriklad U49845 1 GI 1293613 Koli dani pro poslidovnist onovlyuyutsya nova versiya otrimuye inshij GI a versiya nomera dostupu inkrementuyetsya Z nomerom dostupu bez vkazannya versiyi mozhna znajti najnovishi dani Zapisi GenBank rekomenduyetsya cituvati iz vikoristannyam nomera dostupu iz vkazannyam versiyi Zavantazhennya vmistuSho dva misyaci NCBI vipuskaye novij povnij reliz GenBank yakij mozhna bezkoshtovno zavantazhiti cherez FTP Krim togo shodenno vihodyat onovlennya takozh vilni do zavantazhennya PrimitkiBenson DA Clark K Karsch Mizrachi I Lipman DJ Ostell J Sayers EW 2015 GenBank Nucleic Acids Res 43 Database issue D30 5 doi 10 1093 nar gku1216 PMID 25414350 NCBI Arhiv originalu za 9 listopada 2015 Procitovano 11 listopada 2015 Jonathan Pevsner 2009 Bioinformatics and Functional Genomics vid 2nd Wiley s 14 23 ISBN 978 0 470 08585 1 Procitovano 11 listopada 2015 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Obslugovuvannya CS1 Storinki z parametrom url status ale bez parametra archive url posilannya Posilannya NCBI Arhiv originalu za 9 listopada 2015 Procitovano 11 listopada 2015 NCBI Arhiv originalu za 10 veresnya 2015 Procitovano 11 listopada 2015 zrazok zapisu na GenBank