HomoloGene — інструмент Національного центру біотехнологічної інформації США (NCBI), система автоматичного виявлення гомологій (подібність, спричинена походженням від загального предка) серед анотованих генів декількох повністю впорядкованих еукаріотичних геномів.
Методи HomoloGene базуються на аналізі білка організмів. Послідовності порівнюють з використанням blastp, потім їх узгоджують і розподіляють у групи, використовуючи таксономічне дерево, побудоване з подібності послідовностей, де спочатку зближуються споріднені організми, а потім до дерева додають додаткові організми. Вирівнювання білків відбувається до відповідних послідовностей ДНК, а потім розраховують показники відстані на основі (1969).
Послідовності узгоджуються з використанням евристичного алгоритму для максимізації глобальної, а не локальної оцінки парних порівнянь (див. Повний двочастковий граф). Після цього обчислюється статистична значимість кожного зближення.
В інструменті використовуються технології анлізу великих даних. Статистичні обчислення реалізовані засобами мови R.
Примітки
- The Semantic Web: Semantics and Big Data // Philipp Cimiano, Oscar Corcho, Valentina Presutti, Laura Hollink, Sebastian Rudolph (англ.)
Посилання
- HomoloGene [ 22 червня 2018 у Wayback Machine.]
- GitHub проєкту [ 11 червня 2018 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
HomoloGene instrument Nacionalnogo centru biotehnologichnoyi informaciyi SShA NCBI sistema avtomatichnogo viyavlennya gomologij podibnist sprichinena pohodzhennyam vid zagalnogo predka sered anotovanih geniv dekilkoh povnistyu vporyadkovanih eukariotichnih genomiv Metodi HomoloGene bazuyutsya na analizi bilka organizmiv Poslidovnosti porivnyuyut z vikoristannyam blastp potim yih uzgodzhuyut i rozpodilyayut u grupi vikoristovuyuchi taksonomichne derevo pobudovane z podibnosti poslidovnostej de spochatku zblizhuyutsya sporidneni organizmi a potim do dereva dodayut dodatkovi organizmi Virivnyuvannya bilkiv vidbuvayetsya do vidpovidnih poslidovnostej DNK a potim rozrahovuyut pokazniki vidstani na osnovi 1969 Poslidovnosti uzgodzhuyutsya z vikoristannyam evristichnogo algoritmu dlya maksimizaciyi globalnoyi a ne lokalnoyi ocinki parnih porivnyan div Povnij dvochastkovij graf Pislya cogo obchislyuyetsya statistichna znachimist kozhnogo zblizhennya V instrumenti vikoristovuyutsya tehnologiyi anlizu velikih danih Statistichni obchislennya realizovani zasobami movi R PrimitkiThe Semantic Web Semantics and Big Data Philipp Cimiano Oscar Corcho Valentina Presutti Laura Hollink Sebastian Rudolph angl PosilannyaHomoloGene 22 chervnya 2018 u Wayback Machine GitHub proyektu 11 chervnya 2018 u Wayback Machine