Вирівнювання послідовностей в біоінформатиці — метод порівняння нуклеотидних (ДНК, РНК) або пептидних (білки) послідовностей шляхом знаходження схожих ділянок, що може бути наслідком функціональних, структурних або еволюційних зв'язків між послідовностями. Вирівняні послідовності нуклеотидів або амінокислотних залишків зазвичай представляються у вигляді рядків в матриці. Між залишками вставляються пропуски таким чином, що залишки з ідентичними або подібними особливостями вирівнюються в послідовних колонках.
Якщо дві послідовності, що вирівнюються, мають загального предка, невідповідності можуть бути інтерпретовані як , а пропуски — як вставки або делеції, що виникли в одній з послідовностей з того часу, як ці гени відхилилися один від одного. У вирівнюванні послідовностей білків, ступінь схожості між амінокислотами, що займають певну позицію в послідовності, може бути інтерпретований наскільки (збереженим) є цей регіон або між популяціями. Відсутність замін або присутність тільки самих консервативних замін (тобто, заміна амінокислот, чиї мають подібні біохімічні властивості) в специфічній ділянці послідовності, свідчать, що ця ділянка має структурну або функціональну важливість. Хоча основи ДНК і РНК (нуклеотиди) схожі між собою більше, ніж до амінокислот, консервативність утворення пар основ може вказувати на подібний функціональний або структурний зв'язок.
Дуже короткі або дуже подібні послідовності можуть бути вирівняні вручну; проте, найцікавіші проблеми вимагають вирівнювання довгих, надзвичайно варіабельних послідовностей або надзвичайно великого їх числа, що неможливо зробити виключно людськими зусиллями. Натомість, дослідники розроблюють алгоритми, здатні здійснювати високоякісне вирівнювання послідовностей, та іноді уточнюють результати, знаходячи деталі, пошук яких важко представити алгоритмічно (особливо у разі нуклеотидних послідовностей). Обчислювальні методи вирівнювання послідовності загалом можна поділити на дві категорії: глобальні вирівнювання і місцеві вирівнювання. Обчислення глобального вирівнювання — форма глобальної оптимізації, що «вимушує» вирівнювання охопити повну довжину всіх послідовностей у запиті. На відміну від нього, місцеве вирівнювання знаходить схожі ділянки в межах довгих послідовностей, які часто сильно відрізняються на більшій частині своєї протяжності. Місцеве вирівнювання часто є бажанішим, але може бути складнішим для виконання у зв'язку з додатковими складнощами у знаходженні потенційно схожих ділянок. Зараз створені численні обчислювальні алгоритми для вирішення проблеми вирівнювання послідовностей, включаючи повільшіті, але формальні, методи оптимізації динамічного програмування і ефективні евристичні або ймовірнісні методи для пошуку в великих базах даних.
Джерела
- Mount DM. (2004). Bioinformatics: Sequence and Genome Analysis (вид. 2nd). Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY. ISBN .
Це незавершена стаття з біології. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Virivnyuvannya poslidovnostej v bioinformatici metod porivnyannya nukleotidnih DNK RNK abo peptidnih bilki poslidovnostej shlyahom znahodzhennya shozhih dilyanok sho mozhe buti naslidkom funkcionalnih strukturnih abo evolyucijnih zv yazkiv mizh poslidovnostyami Virivnyani poslidovnosti nukleotidiv abo aminokislotnih zalishkiv zazvichaj predstavlyayutsya u viglyadi ryadkiv v matrici Mizh zalishkami vstavlyayutsya propuski takim chinom sho zalishki z identichnimi abo podibnimi osoblivostyami virivnyuyutsya v poslidovnih kolonkah Virivnyuvannya poslidovnostej provedene programoyu Clustal mizh dvoma lyudskimi bilkami z motivom zinc finger dani otrimani z bazi danih GenBank Detalnishe Yaksho dvi poslidovnosti sho virivnyuyutsya mayut zagalnogo predka nevidpovidnosti mozhut buti interpretovani yak a propuski yak vstavki abo deleciyi sho vinikli v odnij z poslidovnostej z togo chasu yak ci geni vidhililisya odin vid odnogo U virivnyuvanni poslidovnostej bilkiv stupin shozhosti mizh aminokislotami sho zajmayut pevnu poziciyu v poslidovnosti mozhe buti interpretovanij naskilki zberezhenim ye cej region abo mizh populyaciyami Vidsutnist zamin abo prisutnist tilki samih konservativnih zamin tobto zamina aminokislot chiyi mayut podibni biohimichni vlastivosti v specifichnij dilyanci poslidovnosti svidchat sho cya dilyanka maye strukturnu abo funkcionalnu vazhlivist Hocha osnovi DNK i RNK nukleotidi shozhi mizh soboyu bilshe nizh do aminokislot konservativnist utvorennya par osnov mozhe vkazuvati na podibnij funkcionalnij abo strukturnij zv yazok Duzhe korotki abo duzhe podibni poslidovnosti mozhut buti virivnyani vruchnu prote najcikavishi problemi vimagayut virivnyuvannya dovgih nadzvichajno variabelnih poslidovnostej abo nadzvichajno velikogo yih chisla sho nemozhlivo zrobiti viklyuchno lyudskimi zusillyami Natomist doslidniki rozroblyuyut algoritmi zdatni zdijsnyuvati visokoyakisne virivnyuvannya poslidovnostej ta inodi utochnyuyut rezultati znahodyachi detali poshuk yakih vazhko predstaviti algoritmichno osoblivo u razi nukleotidnih poslidovnostej Obchislyuvalni metodi virivnyuvannya poslidovnosti zagalom mozhna podiliti na dvi kategoriyi globalni virivnyuvannya i miscevi virivnyuvannya Obchislennya globalnogo virivnyuvannya forma globalnoyi optimizaciyi sho vimushuye virivnyuvannya ohopiti povnu dovzhinu vsih poslidovnostej u zapiti Na vidminu vid nogo misceve virivnyuvannya znahodit shozhi dilyanki v mezhah dovgih poslidovnostej yaki chasto silno vidriznyayutsya na bilshij chastini svoyeyi protyazhnosti Misceve virivnyuvannya chasto ye bazhanishim ale mozhe buti skladnishim dlya vikonannya u zv yazku z dodatkovimi skladnoshami u znahodzhenni potencijno shozhih dilyanok Zaraz stvoreni chislenni obchislyuvalni algoritmi dlya virishennya problemi virivnyuvannya poslidovnostej vklyuchayuchi povilshiti ale formalni metodi optimizaciyi dinamichnogo programuvannya i efektivni evristichni abo jmovirnisni metodi dlya poshuku v velikih bazah danih DzherelaMount DM 2004 Bioinformatics Sequence and Genome Analysis vid 2nd Cold Spring Harbor Laboratory Press Cold Spring Harbor NY ISBN 0 87969 608 7 Ce nezavershena stattya z biologiyi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi