Перетворення Берроуза-Вілера (англ. Burrows-Wheeler Transform, BWT) — метод перестановки символів у стрічці в іншу стрічку , таким чином, що із можна отримати початкову послідовність, але в той же час вона краще придатна для стиснення.
Щоб знайти від стрічки довжиною слід згенерувати циклічних ротацій цієї стрічки, відсортувати їх у лексикографічному порядку і отримати нову стрічку з останніх символів цих ротацій. Якщо вихідна стрічка містить багато повторів (як, наприклад, природна мова або геноми живих організмів), то трансформована міститиме багато серій (послідовностей, в яких один і той же символ зустрічається кілька разів поспіль).
Перетворення Берроуза-Вілера використовують для стиснення даних без втрат, зокрема воно є частиною алгоритму bzip2, а також для індексування. Наприклад, у біоінформатиці воно дозволяє скоротити витрати пам'яті під час картування фрагментів, отриманих шляхом секвенування ДНК, стосовно референсних геномів. Цей метод перетворення послідовностей запропонували у 1994 році і .
Отримання
Перетворення Берроуза-Вілера можна отримати, використавши однойменну матрицю. Нехай вихідна стрічка буде "тамтам$", вона повинна містити символ-термінатор ($), який не трапляється ніде в інших позиціях цієї стрічки і лексикографічно передує всім іншим символам. Спершу слід згенерувати усі циклічні ротації цієї стрічки, записавши їх одна під одною, ми отримуємо квадратну матрицю. Далі відсортовуємо рядки матриці у лексикографічному порядку, тепер останній її стовпець прочитаний згори вниз утворює , у нашому випадку "мттаам$".
Ротації | Відсортовані ротації |
---|---|
тамтам$ амтам$т мтам$та там$там ам$тамт м$тамта $тамтам | $тамтам ам$тамт амтам$т м$тамта мтам$та там$там тамтам$ |
Примітки
- Julian Seward. . Архів оригіналу за 16 квітня 2015. Процитовано 9 квітня 2015.
- ; (1994), , Technical Report 124, Digital Equipment Corporation, архів оригіналу за 7 червня 2011, процитовано 9 квітня 2015
Це незавершена стаття про алгоритми. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Peretvorennya Berrouza Vilera angl Burrows Wheeler Transform BWT metod perestanovki simvoliv u strichci T displaystyle T v inshu strichku B W T T displaystyle BWT T takim chinom sho iz B W T T displaystyle BWT T mozhna otrimati pochatkovu poslidovnist ale v toj zhe chas vona krashe pridatna dlya stisnennya Shob znajti B W T T displaystyle BWT T vid strichki T displaystyle T dovzhinoyu n displaystyle n slid zgeneruvati n displaystyle n ciklichnih rotacij ciyeyi strichki vidsortuvati yih u leksikografichnomu poryadku i otrimati novu strichku z ostannih simvoliv cih rotacij Yaksho vihidna strichka mistit bagato povtoriv yak napriklad prirodna mova abo genomi zhivih organizmiv to transformovana mistitime bagato serij poslidovnostej v yakih odin i toj zhe simvol zustrichayetsya kilka raziv pospil Peretvorennya Berrouza Vilera vikoristovuyut dlya stisnennya danih bez vtrat zokrema vono ye chastinoyu algoritmu bzip2 a takozh dlya indeksuvannya Napriklad u bioinformatici vono dozvolyaye skorotiti vitrati pam yati pid chas kartuvannya fragmentiv otrimanih shlyahom sekvenuvannya DNK stosovno referensnih genomiv Cej metod peretvorennya poslidovnostej zaproponuvali u 1994 roci i OtrimannyaPeretvorennya Berrouza Vilera mozhna otrimati vikoristavshi odnojmennu matricyu Nehaj vihidna strichka bude tamtam vona povinna mistiti simvol terminator yakij ne traplyayetsya nide v inshih poziciyah ciyeyi strichki i leksikografichno pereduye vsim inshim simvolam Spershu slid zgeneruvati usi ciklichni rotaciyi ciyeyi strichki zapisavshi yih odna pid odnoyu mi otrimuyemo kvadratnu matricyu Dali vidsortovuyemo ryadki matrici u leksikografichnomu poryadku teper ostannij yiyi stovpec prochitanij zgori vniz utvoryuye B W T displaystyle BWT u nashomu vipadku mttaam Rotaciyi Vidsortovani rotaciyi tamtam amtam t mtam ta tam tam am tamt m tamta tamtam tamtam am tamt amtam t m tamta mtam ta tam tam tamtam PrimitkiJulian Seward Arhiv originalu za 16 kvitnya 2015 Procitovano 9 kvitnya 2015 1994 Technical Report 124 Digital Equipment Corporation arhiv originalu za 7 chervnya 2011 procitovano 9 kvitnya 2015 Ce nezavershena stattya pro algoritmi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi