Відстань Геммінга (англ. Hamming distance) — число позицій, у яких відповідні цифри двох двійкових слів однакової довжини різні. У загальнішому випадку відстань Геммінга застосовується для рядків однакової довжини будь-яких абеток, що складаються з q символів, і служить метрикою відмінності (функцією, що визначає відстань в метричному просторі) об'єктів однакової вимірності.
Іншими словами, відстань Геммінга вимірює мінімальну кількість замін, необхідних для зміни одного рядка в інший, або мінімальну кількість помилок, які могли перетворити одну стрічку в іншу. У більш загальному контексті відстань Хеммінга є однією з [en] для вимірювання [en] між двома послідовностями.
Спочатку метрика була сформульована Річардом Геммінгом під час його роботи в Bell Labs для визначення міри відмінності між кодовими комбінаціями (двійковими векторами) у векторному просторі кодових послідовностей, в цьому випадку відстанню Геммінга між двома двійковими послідовностями (векторами) і довжини називається кількість позицій, в яких вони різні — в такому формулюванні відстань Геммінга увійшла в [en] національного інституту стандартів і технологій США.
Приклади
Властивості
Відстань Геммінга має властивості метрики, задовольняючи таким умовам:
Відстань Геммінга в біоінформатиці та геноміці
Для нуклеїнових кислот (ДНК та РНК) можливість гібридизації двох полінуклеотидних ланцюгів з утворенням вторинної структури — подвійної спіралі — залежить від ступеня комплементарності нуклеотидних послідовностей обох ланцюгів. При збільшенні відстані Геммінга кількість водневих зв'язків, утворених комплементарними парами основ зменшується і, відповідно, зменшується стабільність подвійного ланцюга. Починаючи з деякої граничної відстані Геммінга гібридизація стає неможливою.
При еволюційному розходженні гомологічних ДНК-послідовностей відстань Геммінга є мірою, за якою можна судити про час, що пройшов з моменту розбіжності гомологів, наприклад, про тривалість еволюційного відрізку, що розділяє гени-гомолог і ген-попередник.
Див. також
Примітки
- Hamming distance: The number of digit positions in which the corresponding digits of two binary words of the same length are different (Federal Standard 1037C [ 2 березня 2009 у Wayback Machine.]).
Література
- Блейхут Р. Теория и практика кодов, контролирующих ошибки = Theory and Practice of Error Control Codes. — М.: Мир, 1986. — 576 с.
- Hamming, Richard W. (1950), (PDF), , 29 (2): 147—160, MR 0035935, архів оригіналу (PDF) за 25 травня 2006, процитовано 25 листопада 2012.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Vidstan Gemminga angl Hamming distance chislo pozicij u yakih vidpovidni cifri dvoh dvijkovih sliv odnakovoyi dovzhini rizni U zagalnishomu vipadku vidstan Gemminga zastosovuyetsya dlya ryadkiv odnakovoyi dovzhini bud yakih abetok sho skladayutsya z q simvoliv i sluzhit metrikoyu vidminnosti funkciyeyu sho viznachaye vidstan v metrichnomu prostori ob yektiv odnakovoyi vimirnosti Inshimi slovami vidstan Gemminga vimiryuye minimalnu kilkist zamin neobhidnih dlya zmini odnogo ryadka v inshij abo minimalnu kilkist pomilok yaki mogli peretvoriti odnu strichku v inshu U bilsh zagalnomu konteksti vidstan Hemminga ye odniyeyu z en dlya vimiryuvannya en mizh dvoma poslidovnostyami Spochatku metrika bula sformulovana Richardom Gemmingom pid chas jogo roboti v Bell Labs dlya viznachennya miri vidminnosti mizh kodovimi kombinaciyami dvijkovimi vektorami u vektornomu prostori kodovih poslidovnostej v comu vipadku vidstannyu Gemminga d x y displaystyle d x y mizh dvoma dvijkovimi poslidovnostyami vektorami x displaystyle x i y displaystyle y dovzhini n displaystyle n nazivayetsya kilkist pozicij v yakih voni rizni v takomu formulyuvanni vidstan Gemminga uvijshla v en nacionalnogo institutu standartiv i tehnologij SShA Prikladid 10 1 1 1 01 10 0 1 0 01 2 displaystyle d 10 color Blue 1 1 color Blue 1 01 10 color Red 0 1 color Red 0 01 2 d 2 17 3 8 96 2 23 3 7 96 3 displaystyle d 2 color Blue 17 3 color Blue 8 96 2 color Red 23 3 color Red 7 96 3 d t o n e d r o s e s 3 displaystyle d color Blue t o color Blue n e color Blue d color Red r o color Red s e color Red s 3 VlastivostiVidstan Gemminga maye vlastivosti metriki zadovolnyayuchi takim umovam d x y 0 displaystyle d x y geq 0 d x x 0 displaystyle d x x 0 d x y d y x displaystyle d x y d y x d x z d x y d y z displaystyle d x z leq d x y d y z Vidstan Gemminga v bioinformatici ta genomiciDlya nukleyinovih kislot DNK ta RNK mozhlivist gibridizaciyi dvoh polinukleotidnih lancyugiv z utvorennyam vtorinnoyi strukturi podvijnoyi spirali zalezhit vid stupenya komplementarnosti nukleotidnih poslidovnostej oboh lancyugiv Pri zbilshenni vidstani Gemminga kilkist vodnevih zv yazkiv utvorenih komplementarnimi parami osnov zmenshuyetsya i vidpovidno zmenshuyetsya stabilnist podvijnogo lancyuga Pochinayuchi z deyakoyi granichnoyi vidstani Gemminga gibridizaciya staye nemozhlivoyu Pri evolyucijnomu rozhodzhenni gomologichnih DNK poslidovnostej vidstan Gemminga ye miroyu za yakoyu mozhna suditi pro chas sho projshov z momentu rozbizhnosti gomologiv napriklad pro trivalist evolyucijnogo vidrizku sho rozdilyaye geni gomolog i gen poperednik Div takozhVidstan Levenshtejna Viyavlennya ta vipravlennya pomilok Bent funkciyaPrimitkiHamming distance The number of digit positions in which the corresponding digits of two binary words of the same length are different Federal Standard 1037C 2 bereznya 2009 u Wayback Machine LiteraturaBlejhut R Teoriya i praktika kodov kontroliruyushih oshibki Theory and Practice of Error Control Codes M Mir 1986 576 s Hamming Richard W 1950 PDF 29 2 147 160 MR 0035935 arhiv originalu PDF za 25 travnya 2006 procitovano 25 listopada 2012