Біграмний шифр — це криптографічний алгоритм, призначений для шифрування груп з двох букв (біграм).
«Батьком» біграмних шифрів вважають німецького абата Йоганеса Трісемуса, який ще 1508 року у своїй роботі з криптології, яка називалася «Поліграфія», вперше згадав про можливість шифрування біграм, тобто, дволітерних поєднань. Їх стійкість до розкриття виявилася значно вищою, ніж у попередників, тому деякі біграмні шифри зберегли актуальність аж до Другої світової війни.
В роки Першої світової війни Велика Британія використовувала біграмний «Шифр Плейфера».
Біграмний шифр «Подвійний квадрат», винайдений англійцем Чарльзом Вітстоном 1854 року, в роки Другої світової війни використовували німці.
Характеристика
Біграми використовують в одній з найуспішніших мовних моделей для розпізнавання мовлення. Вони є частковим випадком N-грам.
Частоти біграм можна використати в криптографії для розв'язання криптограм. (Див. Частотний аналіз)
Частоти біграм є одним з підходів до статистичної ідентифікації мови.
Біграми допомагають отримати умовну ймовірність символу з урахуванням попереднього символу, застосовуючи відношення умовної ймовірності:
Тобто, ймовірність символу , якому передує символ , дорівнює ймовірності їх біграми , поділеній на ймовірність попереднього символу.
Біграми слів української мови
Частота біграм в англійській мові
Частота найпоширеніших біграм у невеликому англомовному корпусі:
th 1.52 en 0.55 ng 0.18 he 1.28 ed 0.53 of 0.16 in 0.94 to 0.52 al 0.09 er 0.94 it 0.50 de 0.09 an 0.82 ou 0.50 se 0.08 re 0.68 ea 0.47 le 0.08 nd 0.63 hi 0.46 sa 0.06 at 0.59 is 0.46 si 0.05 on 0.57 or 0.43 ar 0.04 nt 0.56 ti 0.34 ve 0.04 ha 0.56 as 0.33 ra 0.04 es 0.56 te 0.27 ld 0.02 st 0.55 et 0.19 ur 0.02
Доступні також повні таблиці частоти біграм для більших корпусів.
Див. також
Примітки
- Collins, Michael John (24 червня 1996). . Proceedings of the 34th annual meeting on Association for Computational Linguistics -. Association for Computational Linguistics. с. 184—191. arXiv:cmp-lg/9605012. doi:10.3115/981863.981888. S2CID 12615602. Архів оригіналу за 8 жовтня 2018. Процитовано 9 жовтня 2018.
- . Архів оригіналу за 5 червня 2011. Процитовано 18 квітня 2018.
- Jones, Michael N; D J K Mewhort (August 2004). Case-sensitive letter and bigram frequency counts from large-scale English corpora. Behavior Research Methods, Instruments, and Computers. 36 (3): 388—396. doi:10.3758/bf03195586. ISSN 0743-3808. PMID 15641428.
- . norvig.com. Архів оригіналу за 19 жовтня 2018. Процитовано 28 жовтня 2019.
Посилання
- Digraph Frequency (based on a sample of 40,000 words) [ 5 червня 2011 у Wayback Machine.]
- Double, Triple, and Quadruple Bigrams [ 19 квітня 2018 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bigramnij shifr ce kriptografichnij algoritm priznachenij dlya shifruvannya grup z dvoh bukv bigram Batkom bigramnih shifriv vvazhayut nimeckogo abata Joganesa Trisemusa yakij she 1508 roku u svoyij roboti z kriptologiyi yaka nazivalasya Poligrafiya vpershe zgadav pro mozhlivist shifruvannya bigram tobto dvoliternih poyednan Yih stijkist do rozkrittya viyavilasya znachno vishoyu nizh u poperednikiv tomu deyaki bigramni shifri zberegli aktualnist azh do Drugoyi svitovoyi vijni V roki Pershoyi svitovoyi vijni Velika Britaniya vikoristovuvala bigramnij Shifr Plejfera Bigramnij shifr Podvijnij kvadrat vinajdenij anglijcem Charlzom Vitstonom 1854 roku v roki Drugoyi svitovoyi vijni vikoristovuvali nimci HarakteristikaBigrami vikoristovuyut v odnij z najuspishnishih movnih modelej dlya rozpiznavannya movlennya Voni ye chastkovim vipadkom N gram Chastoti bigram mozhna vikoristati v kriptografiyi dlya rozv yazannya kriptogram Div Chastotnij analiz Chastoti bigram ye odnim z pidhodiv do statistichnoyi identifikaciyi movi Bigrami dopomagayut otrimati umovnu jmovirnist simvolu z urahuvannyam poperednogo simvolu zastosovuyuchi vidnoshennya umovnoyi jmovirnosti P W n W n 1 P W n 1 W n P W n 1 displaystyle P W n W n 1 P W n 1 W n over P W n 1 Tobto jmovirnist P displaystyle P simvolu W n displaystyle W n yakomu pereduye simvol W n 1 displaystyle W n 1 dorivnyuye jmovirnosti yih bigrami P W n 1 W n displaystyle P W n 1 W n podilenij na jmovirnist poperednogo simvolu Bigrami sliv ukrayinskoyi moviStatistika bigram v ukrayinskih slovah z fajlu usr share dict ukrainian Krapka poznachaye kinec i pochatok slova Pershij ryadok mistit jmovirnosti dlya kozhnoyi bukvi pochati slovo Napriklad dlya i chi m yakogo znaka vona nulova Drugij ryadok z yakoyu jmovirnistyu pevna bukva bude v slovi pislya bukvi a i t d Takozh vklyucheni apostrof i defis Z peredostannogo ryadka mozhna pobachiti sho z 69 jmovirnosti pislya apostrofa bude ya 14 ye 9 yi 7 yu a reshka vinyatki na v mezhah pohibki na zrazok O Nil Yaksho zustrichayetsya bukva yi to v 70 vipadkiv slovo dali zakinchuyetsya Chastota bigram v anglijskij moviChastota najposhirenishih bigram u nevelikomu anglomovnomu korpusi th 1 52 en 0 55 ng 0 18 he 1 28 ed 0 53 of 0 16 in 0 94 to 0 52 al 0 09 er 0 94 it 0 50 de 0 09 an 0 82 ou 0 50 se 0 08 re 0 68 ea 0 47 le 0 08 nd 0 63 hi 0 46 sa 0 06 at 0 59 is 0 46 si 0 05 on 0 57 or 0 43 ar 0 04 nt 0 56 ti 0 34 ve 0 04 ha 0 56 as 0 33 ra 0 04 es 0 56 te 0 27 ld 0 02 st 0 55 et 0 19 ur 0 02 Dostupni takozh povni tablici chastoti bigram dlya bilshih korpusiv Div takozhDigraf N grama Indeks SorensenaPrimitkiCollins Michael John 24 chervnya 1996 Proceedings of the 34th annual meeting on Association for Computational Linguistics Association for Computational Linguistics s 184 191 arXiv cmp lg 9605012 doi 10 3115 981863 981888 S2CID 12615602 Arhiv originalu za 8 zhovtnya 2018 Procitovano 9 zhovtnya 2018 Arhiv originalu za 5 chervnya 2011 Procitovano 18 kvitnya 2018 Jones Michael N D J K Mewhort August 2004 Case sensitive letter and bigram frequency counts from large scale English corpora Behavior Research Methods Instruments and Computers 36 3 388 396 doi 10 3758 bf03195586 ISSN 0743 3808 PMID 15641428 norvig com Arhiv originalu za 19 zhovtnya 2018 Procitovano 28 zhovtnya 2019 PosilannyaDigraph Frequency based on a sample of 40 000 words 5 chervnya 2011 u Wayback Machine Double Triple and Quadruple Bigrams 19 kvitnya 2018 u Wayback Machine