Метафон (англ. Metaphone) — фонетичний алгоритм, опублікований 1990 року для індексації слів в англійській вимові. Алгоритм із змінною довжиною ключа, на відміну від Саундекс у фіксованій довжині ключів.
Метафон був розроблений як відповідь на недоліки в алгоритмі Саундекс. Він використовує більший набір правил англійської вимови. Метафон доступний як вбудований оператор у низці систем, зокрема, у останніх версіях PHP.
Пізніше створено нову версію алгоритму, , яка виробляє точніші результати, ніж початковий алгоритм.
Процедура
Метафон використовує 16 символів приголосних 0BFHJKLMNPRSTWXY. «0» Представляє «th» , 'X' представляє «sh» чи «ch», інші представляють їх звичайне звучання в англійській мові. Голосні AEIOU також використовуються, але тільки на початку коду.
- Видалити другу із подвійних літер, за винятком С.
- Якщо слово починається з 'КН', 'GN', 'PN', 'АЕ', 'WR', видалити першу літеру.
- Видалити 'B' після 'М', якщо вона в кінці слова.
- 'C' перетворюється в 'X', якщо за нею 'IA' або 'H' (але не в випадку, коли вона є частиною '-SCH-' — тоді вона перетворюється в "K"). 'C' перетворюється в 'S', якщо за нею 'I', 'E', або 'Y'. В іншому випадку, 'C' перетворюється в 'K'.
- 'D' перетворюється в 'J', якщо за нею 'GE', 'GY', або 'GI'. В іншому випадку, 'D' перетворюється в 'T'.
- 'G' випадає, якщо за нею 'H' і 'H' не в кінці слова, або перед голосною. 'G' випадає, якщо за ним 'N' або 'NED' в кінці слова.
- 'G' перетворюється в 'J', якщо за нею 'T', 'Е', або 'Y', і вона не є частиною 'GG'. В іншому випадку, 'G' перетворюється в 'К'.
- 'H' випадає, якщо після голосної, але не перед голосною.
- 'CK' перетворюється в 'К'.
- 'PH' перетворюється в 'F'.
- 'Q' перетворюється в 'К'.
- 'S' перетворюється в 'X', якщо за нею 'H', 'IO', або 'IA'.
- 'T' перетворюється в 'X', якщо за нею 'IA', або 'IO'. 'TH' перетворюється в '0'. 'T' випадає, якщо перед 'CH'.
- 'V' перетворюється в 'F'.
- 'WH' перетворюється в 'W', якщо на початку слова. 'W' випадає, якщо за нею не має голосних.
- 'X' перетворюється в 'S', якщо на початку слова. В іншому випадку, 'Х' перетворюється в 'KS'.
- 'Y' випадає, якщо не перед голосною.
- 'Z' перетворюється в 'S'.
- Всі голосні, що не на початку слова, випадають.
Подвійний метафон
Подвійний метафон — алгоритм пошуку другого покоління цього алгоритму. Його реалізація була описана в червні 2000 року.
Він називається "подвійним", тому що може повернутися як первинний і вторинний код для рядка; це становить деякі неоднозначні випадки, а також для декількох варіантів прізвищ із загального родоводу. Наприклад, кодування імені "Smith" дає основний код SM0 і вторинних код XMT, у той час, як ім'я "Schmidt" дає основний код SM0 і вторинних код XMT — обидва мають SM0 спільні.
Подвійний метафон намагається пояснити безлічь слів англійською мовою слов'янського, германського, кельтського, грецького, французького, італійського, іспанського, китайського, та іншого походження. Таким чином він використовує набагато складніший набір правил для кодування, ніж його попередник.
Метафон 3
Метафон 3 спрямований на подальше підвищення точності фонетичного кодування слів в англійській мові. Було додано здатність кодувати метафон ключі не беручи голосні до уваги, а також кодувати дзвінкі і глухі приголосні по-різному.
Було оголошено розвиток і в інших мовних версіях. Метафон 3 продається у вигляді вихідного коду на , Java і C# за 40 доларів США.
Див. також
Посилання
- Александр Радишевский. Алгоритмы приблизительного сравнения текста. Морфоэдро. Архів оригіналу за 12 липня 2013. Процитовано 6 березня 2011.(рос.)
Це незавершена стаття про алгоритми. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Metafon angl Metaphone fonetichnij algoritm opublikovanij 1990 roku dlya indeksaciyi sliv v anglijskij vimovi Algoritm iz zminnoyu dovzhinoyu klyucha na vidminu vid Saundeks u fiksovanij dovzhini klyuchiv Metafon buv rozroblenij yak vidpovid na nedoliki v algoritmi Saundeks Vin vikoristovuye bilshij nabir pravil anglijskoyi vimovi Metafon dostupnij yak vbudovanij operator u nizci sistem zokrema u ostannih versiyah PHP Piznishe stvoreno novu versiyu algoritmu yaka viroblyaye tochnishi rezultati nizh pochatkovij algoritm ProceduraMetafon vikoristovuye 16 simvoliv prigolosnih 0BFHJKLMNPRSTWXY 0 Predstavlyaye th X predstavlyaye sh chi ch inshi predstavlyayut yih zvichajne zvuchannya v anglijskij movi Golosni AEIOU takozh vikoristovuyutsya ale tilki na pochatku kodu Vidaliti drugu iz podvijnih liter za vinyatkom S Yaksho slovo pochinayetsya z KN GN PN AE WR vidaliti pershu literu Vidaliti B pislya M yaksho vona v kinci slova C peretvoryuyetsya v X yaksho za neyu IA abo H ale ne v vipadku koli vona ye chastinoyu SCH todi vona peretvoryuyetsya v K C peretvoryuyetsya v S yaksho za neyu I E abo Y V inshomu vipadku C peretvoryuyetsya v K D peretvoryuyetsya v J yaksho za neyu GE GY abo GI V inshomu vipadku D peretvoryuyetsya v T G vipadaye yaksho za neyu H i H ne v kinci slova abo pered golosnoyu G vipadaye yaksho za nim N abo NED v kinci slova G peretvoryuyetsya v J yaksho za neyu T E abo Y i vona ne ye chastinoyu GG V inshomu vipadku G peretvoryuyetsya v K H vipadaye yaksho pislya golosnoyi ale ne pered golosnoyu CK peretvoryuyetsya v K PH peretvoryuyetsya v F Q peretvoryuyetsya v K S peretvoryuyetsya v X yaksho za neyu H IO abo IA T peretvoryuyetsya v X yaksho za neyu IA abo IO TH peretvoryuyetsya v 0 T vipadaye yaksho pered CH V peretvoryuyetsya v F WH peretvoryuyetsya v W yaksho na pochatku slova W vipadaye yaksho za neyu ne maye golosnih X peretvoryuyetsya v S yaksho na pochatku slova V inshomu vipadku H peretvoryuyetsya v KS Y vipadaye yaksho ne pered golosnoyu Z peretvoryuyetsya v S Vsi golosni sho ne na pochatku slova vipadayut Podvijnij metafonPodvijnij metafon algoritm poshuku drugogo pokolinnya cogo algoritmu Jogo realizaciya bula opisana v chervni 2000 roku Vin nazivayetsya podvijnim tomu sho mozhe povernutisya yak pervinnij i vtorinnij kod dlya ryadka ce stanovit deyaki neodnoznachni vipadki a takozh dlya dekilkoh variantiv prizvish iz zagalnogo rodovodu Napriklad koduvannya imeni Smith daye osnovnij kod SM0 i vtorinnih kod XMT u toj chas yak im ya Schmidt daye osnovnij kod SM0 i vtorinnih kod XMT obidva mayut SM0 spilni Podvijnij metafon namagayetsya poyasniti bezlich sliv anglijskoyu movoyu slov yanskogo germanskogo keltskogo greckogo francuzkogo italijskogo ispanskogo kitajskogo ta inshogo pohodzhennya Takim chinom vin vikoristovuye nabagato skladnishij nabir pravil dlya koduvannya nizh jogo poperednik Metafon 3Metafon 3 spryamovanij na podalshe pidvishennya tochnosti fonetichnogo koduvannya sliv v anglijskij movi Bulo dodano zdatnist koduvati metafon klyuchi ne beruchi golosni do uvagi a takozh koduvati dzvinki i gluhi prigolosni po riznomu Bulo ogolosheno rozvitok i v inshih movnih versiyah Metafon 3 prodayetsya u viglyadi vihidnogo kodu na S Java i C za 40 dolariv SShA Div takozhSaundeksPosilannyaAleksandr Radishevskij Algoritmy priblizitelnogo sravneniya teksta Morfoedro Arhiv originalu za 12 lipnya 2013 Procitovano 6 bereznya 2011 ros Ce nezavershena stattya pro algoritmi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi