Зако́н Ци́пфа (Зіпфа) — закон, згідно з яким відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу).
Закон Ципфа | |
Названо на честь | Джордж Ципф[1] |
---|---|
Першовідкривач або винахідник | Джордж Ципф |
Формула | |
Підтримується Вікіпроєктом | |
Закон Ципфа у Вікісховищі |
Інакше кажучи, якщо всі слова мови (або просто достатньо довгого тексту) впорядкувати за спаданням частоти їхнього використання, то частота n-го слова в такому списку виявиться приблизно обернено пропорційною його порядковому номеру n (так званому рангу цього слова). Наприклад, друге за вживаністю слово трапляється приблизно вдвічі рідше, ніж перше, третє — втричі рідше, ніж перше, і так далі.
Загальна характеристика
Американський дослідник Джордж Ципф дійшов висновку, що існує залежність між числом різних і його відносною частотою вживання. Кількість значення наближається до квадратного кореня від частоти слова: т = f , де т — число значень, а f — відносна частота. Інша закономірність, встановлена Ципфом, має таке формулювання: відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу) rf = с, де r — ранг слова в частотному словнику, f — частота слова, с — постійна величина. Тісний зв'язок існує також між частотними характеристиками слова в пам'яті та в словнику.
Застосування
Закон Ципфа може бути застосований до будь-якого тексту, записаного природною або штучною мовою, коду (наприклад, ДНК) або сигналу, при цьому правила викладення інформації можуть лишатись невідомими. Як наслідок, закон дозволяє визначити наявність інформації в повідомленні навіть у випадках, коли саме повідомлення не може бути дешифроване.
В результаті статистичного аналізу Рукопису Войнича, написаного невідомою мовою, було доведено, що цей рукопис містить осмислену інформацію. Аналіз проводився з використанням методу, що лежить в основі закону Ципфа.
Література
- Кочерган М. П. Загальне мовознавство: підручник / Михайло Петрович Кочерган. — Київ: Академія, 2003. — С. 398.
- Henri Guiter, Michail V. Arapov (Hrsg.): Studies on Zipf's Law (= Quantitative Linguistics. Bd. 16). Studienverlag Brockmeyer, Bochum 1982, .
Примітки
- Крістал Д. The Cambridge Encyclopedia of Language — Видавництво Кембриджського університету, 1987. — С. 87. —
- Fagan, Stephen; Gençay, Ramazan (2010), An introduction to textual econometrics, у Ullah, Aman; Giles, David E. A. (ред.), Handbook of Empirical Economics and Finance, CRC Press, с. 133—153, ISBN . P. 139: «For example, in the Brown Corpus, consisting of over one million words, half of the word volume consists of repeated uses of only 135 words.»
- «Слишком много совпадений» [ 15 липня 2013 у Wayback Machine.](рос.)
Посилання
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Zako n Ci pfa Zipfa zakon zgidno z yakim vidnoshennya rangu slova v chastotnomu slovniku do chastotnosti slova v movi stanovit postijnu velichinu konstantu Zakon CipfaNazvano na chestDzhordzh Cipf 1 Pershovidkrivach abo vinahidnikDzhordzh CipfFormulaf k s N 1 ks n 1N 1 ns displaystyle f k s N frac 1 k s sum n 1 N 1 n s Pidtrimuyetsya VikiproyektomVikipediya Proyekt Matematika Zakon Cipfa u Vikishovishi Inakshe kazhuchi yaksho vsi slova movi abo prosto dostatno dovgogo tekstu vporyadkuvati za spadannyam chastoti yihnogo vikoristannya to chastota n go slova v takomu spisku viyavitsya priblizno oberneno proporcijnoyu jogo poryadkovomu nomeru n tak zvanomu rangu cogo slova Napriklad druge za vzhivanistyu slovo traplyayetsya priblizno vdvichi ridshe nizh pershe tretye vtrichi ridshe nizh pershe i tak dali Zagalna harakteristikaAmerikanskij doslidnik Dzhordzh Cipf dijshov visnovku sho isnuye zalezhnist mizh chislom riznih i jogo vidnosnoyu chastotoyu vzhivannya Kilkist znachennya nablizhayetsya do kvadratnogo korenya vid chastoti slova t f de t chislo znachen a f vidnosna chastota Insha zakonomirnist vstanovlena Cipfom maye take formulyuvannya vidnoshennya rangu slova v chastotnomu slovniku do chastotnosti slova v movi stanovit postijnu velichinu konstantu rf s de r rang slova v chastotnomu slovniku f chastota slova s postijna velichina Tisnij zv yazok isnuye takozh mizh chastotnimi harakteristikami slova v pam yati ta v slovniku ZastosuvannyaZakon Cipfa mozhe buti zastosovanij do bud yakogo tekstu zapisanogo prirodnoyu abo shtuchnoyu movoyu kodu napriklad DNK abo signalu pri comu pravila vikladennya informaciyi mozhut lishatis nevidomimi Yak naslidok zakon dozvolyaye viznachiti nayavnist informaciyi v povidomlenni navit u vipadkah koli same povidomlennya ne mozhe buti deshifrovane V rezultati statistichnogo analizu Rukopisu Vojnicha napisanogo nevidomoyu movoyu bulo dovedeno sho cej rukopis mistit osmislenu informaciyu Analiz provodivsya z vikoristannyam metodu sho lezhit v osnovi zakonu Cipfa LiteraturaKochergan M P Zagalne movoznavstvo pidruchnik Mihajlo Petrovich Kochergan Kiyiv Akademiya 2003 S 398 Henri Guiter Michail V Arapov Hrsg Studies on Zipf s Law Quantitative Linguistics Bd 16 Studienverlag Brockmeyer Bochum 1982 ISBN 3 88339 244 8 PrimitkiKristal D The Cambridge Encyclopedia of Language Vidavnictvo Kembridzhskogo universitetu 1987 S 87 ISBN 978 0 521 42443 1 d Track Q471550d Track Q912887d Track Q23306977 Fagan Stephen Gencay Ramazan 2010 An introduction to textual econometrics u Ullah Aman Giles David E A red Handbook of Empirical Economics and Finance CRC Press s 133 153 ISBN 9781420070361 P 139 For example in the Brown Corpus consisting of over one million words half of the word volume consists of repeated uses of only 135 words Slishkom mnogo sovpadenij 15 lipnya 2013 u Wayback Machine ros Posilannya