Коефіцієнт Жуайна — в лінгвістиці коефіцієнт, що показує, наскільки універсальне або, навпаки, спеціалізоване застосування того чи іншого слова в текстах різної тематики. Якщо слово вживається лише в текстах певної вузької тематики, коефіцієнт Жуайна близький до 0, якщо ж частота слововживання приблизно однакова в будь-якому тексті, коефіцієнт близький до 100.
Обчислення
Коефіцієнт Жуайна визначається за формулою
де — кількість тематичних сегментів, на які розбито досліджувані тексти;
— середня частота слова за всіма сегментами;
— середньоквадратичне відхилення частот за окремими сегментами.
Для обчислення коефіцієнта Жуайна досліджувані тексти розбиваються на сегменти різної тематики приблизно однакового обсягу (при складанні частотних словників зазвичай виділяють 100 сегментів). Для кожного сегмента обчислюється частота вживання певного слова, тобто кількість слововживань, поділена на загальний обсяг сегмента. Для отриманого ряду частот обчислюється середньоквадратичне відхилення , після чого отримані значення підставляються у формулу.
Приклад
Нехай досліджувані тексти розбито на 4 сегменти, кожен розміром по 1 млн слів. Деяке слово, наприклад, «коефіцієнт» зустрічається в цих сегментах відповідно 10, 11, 8 і 3 рази. тоді = 10, = 11, = 9, = 3 вживання на мільйон. Середнє значення
Середньоквадратичне відхилення
Тоді Коефіцієнт Жуайна
Див. також
Примітки
- Шаров С.А., Ляшевская О.Н. Частотный словарь современного русского языка на материалах Национального корпуса русского языка — М.: Издательский центр «Азбуковник», 2009. — 1060 с.
- Frequency dictionary of French words: A. Juilland, D. Brodin and C. Davidovitch The Romance languages and their structures, First Series F 1. Mouton, The Hague-Paris, 1970. lxxv, 503 pp. ⨍ 120.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Koeficiyent Zhuajna v lingvistici koeficiyent sho pokazuye naskilki universalne abo navpaki specializovane zastosuvannya togo chi inshogo slova v tekstah riznoyi tematiki Yaksho slovo vzhivayetsya lishe v tekstah pevnoyi vuzkoyi tematiki koeficiyent Zhuajna blizkij do 0 yaksho zh chastota slovovzhivannya priblizno odnakova v bud yakomu teksti koeficiyent blizkij do 100 ObchislennyaKoeficiyent Zhuajna viznachayetsya za formuloyu D 100 1 s m n 1 displaystyle D 100 left 1 frac sigma mu sqrt n 1 right de n displaystyle n kilkist tematichnih segmentiv na yaki rozbito doslidzhuvani teksti m displaystyle mu serednya chastota slova za vsima segmentami s displaystyle sigma serednokvadratichne vidhilennya chastot za okremimi segmentami Dlya obchislennya koeficiyenta Zhuajna doslidzhuvani teksti rozbivayutsya na segmenti riznoyi tematiki priblizno odnakovogo obsyagu pri skladanni chastotnih slovnikiv zazvichaj vidilyayut 100 segmentiv Dlya kozhnogo segmenta obchislyuyetsya chastota vzhivannya m i displaystyle mu i pevnogo slova tobto kilkist slovovzhivan podilena na zagalnij obsyag segmenta Dlya otrimanogo ryadu chastot m i displaystyle mu i obchislyuyetsya serednokvadratichne vidhilennya s displaystyle sigma pislya chogo otrimani znachennya pidstavlyayutsya u formulu PrikladNehaj doslidzhuvani teksti rozbito na 4 segmenti kozhen rozmirom po 1 mln sliv Deyake slovo napriklad koeficiyent zustrichayetsya v cih segmentah vidpovidno 10 11 8 i 3 razi todi m 1 displaystyle mu 1 10 m 2 displaystyle mu 2 11 m 3 displaystyle mu 3 9 m 4 displaystyle mu 4 3 vzhivannya na miljon Serednye znachennya m 10 11 8 3 4 8 displaystyle mu frac 10 11 8 3 4 8 Serednokvadratichne vidhilennya s 10 8 2 11 8 2 8 8 2 3 8 2 4 4 9 0 25 4 9 5 3 08 displaystyle sigma sqrt frac 10 8 2 11 8 2 8 8 2 3 8 2 4 sqrt frac 4 9 0 25 4 sqrt 9 5 3 08 Todi Koeficiyent Zhuajna D 100 1 3 08 8 4 1 100 1 0 22 78 displaystyle D 100 left 1 frac 3 08 8 sqrt 4 1 right 100 1 0 22 78 Div takozhChastotnij slovnik Zakon GipsaPrimitkiSharov S A Lyashevskaya O N Chastotnyj slovar sovremennogo russkogo yazyka na materialah Nacionalnogo korpusa russkogo yazyka M Izdatelskij centr Azbukovnik 2009 1060 s Frequency dictionary of French words A Juilland D Brodin and C Davidovitch The Romance languages and their structures First Series F 1 Mouton The Hague Paris 1970 lxxv 503 pp 120