Закон Гіпса (англ. Heaps' law) — емпірична закономірність у лінгвістиці, що описує розподіл числа різних слів у документі (або наборі документів) як функцію від його довжини. Описується формулою
- ,
де VR — число різних слів у тексті розміру n. K і β — вільні параметри, визначаються емпірично. Для англійського корпусу текстів, K зазвичай лежить між 10 і 100, а β між 0.4 і 0.6.
Закон часто приписують Гарольду Стенлі Гіпсу (Harold Stanley Heaps), але вперше його відкрив Густав Гердан (Gustav Herdan). З деяким наближенням закон Гердана — Гіпса асимптотично еквівалентний закону Ципфа про частоту окремих слів у тексті.
Див. також
Примітки
- Egghe, (2007): «Herdan's law in linguistics and Heaps' law in information retrieval are different formulations of the same phenomenon».
- Kornai, (1999); Baeaza-Yates та Navarro, (2000); van Leijenhorst та van der Weide, (2003).
Посилання
- Baeza-Yates, Ricardo; Navarro, Gonzalo, Block addressing indices for approximate text retrieval, Journal of the American Society for Information Science, 51 (1): 69—82, doi:10.1002/(sici)1097-4571(2000)51:1<69::aid-asi10>3.0.co;2-c.
- Egghe, L. (2007), Untangling Herdan's law and Heaps' law: Mathematical and informetric arguments, Journal of the American Society for Information Science and Technology, 58 (5): 702, doi:10.1002/asi.20524.
- Heaps, Harold Stanley (1978), Information Retrieval: Computational and Theoretical Aspects, Academic Press. Heaps' law is proposed in Section 7.5 (pp. 206—208).
- Herdan, Gustav (1960), Type-token mathematics, The Hague: Mouton.
- Kornai, Andras (1999), Zipf's law outside the middle range, у Rogers, James (ред.), Proceedings of the Sixth Meeting on Mathematics of Language, University of Central Florida, с. 347—356.
- Milička, Jiří (2009), Type-token & Hapax-token Relation: A Combinatorial Model, Glottotheory. International Journal of Theoretical Linguistics, 1 (2): 99—110, doi:10.1515/glot-2009-0009.
- van Leijenhorst, D. C; van der Weide, Th. P. (2005), A formal derivation of Heaps' Law, Information Sciences, 170 (2–4): 263—272, doi:10.1016/j.ins.2004.03.006.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Zakon Gipsa angl Heaps law empirichna zakonomirnist u lingvistici sho opisuye rozpodil chisla riznih sliv u dokumenti abo nabori dokumentiv yak funkciyu vid jogo dovzhini Opisuyetsya formuloyuTipovij grafik yakij ilyustruye zakon Gipsa Po osi x rozmir tekstu po osi y chislo riznih sliv u teksti Porivnyajte znachennya na dvoh osyah V R n K n b displaystyle V R n Kn beta de VR chislo riznih sliv u teksti rozmiru n K i b vilni parametri viznachayutsya empirichno Dlya anglijskogo korpusu tekstiv K zazvichaj lezhit mizh 10 i 100 a b mizh 0 4 i 0 6 Zakon chasto pripisuyut Garoldu Stenli Gipsu Harold Stanley Heaps ale vpershe jogo vidkriv Gustav Gerdan Gustav Herdan Z deyakim nablizhennyam zakon Gerdana Gipsa asimptotichno ekvivalentnij zakonu Cipfa pro chastotu okremih sliv u teksti Div takozhKoeficiyent ZhuajnaPrimitkiEgghe 2007 Herdan s law in linguistics and Heaps law in information retrieval are different formulations of the same phenomenon Kornai 1999 Baeaza Yates ta Navarro 2000 van Leijenhorst ta van der Weide 2003 PosilannyaBaeza Yates Ricardo Navarro Gonzalo Block addressing indices for approximate text retrieval Journal of the American Society for Information Science 51 1 69 82 doi 10 1002 sici 1097 4571 2000 51 1 lt 69 aid asi10 gt 3 0 co 2 c Egghe L 2007 Untangling Herdan s law and Heaps law Mathematical and informetric arguments Journal of the American Society for Information Science and Technology 58 5 702 doi 10 1002 asi 20524 Heaps Harold Stanley 1978 Information Retrieval Computational and Theoretical Aspects Academic Press Heaps law is proposed in Section 7 5 pp 206 208 Herdan Gustav 1960 Type token mathematics The Hague Mouton Kornai Andras 1999 Zipf s law outside the middle range u Rogers James red Proceedings of the Sixth Meeting on Mathematics of Language University of Central Florida s 347 356 Milicka Jiri 2009 Type token amp Hapax token Relation A Combinatorial Model Glottotheory International Journal of Theoretical Linguistics 1 2 99 110 doi 10 1515 glot 2009 0009 van Leijenhorst D C van der Weide Th P 2005 A formal derivation of Heaps Law Information Sciences 170 2 4 263 272 doi 10 1016 j ins 2004 03 006