Корпус Lancaster-Oslo/Bergen (LOB) — це колекція британських англійських текстів з мільйонів слів, яка була складена в 1970-х роках у співпраці між Університетом Ланкастера, Університетом Осло та Норвезьким обчислювальним центром гуманітарних наук, Берген, щоб надати британський аналог Браунівського корпусу, складеному Генрі Кучерою та В. Нельсоном Френсісом для американської англійської мови в 1960-х роках.
Його композиція була розроблена, щоб максимально відповідати оригінальному корпусу Брауна з точки зору його розміру та жанрів із використанням документів, опублікованих у Великобританії британськими авторами. Обидва корпуси складаються з 500 зразків, кожен із яких містить близько 2000 слів у таких жанрах:
Етикетка | Текстова категорія | Браунівський корпус | Корпус Ланкастер-Осло-Берген |
---|---|---|---|
A | Преса: репортаж | 44 | 44 |
B | Преса: редакція | 27 | 27 |
C | Преса: рецензії | 17 | 17 |
D | Релігія | 17 | 17 |
E | Навички, професії та хобі | 36 | 38 |
F | Популярні знання | 48 | 44 |
G | Художня література, біографія, нариси | 75 | 77 |
H | Різне (документи, звіти тощо) | 30 | 30 |
J | Наукові праці | 80 | 80 |
K | Загальна художня література | 29 | 29 |
L | Містика і детектив | 24 | 24 |
M | Наукова фантастика | 6 | 6 |
N | Пригоди та західна фантастика | 29 | 29 |
P | Романтика та історія кохання | 29 | 29 |
R | Гумор | 9 | 9 |
Разом | 500 | 500 |
Корпус також позначений тегами, тобто кожному слову присвоєно категорії частини мови.
Зовнішні посилання
- Посібник LOB Corpus [ 1 квітня 2022 у Wayback Machine.]
- LOB Corpus з Оксфордського текстового архіву [ 3 березня 2022 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Korpus Lancaster Oslo Bergen LOB ce kolekciya britanskih anglijskih tekstiv z miljoniv sliv yaka bula skladena v 1970 h rokah u spivpraci mizh Universitetom Lankastera Universitetom Oslo ta Norvezkim obchislyuvalnim centrom gumanitarnih nauk Bergen shob nadati britanskij analog Braunivskogo korpusu skladenomu Genri Kucheroyu ta V Nelsonom Frensisom dlya amerikanskoyi anglijskoyi movi v 1960 h rokah Jogo kompoziciya bula rozroblena shob maksimalno vidpovidati originalnomu korpusu Brauna z tochki zoru jogo rozmiru ta zhanriv iz vikoristannyam dokumentiv opublikovanih u Velikobritaniyi britanskimi avtorami Obidva korpusi skladayutsya z 500 zrazkiv kozhen iz yakih mistit blizko 2000 sliv u takih zhanrah Etiketka Tekstova kategoriya Braunivskij korpus Korpus Lankaster Oslo BergenA Presa reportazh 44 44B Presa redakciya 27 27C Presa recenziyi 17 17D Religiya 17 17E Navichki profesiyi ta hobi 36 38F Populyarni znannya 48 44G Hudozhnya literatura biografiya narisi 75 77H Rizne dokumenti zviti tosho 30 30J Naukovi praci 80 80K Zagalna hudozhnya literatura 29 29L Mistika i detektiv 24 24M Naukova fantastika 6 6N Prigodi ta zahidna fantastika 29 29P Romantika ta istoriya kohannya 29 29R Gumor 9 9Razom 500 500 Korpus takozh poznachenij tegami tobto kozhnomu slovu prisvoyeno kategoriyi chastini movi Zovnishni posilannyaPosibnik LOB Corpus 1 kvitnya 2022 u Wayback Machine LOB Corpus z Oksfordskogo tekstovogo arhivu 3 bereznya 2022 u Wayback Machine