Ко́дова сторі́нка (англ. code page) — таблиця, що зіставляє кожному значенню байта деякий символ (або його відсутність). Зазвичай код символу має розмір 8 біт, так що кодова сторінка може містити максимум 256 символів, з чого випливає різка недостатність всякої 8-бітної кодової сторінки для подання багатомовних текстів. До того ж частина символів використовується як керуюча, через що число друкованих символів рідко перевищує 223.
Історично термін code page був введений корпорацією IBM; змінні кодові сторінки використовувалися для підтримки різних мов (що мають алфавітні системи письма). Останнім часом є плутанина між терміном «кодова сторінка» і більш загальним поняттям набору символів (кодування).
Кодові сторінки сьогодні
В даний час в основному використовуються кодування двох типів: сумісні з ASCII і сумісні з EBCDIC, з переважанням перших. В ASCII-сумісних кодуваннях зафіксовано коди 95 друкованих символів та 33 керуючих («нижня» половина кодів, від 0 до 127), а решта 128 кодових позицій (від 128 до 255) використовуються для різних символів, що не входять в ASCII.
Для кодування текстів українською (російською) мовою (тобто букв кирилиці) найбільш широко застосовуються наступні кодові сторінки:
- Windows-1251, вона ж Microsoft code page 1251 (CP1251) — в системах Windows;
- Сімейство кодових сторінок KOI-8;
- Альтернативне кодування, воно ж IBM code page 866 — в системах DOS, а також у текстових вікнах Microsoft Windows (див. нижче);
- MacCyrillic — на комп'ютерах Macintosh.
Використання різних кодових сторінок створює багато незручностей як для користувачів, так і для програмістів. При спробі прочитати текстовий файл за допомогою кодової сторінки, несумісною з тією, в якій він був створений, виникають кракозябри. В останні роки отримав широке розповсюдження Unicode як альтернатива традиційним кодовим сторінкам.
У системі Microsoft Windows
У системах Microsoft Windows кодові сторінки є важливим компонентом локалізації, що задається в ключах реєстру HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\
.
Історично (у системах Windows 3.x і Windows 9x) було два типи кодових сторінок. Кодові сторінки «ANSI» (англ. ANSI code page, в реєстрі: ACP), також звані Windows — рідні кодові сторінки Windows. Містять багато символів типографіки, але майже не містять псевдографіку по причині того, що призначені для використання в графічному оточенні. Згодом корпорація Microsoft визнала, що використання імені ANSI було викликано непорозумінням. До Кодування «ANSI» / Windows відносять, зокрема, Windows-1252 і вищезгадану Windows-1251. Microsoft також відносить до кодових сторінок кодові таблиці, деякі позиції яких вимагають другого (завершального) байта для формування символу, тобто допускають двобайтове уявлення деяких символів, хоча вони, щиро кажучи, є вже кодуваннями із змінною довжиною символу.
Кодування OEM (англ. OEM code page, в реєстрі: OEMCP) засновані на CP437 і містять VGA-сумісну псевдографіку. Вищезазначене альтернативне кодування відоме у Windows як CP866.
Починаючи з Windows NT з'явився третій клас кодових сторінок: кодування Macintosh (англ. Macintosh code page, в реєстрі: MACCP), сумісних з Mac OS.
Див. також
Примітки
- [. Архів оригіналу за 10 Січня 2013. Процитовано 8 Квітня 2013. REG: CurrentControlSet, PART 1, Microsoft (англ.)]
- . Архів оригіналу за 22 Лютого 2014. Процитовано 8 Квітня 2013.
- . Архів оригіналу за 22 Лютого 2014. Процитовано 8 Квітня 2013.
Це незавершена стаття з інформатики. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U Vikipediyi ye statti pro termin Koduvannya Ko dova stori nka angl code page tablicya sho zistavlyaye kozhnomu znachennyu bajta deyakij simvol abo jogo vidsutnist Zazvichaj kod simvolu maye rozmir 8 bit tak sho kodova storinka mozhe mistiti maksimum 256 simvoliv z chogo viplivaye rizka nedostatnist vsyakoyi 8 bitnoyi kodovoyi storinki dlya podannya bagatomovnih tekstiv Do togo zh chastina simvoliv vikoristovuyetsya yak keruyucha cherez sho chislo drukovanih simvoliv ridko perevishuye 223 Istorichno termin code page buv vvedenij korporaciyeyu IBM zminni kodovi storinki vikoristovuvalisya dlya pidtrimki riznih mov sho mayut alfavitni sistemi pisma Ostannim chasom ye plutanina mizh terminom kodova storinka i bilsh zagalnim ponyattyam naboru simvoliv koduvannya Kodovi storinki sogodniV danij chas v osnovnomu vikoristovuyutsya koduvannya dvoh tipiv sumisni z ASCII i sumisni z EBCDIC z perevazhannyam pershih V ASCII sumisnih koduvannyah zafiksovano kodi 95 drukovanih simvoliv ta 33 keruyuchih nizhnya polovina kodiv vid 0 do 127 a reshta 128 kodovih pozicij vid 128 do 255 vikoristovuyutsya dlya riznih simvoliv sho ne vhodyat v ASCII Dlya koduvannya tekstiv ukrayinskoyu rosijskoyu movoyu tobto bukv kirilici najbilsh shiroko zastosovuyutsya nastupni kodovi storinki Windows 1251 vona zh Microsoft code page 1251 CP1251 v sistemah Windows Simejstvo kodovih storinok KOI 8 Alternativne koduvannya vono zh IBM code page 866 v sistemah DOS a takozh u tekstovih viknah Microsoft Windows div nizhche MacCyrillic na komp yuterah Macintosh Vikoristannya riznih kodovih storinok stvoryuye bagato nezruchnostej yak dlya koristuvachiv tak i dlya programistiv Pri sprobi prochitati tekstovij fajl za dopomogoyu kodovoyi storinki nesumisnoyu z tiyeyu v yakij vin buv stvorenij vinikayut krakozyabri V ostanni roki otrimav shiroke rozpovsyudzhennya Unicode yak alternativa tradicijnim kodovim storinkam U sistemi Microsoft WindowsU sistemah Microsoft Windows kodovi storinki ye vazhlivim komponentom lokalizaciyi sho zadayetsya v klyuchah reyestru HKEY LOCAL MACHINE SYSTEM CurrentControlSet Control Nls CodePage Istorichno u sistemah Windows 3 x i Windows 9x bulo dva tipi kodovih storinok Kodovi storinki ANSI angl ANSI code page v reyestri ACP takozh zvani Windows ridni kodovi storinki Windows Mistyat bagato simvoliv tipografiki ale majzhe ne mistyat psevdografiku po prichini togo sho priznacheni dlya vikoristannya v grafichnomu otochenni Zgodom korporaciya Microsoft viznala sho vikoristannya imeni ANSI bulo viklikano neporozuminnyam Do Koduvannya ANSI Windows vidnosyat zokrema Windows 1252 i vishezgadanu Windows 1251 Microsoft takozh vidnosit do kodovih storinok kodovi tablici deyaki poziciyi yakih vimagayut drugogo zavershalnogo bajta dlya formuvannya simvolu tobto dopuskayut dvobajtove uyavlennya deyakih simvoliv hocha voni shiro kazhuchi ye vzhe koduvannyami iz zminnoyu dovzhinoyu simvolu Koduvannya OEM angl OEM code page v reyestri OEMCP zasnovani na CP437 i mistyat VGA sumisnu psevdografiku Vishezaznachene alternativne koduvannya vidome u Windows yak CP866 Pochinayuchi z Windows NT z yavivsya tretij klas kodovih storinok koduvannya Macintosh angl Macintosh code page v reyestri MACCP sumisnih z Mac OS Div takozhDrukovani simvoli KOI 8 Rozkladka klaviaturiPrimitki Arhiv originalu za 10 Sichnya 2013 Procitovano 8 Kvitnya 2013 REG CurrentControlSet PART 1 Microsoft angl Arhiv originalu za 22 Lyutogo 2014 Procitovano 8 Kvitnya 2013 Arhiv originalu za 22 Lyutogo 2014 Procitovano 8 Kvitnya 2013 Ce nezavershena stattya z informatiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi