Універсальний кодований набір символів (UCS) - це стандартний набір символів, визначений Міжнародним стандартом ISO / IEC 10646, який є основою багатьох кодувань символів . Остання версія містить понад 136 000 абстрактних символів, кожен з яких ідентифікується однозначним ім’ям і цілим числом, що називається . Цей стандарт ISO / IEC 10646 підтримується спільно зі стандартом Unicode ("Юнікод"), і вони ідентичні коду для коду.
Символи (букви, цифри, символи, ідеограми, логограми тощо) з багатьох мов, манускриптів та традицій світу представлені в UCS з унікальними кодовими точками. Інклюзивність UCS постійно покращується, оскільки додаються символи раніше непредставлених систем письма.
UCS має понад 1,1 мільйона можливих кодових точок, доступних для використання / розподілу, але лише перші 65 536 ( увійшли до загального користування до 2000 року. Ситуація почала змінюватися, коли Китайська Народна Республіка (КНР) ухвалила рішення у 2006 р., що все програмне забезпечення, що продається під їхньою юрисдикцією, повинне підтримувати GB 18030. Для цього потрібно було перенести програмне забезпечення, призначене для продажу в КНР, за межі BMP.
Система свідомо залишає багато кодових точок не заповненими навіть у BMP для майбутнього розширення набору і для того, щоб звести до мінімуму конфлікти з іншими формами кодування.
Кодування форм
ISO / IEC 10646 визначає кілька форм кодування символів для Універсального кодованого набору символів. Найпростіший, UCS-2, використовує одне значення коду (визначене як число, з яких одне чи більше представляє кодова точка загалом, але для UCS-2 це строго одне значення коду, яке представляє кодова точка ) від 0 до 65 535 для кожного символу і дозволяє рівно двом байтам (одне 16-бітове слово) представляти це значення. Таким чином, UCS-2 дозволяє двійкове представлення кожної точки коду в BMP, що представляє символ. UCS-2 не може представляти кодові точки поза BMP.
Перша поправка до оригінальної редакції UCS визначила UTF-16, розширення UCS-2, для представлення кодових точок за межами BMP. Діапазон кодових точок у S (спеціальній) зоні BMP залишається неприсвоєним символам. UCS-2 забороняє використання значень коду для цих кодових точок, але UTF-16 дозволяє використовувати їх парами. Unicode також прийняв UTF-16, але в його термінології елементи зони високої половини стають "високими сурогатами", а елементи зони низької половини - "низькими сурогатами".
Інше кодування, UCS-4, використовує чотири байти (загалом 32 біти) для кодування одного символу простору кодів. Навіть незважаючи на те, що Unicode обмежує простір коду верхньою межею 10FFFF. Стандарт ISO / IEC 10646 заявив, що всі майбутні призначення символів будуть виконуватися в діапазоні до 0x7FFFFFFFhex. UCS-4 дозволяє представляти кожне значення як рівно чотири байти (одне 32-бітове слово). Таким чином, UCS-4 дозволяє двійкове представлення кожної кодової точки в UCS, в тому числі поза BMP. Як і в UCS-2, кожен закодований символ має фіксовану довжину в байтах, що спрощує маніпуляції, але, звичайно, він вимагає вдвічі більше місця для зберігання, ніж UCS-2.
Зараз домінуючим кодуванням UCS є UTF-8, яке є кодуванням змінної ширини, призначеним для зворотної сумісності з ASCII, а також для уникнення ускладнень мінливості та позначок порядку байтів в UTF-16 та UTF-32. Понад 93% усіх вебсторінок закодовано в UTF-8. Робоча група Інтернет-інженерії (IETF) вимагає від усіх протоколів Інтернету ідентифікації кодування, що використовується для даних символів, а підтримувані кодування символів повинні включати UTF-8. Інтернет-поштовий консорціум (IMC) рекомендує, щоб усі програми електронної пошти мали можливість відображати та створювати пошту за допомогою UTF-8. Він також все частіше використовується як кодування символів за замовчуванням в операційних системах, мовах програмування, API та програмних додатках.
Див. Також [en]
Історія
Міжнародна організація зі стандартизації (ISO) мала намір скласти універсальний символ, встановлений у 1989 р., і опублікувала проект ISO 10646 у 1990 р.. [en] був одним з головних архітекторів. Цей стандарт помітно відрізнявся від поточного. Він визначав:
- 128 груп
- 256 площин
- 256 рядків
- 256 комірок,
для загальної суми 21474834848 символів, але насправді стандарт міг кодувати лише 679477248 символів, оскільки політика забороняла значення байтів (від 0x00 до 0x1F та 0x80 до 0x9F, у шістнадцяткових позначеннях) у будь-якому з чотирьох байтів із зазначенням групи, площини, рядка та комірки. Наприклад, латинська велика літера A мала розташування в групі 0x20, площині 0x20, рядку 0x20, комірці 0x41.
Можна кодувати символи цього первинного стандарту ISO 10646 одним із трьох способів:
- UCS-4, чотири байти для кожного символу, що забезпечує просте кодування всіх символів;
- UCS-2, два байти для кожного символу, що дозволяє кодувати першу площину, 0x20, Базову багатомовну площину, що містить перші 36 864 кодових точок прямолінійно та інші площини та групи, переключившись на них із послідовностями виходу з ;
- UTF-1, який кодує всі символи в послідовності байтів різної довжини (від 1 до 5 байт, кожен з яких не містить контрольних кодів).
Тому в 1990 році існували дві ініціативи щодо універсального набору символів: Unicode з 16 бітами для кожного символу (65 536 можливих символів) та ISO 10646. Компанії, що виробляють програмне забезпечення, відмовились прийняти вимогу щодо складності та розміру стандарту ISO і змогли переконати низку національних органів ISO проголосувати проти. Стандартизатори ISO зрозуміли, що не можуть продовжувати підтримувати стандарт у його поточному стані і домовились про уніфікацію свого стандарту з Unicode. Відбулися дві зміни: скасування обмеження на символи (заборона значень контрольного коду), таким чином відкриваючи кодові точки, такі як 0x0000101F для розподілу і синхронізація репертуару Базового багатомовного плану з Unicode.
Тим часом із плином часу ситуація змінилася і в самому стандарті Unicode: 65 536 символів виявилося недостатнім, а стандарт з версії 2.0 і далі підтримує кодування 1112 064 кодових точок з 17 площин за допомогою сурогатного механізму UTF-16 . З цієї причини ISO 10646 містив стільки символів, скільки може кодувати UTF-16, і не більше, тобто, трохи більше мільйона символів, замість понад 679 мільйонів. Кодування UCS-4 за стандартом ISO 10646 було включено до стандарту Unicode з обмеженням до діапазону UTF-16 та під назвою UTF-32, хоча воно майже не використовує поза внутрішніми даними програм.
[en] і Кен Томпсон, розробники операційної системи Plan 9, розробили нове, швидке та добре розроблене кодування змішаної ширини UTF-8, яке нині найпопулярніше кодування UCS.
Відмінності від Unicode
ISO 10646 та Unicode мають однакове кодування та номери - однакові символи з однаковими номерами існують в обох стандартах, хоча Unicode випускає нові версії та додає нові символи частіше. Unicode має правила та специфікації, що виходять за рамки ISO 10646. ISO 10646 - це проста карта символів, розширення попередніх стандартів, таких як ISO 8859. На відміну від цього, Unicode додає правила зіставлення, нормалізації форм та двонаправленого алгоритму для рукописів справа наліво, таких як арабський та іврит. Для взаємодії між платформами, особливо якщо використовуються двонаправлені рукописи, недостатньо підтримувати ISO 10646; Необхідно реалізувати Unicode.
Для підтримки цих правил та алгоритмів Unicode додає багато [en] до кожного символу в наборі, таких як властивості, що визначають стандартний двонаправлений клас символу та властивості, щоб визначити, як символ поєднується з іншими символами. Якщо символ представляє числове значення, таке як європейське число «8» або звичайний дріб «¼», то це числове значення також додається як властивість символу. Unicode має на меті підтримувати властивості взаємодії обробки тексту із сумішшю мов.
Деякі програми підтримують символи ISO 10646, але не повністю підтримують Unicode. Одне з таких додатків, [en], може належним чином відображати всі символи ISO 10646, які мають індивідуальне відображення символів у гліфи та єдину спрямованість. Він може обробляти деякі комбінуючі знаки простими методами, що вражають, але не може відображати іврит (двонаправлений), деванагарі (один символ на багато гліфів) або арабський (обидві функції). Більшість програм графічного інтерфейсу використовують стандартні процедури малювання тексту ОС, які обробляють такі сценарії, хоча самі програми все ще не завжди обробляють їх правильно.
Посилання на Універсальний набір символів
ISO 10646 - загальне, неформальне цитування для сімейства стандартів ISO / IEC 10646 є прийнятним у більшості прозаїчно. І хоча це окремий стандарт, термін Unicode часто використовується так само неофіційно під час обговорення UCS. Однак, будь-які нормативні посилання на UCS , як публікацію, повинні вказувати рік видання у формі ISO / IEC 10646: {рік}, наприклад: ISO / IEC 10646: 2014.
Відносини з Unicode
З 1991 року [en] та ISO розробили The Unicode Standard ("Unicode") та ISO / IEC 10646 в тандемі. Репертуар, імена символів та кодові точки Unicode Версії 2.0 точно відповідають вимогам ISO / IEC 10646-1: 1993 з першими сімома опублікованими поправками. Після публікації Unicode 3.0 у лютому 2000 р. Відповідні нові та оновлені символи увійшли до UCS через ISO / IEC 10646-1: 2000. У 2003 році частини 1 та 2 ISO / IEC 10646 були об'єднані в одну частину, яка з тих пір мала ряд поправок, що додають символи до стандарту приблизно в синхронній ситуації зі стандартом Unicode.
- ISO / IEC 10646-1: 1993 = Unicode 1.1
- ISO / IEC 10646-1: 1993 плюс поправки 5-7 = Unicode 2.0
- ISO / IEC 10646-1: 1993 плюс поправки 5-7 = Unicode 2.1, за винятком символу євро та [en], які включені до Поправки 18
- ISO / IEC 10646-1: 2000 = Unicode 3.0
- ISO / IEC 10646-1: 2000 та ISO / IEC 10646-2: 2001 = Unicode 3.1
- ISO / IEC 10646-1: 2000 плюс поправка 1 та ISO / IEC 10646-2: 2001 = Unicode 3.2
- ISO / IEC 10646: 2003 = Unicode 4.0
- ISO / IEC 10646: 2003 плюс поправка 1 = Unicode 4.1
- ISO / IEC 10646: 2003 плюс поправки 1 до 2 = Unicode 5.0, виключаючи літери Деванагарі GGA, JJA, DDDA та BBA, які включені до поправки 3
- ISO / IEC 10646: 2003 плюс поправки від 1 до 4 = Unicode 5.1
- ISO / IEC 10646: 2003 плюс поправки від 1 до 6 = Unicode 5.2
- ISO / IEC 10646: 2003 плюс поправки 1 до 8 = ISO / IEC 10646: 2011 = Unicode 6.0, за винятком знаку індійської рупії
- ISO / IEC 10646: 2012 = Unicode 6.1
- ISO / IEC 10646: 2012 = Unicode 6.2, за винятком знака турецької ліри, який включений до поправки 1
- ISO / IEC 10646: 2012 = Unicode 6.3, за винятком знака турецької ліри, який входить до поправки 1 та п’яти двонаправлених контрольних символів (арабська літерна позначка, ізоляція зліва направо, ізоляція справа наліво, перший сильний ізолятор, Pop Directional Isolate), які включені до поправки 2
- ISO / IEC 10646: 2012 плюс поправки 1 та 2 = Unicode 7.0, за винятком знаку рубля
- ISO / IEC 10646: 2014 плюс поправка 1 = Unicode 8.0, за винятком знака ларі, дев'яти уніфікованих ідеографів CJK та 41 символу смайликів
- ISO / IEC 10646: 2014 плюс поправки 1 та 2 = Unicode 9.0, за винятком Adlam, Newa, японських символів телебачення та 74 смайлів та символів
- ISO / IEC 10646: 2017 = Unicode 10.0, за винятком 285 символів Хентаігани, 3 символів квадрата Занабазара та 56 символів смайлів
Див. також
- Пов’язані стандарти ISO :
- ISO 646 (позиції від 0 до 127 такі самі, як у ISO / IEC 10646 та Unicode, а цифри 646 та 10646 подібні)
- Інформаційні технології [en] — Структура коду символів та методи розширення
- Коди управління [en] C0 та C1
- ISO 8859 (позиції від 0 до 255 UCS та Unicode такі самі, як у ISO-8859-1, псевдонім ISO Latin 1)
- [en] Інформаційні технології - Міжнародне впорядкування та порівняння рядків
- Коди [en] для подання імен сценаріїв (кожен символ пов'язаний з одним із цих сценаріїв)
- [en]
- Список посилань на сутність символів XML та HTML
- Список шрифтів Unicode
- [en]
- [en]
Джерела
- Загальнодоступні стандарти (ISO) - включає копію ISO 10646: 2014 (129-мегапіксельний ZIP-файл, випущений 01.09.2014) та електронні вставки (1,7-мегапіксельний ZIP-файл)
- ISO / IEC JTC1 / SC2 / WG2, робоча група, відповідальна за ISO 10646
- Поширені запитання щодо UTF-8 та Unicode
- Безкоштовні шрифти SIL, редактори та документація
- Простий, але приємний приклад UTF-8, який перевіряє можливості вашого веббраузера та шрифтів.
- Проблеми з набором символів для ADA 9x з жовтня 1989 р. Детально описують оригінал DIS-ISO-10646 до злиття
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Universalnij kodovanij nabir simvoliv UCS ce standartnij nabir simvoliv viznachenij Mizhnarodnim standartom ISO IEC 10646 yakij ye osnovoyu bagatoh koduvan simvoliv Ostannya versiya mistit ponad 136 000 abstraktnih simvoliv kozhen z yakih identifikuyetsya odnoznachnim im yam i cilim chislom sho nazivayetsya Cej standart ISO IEC 10646 pidtrimuyetsya spilno zi standartom Unicode Yunikod i voni identichni kodu dlya kodu Simvoli bukvi cifri simvoli ideogrami logogrami tosho z bagatoh mov manuskriptiv ta tradicij svitu predstavleni v UCS z unikalnimi kodovimi tochkami Inklyuzivnist UCS postijno pokrashuyetsya oskilki dodayutsya simvoli ranishe nepredstavlenih sistem pisma UCS maye ponad 1 1 miljona mozhlivih kodovih tochok dostupnih dlya vikoristannya rozpodilu ale lishe pershi 65 536 uvijshli do zagalnogo koristuvannya do 2000 roku Situaciya pochala zminyuvatisya koli Kitajska Narodna Respublika KNR uhvalila rishennya u 2006 r sho vse programne zabezpechennya sho prodayetsya pid yihnoyu yurisdikciyeyu povinne pidtrimuvati GB 18030 Dlya cogo potribno bulo perenesti programne zabezpechennya priznachene dlya prodazhu v KNR za mezhi BMP Sistema svidomo zalishaye bagato kodovih tochok ne zapovnenimi navit u BMP dlya majbutnogo rozshirennya naboru i dlya togo shob zvesti do minimumu konflikti z inshimi formami koduvannya Koduvannya formISO IEC 10646 viznachaye kilka form koduvannya simvoliv dlya Universalnogo kodovanogo naboru simvoliv Najprostishij UCS 2 vikoristovuye odne znachennya kodu viznachene yak chislo z yakih odne chi bilshe predstavlyaye kodova tochka zagalom ale dlya UCS 2 ce strogo odne znachennya kodu yake predstavlyaye kodova tochka vid 0 do 65 535 dlya kozhnogo simvolu i dozvolyaye rivno dvom bajtam odne 16 bitove slovo predstavlyati ce znachennya Takim chinom UCS 2 dozvolyaye dvijkove predstavlennya kozhnoyi tochki kodu v BMP sho predstavlyaye simvol UCS 2 ne mozhe predstavlyati kodovi tochki poza BMP Persha popravka do originalnoyi redakciyi UCS viznachila UTF 16 rozshirennya UCS 2 dlya predstavlennya kodovih tochok za mezhami BMP Diapazon kodovih tochok u S specialnij zoni BMP zalishayetsya neprisvoyenim simvolam UCS 2 zaboronyaye vikoristannya znachen kodu dlya cih kodovih tochok ale UTF 16 dozvolyaye vikoristovuvati yih parami Unicode takozh prijnyav UTF 16 ale v jogo terminologiyi elementi zoni visokoyi polovini stayut visokimi surogatami a elementi zoni nizkoyi polovini nizkimi surogatami Inshe koduvannya UCS 4 vikoristovuye chotiri bajti zagalom 32 biti dlya koduvannya odnogo simvolu prostoru kodiv Navit nezvazhayuchi na te sho Unicode obmezhuye prostir kodu verhnoyu mezheyu 10FFFF Standart ISO IEC 10646 zayaviv sho vsi majbutni priznachennya simvoliv budut vikonuvatisya v diapazoni do 0x7FFFFFFFhex UCS 4 dozvolyaye predstavlyati kozhne znachennya yak rivno chotiri bajti odne 32 bitove slovo Takim chinom UCS 4 dozvolyaye dvijkove predstavlennya kozhnoyi kodovoyi tochki v UCS v tomu chisli poza BMP Yak i v UCS 2 kozhen zakodovanij simvol maye fiksovanu dovzhinu v bajtah sho sproshuye manipulyaciyi ale zvichajno vin vimagaye vdvichi bilshe miscya dlya zberigannya nizh UCS 2 Zaraz dominuyuchim koduvannyam UCS ye UTF 8 yake ye koduvannyam zminnoyi shirini priznachenim dlya zvorotnoyi sumisnosti z ASCII a takozh dlya uniknennya uskladnen minlivosti ta poznachok poryadku bajtiv v UTF 16 ta UTF 32 Ponad 93 usih vebstorinok zakodovano v UTF 8 Robocha grupa Internet inzheneriyi IETF vimagaye vid usih protokoliv Internetu identifikaciyi koduvannya sho vikoristovuyetsya dlya danih simvoliv a pidtrimuvani koduvannya simvoliv povinni vklyuchati UTF 8 Internet poshtovij konsorcium IMC rekomenduye shob usi programi elektronnoyi poshti mali mozhlivist vidobrazhati ta stvoryuvati poshtu za dopomogoyu UTF 8 Vin takozh vse chastishe vikoristovuyetsya yak koduvannya simvoliv za zamovchuvannyam v operacijnih sistemah movah programuvannya API ta programnih dodatkah Div Takozh en IstoriyaMizhnarodna organizaciya zi standartizaciyi ISO mala namir sklasti universalnij simvol vstanovlenij u 1989 r i opublikuvala proekt ISO 10646 u 1990 r en buv odnim z golovnih arhitektoriv Cej standart pomitno vidriznyavsya vid potochnogo Vin viznachav 128 grup 256 ploshin 256 ryadkiv 256 komirok dlya zagalnoyi sumi 21474834848 simvoliv ale naspravdi standart mig koduvati lishe 679477248 simvoliv oskilki politika zaboronyala znachennya bajtiv vid 0x00 do 0x1F ta 0x80 do 0x9F u shistnadcyatkovih poznachennyah u bud yakomu z chotiroh bajtiv iz zaznachennyam grupi ploshini ryadka ta komirki Napriklad latinska velika litera A mala roztashuvannya v grupi 0x20 ploshini 0x20 ryadku 0x20 komirci 0x41 Mozhna koduvati simvoli cogo pervinnogo standartu ISO 10646 odnim iz troh sposobiv UCS 4 chotiri bajti dlya kozhnogo simvolu sho zabezpechuye proste koduvannya vsih simvoliv UCS 2 dva bajti dlya kozhnogo simvolu sho dozvolyaye koduvati pershu ploshinu 0x20 Bazovu bagatomovnu ploshinu sho mistit pershi 36 864 kodovih tochok pryamolinijno ta inshi ploshini ta grupi pereklyuchivshis na nih iz poslidovnostyami vihodu z UTF 1 yakij koduye vsi simvoli v poslidovnosti bajtiv riznoyi dovzhini vid 1 do 5 bajt kozhen z yakih ne mistit kontrolnih kodiv Tomu v 1990 roci isnuvali dvi iniciativi shodo universalnogo naboru simvoliv Unicode z 16 bitami dlya kozhnogo simvolu 65 536 mozhlivih simvoliv ta ISO 10646 Kompaniyi sho viroblyayut programne zabezpechennya vidmovilis prijnyati vimogu shodo skladnosti ta rozmiru standartu ISO i zmogli perekonati nizku nacionalnih organiv ISO progolosuvati proti Standartizatori ISO zrozumili sho ne mozhut prodovzhuvati pidtrimuvati standart u jogo potochnomu stani i domovilis pro unifikaciyu svogo standartu z Unicode Vidbulisya dvi zmini skasuvannya obmezhennya na simvoli zaborona znachen kontrolnogo kodu takim chinom vidkrivayuchi kodovi tochki taki yak 0x0000101F dlya rozpodilu i sinhronizaciya repertuaru Bazovogo bagatomovnogo planu z Unicode Tim chasom iz plinom chasu situaciya zminilasya i v samomu standarti Unicode 65 536 simvoliv viyavilosya nedostatnim a standart z versiyi 2 0 i dali pidtrimuye koduvannya 1112 064 kodovih tochok z 17 ploshin za dopomogoyu surogatnogo mehanizmu UTF 16 Z ciyeyi prichini ISO 10646 mistiv stilki simvoliv skilki mozhe koduvati UTF 16 i ne bilshe tobto trohi bilshe miljona simvoliv zamist ponad 679 miljoniv Koduvannya UCS 4 za standartom ISO 10646 bulo vklyucheno do standartu Unicode z obmezhennyam do diapazonu UTF 16 ta pid nazvoyu UTF 32 hocha vono majzhe ne vikoristovuye poza vnutrishnimi danimi program en i Ken Tompson rozrobniki operacijnoyi sistemi Plan 9 rozrobili nove shvidke ta dobre rozroblene koduvannya zmishanoyi shirini UTF 8 yake nini najpopulyarnishe koduvannya UCS Vidminnosti vid UnicodeISO 10646 ta Unicode mayut odnakove koduvannya ta nomeri odnakovi simvoli z odnakovimi nomerami isnuyut v oboh standartah hocha Unicode vipuskaye novi versiyi ta dodaye novi simvoli chastishe Unicode maye pravila ta specifikaciyi sho vihodyat za ramki ISO 10646 ISO 10646 ce prosta karta simvoliv rozshirennya poperednih standartiv takih yak ISO 8859 Na vidminu vid cogo Unicode dodaye pravila zistavlennya normalizaciyi form ta dvonapravlenogo algoritmu dlya rukopisiv sprava nalivo takih yak arabskij ta ivrit Dlya vzayemodiyi mizh platformami osoblivo yaksho vikoristovuyutsya dvonapravleni rukopisi nedostatno pidtrimuvati ISO 10646 Neobhidno realizuvati Unicode Dlya pidtrimki cih pravil ta algoritmiv Unicode dodaye bagato en do kozhnogo simvolu v nabori takih yak vlastivosti sho viznachayut standartnij dvonapravlenij klas simvolu ta vlastivosti shob viznachiti yak simvol poyednuyetsya z inshimi simvolami Yaksho simvol predstavlyaye chislove znachennya take yak yevropejske chislo 8 abo zvichajnij drib to ce chislove znachennya takozh dodayetsya yak vlastivist simvolu Unicode maye na meti pidtrimuvati vlastivosti vzayemodiyi obrobki tekstu iz sumishshyu mov Deyaki programi pidtrimuyut simvoli ISO 10646 ale ne povnistyu pidtrimuyut Unicode Odne z takih dodatkiv en mozhe nalezhnim chinom vidobrazhati vsi simvoli ISO 10646 yaki mayut individualne vidobrazhennya simvoliv u glifi ta yedinu spryamovanist Vin mozhe obroblyati deyaki kombinuyuchi znaki prostimi metodami sho vrazhayut ale ne mozhe vidobrazhati ivrit dvonapravlenij devanagari odin simvol na bagato glifiv abo arabskij obidvi funkciyi Bilshist program grafichnogo interfejsu vikoristovuyut standartni proceduri malyuvannya tekstu OS yaki obroblyayut taki scenariyi hocha sami programi vse she ne zavzhdi obroblyayut yih pravilno Posilannya na Universalnij nabir simvolivISO 10646 zagalne neformalne cituvannya dlya simejstva standartiv ISO IEC 10646 ye prijnyatnim u bilshosti prozayichno I hocha ce okremij standart termin Unicode chasto vikoristovuyetsya tak samo neoficijno pid chas obgovorennya UCS Odnak bud yaki normativni posilannya na UCS yak publikaciyu povinni vkazuvati rik vidannya u formi ISO IEC 10646 rik napriklad ISO IEC 10646 2014 Vidnosini z UnicodeZ 1991 roku en ta ISO rozrobili The Unicode Standard Unicode ta ISO IEC 10646 v tandemi Repertuar imena simvoliv ta kodovi tochki Unicode Versiyi 2 0 tochno vidpovidayut vimogam ISO IEC 10646 1 1993 z pershimi simoma opublikovanimi popravkami Pislya publikaciyi Unicode 3 0 u lyutomu 2000 r Vidpovidni novi ta onovleni simvoli uvijshli do UCS cherez ISO IEC 10646 1 2000 U 2003 roci chastini 1 ta 2 ISO IEC 10646 buli ob yednani v odnu chastinu yaka z tih pir mala ryad popravok sho dodayut simvoli do standartu priblizno v sinhronnij situaciyi zi standartom Unicode ISO IEC 10646 1 1993 Unicode 1 1 ISO IEC 10646 1 1993 plyus popravki 5 7 Unicode 2 0 ISO IEC 10646 1 1993 plyus popravki 5 7 Unicode 2 1 za vinyatkom simvolu yevro ta en yaki vklyucheni do Popravki 18 ISO IEC 10646 1 2000 Unicode 3 0 ISO IEC 10646 1 2000 ta ISO IEC 10646 2 2001 Unicode 3 1 ISO IEC 10646 1 2000 plyus popravka 1 ta ISO IEC 10646 2 2001 Unicode 3 2 ISO IEC 10646 2003 Unicode 4 0 ISO IEC 10646 2003 plyus popravka 1 Unicode 4 1 ISO IEC 10646 2003 plyus popravki 1 do 2 Unicode 5 0 viklyuchayuchi literi Devanagari GGA JJA DDDA ta BBA yaki vklyucheni do popravki 3 ISO IEC 10646 2003 plyus popravki vid 1 do 4 Unicode 5 1 ISO IEC 10646 2003 plyus popravki vid 1 do 6 Unicode 5 2 ISO IEC 10646 2003 plyus popravki 1 do 8 ISO IEC 10646 2011 Unicode 6 0 za vinyatkom znaku indijskoyi rupiyi ISO IEC 10646 2012 Unicode 6 1 ISO IEC 10646 2012 Unicode 6 2 za vinyatkom znaka tureckoyi liri yakij vklyuchenij do popravki 1 ISO IEC 10646 2012 Unicode 6 3 za vinyatkom znaka tureckoyi liri yakij vhodit do popravki 1 ta p yati dvonapravlenih kontrolnih simvoliv arabska literna poznachka izolyaciya zliva napravo izolyaciya sprava nalivo pershij silnij izolyator Pop Directional Isolate yaki vklyucheni do popravki 2 ISO IEC 10646 2012 plyus popravki 1 ta 2 Unicode 7 0 za vinyatkom znaku rublya ISO IEC 10646 2014 plyus popravka 1 Unicode 8 0 za vinyatkom znaka lari dev yati unifikovanih ideografiv CJK ta 41 simvolu smajlikiv ISO IEC 10646 2014 plyus popravki 1 ta 2 Unicode 9 0 za vinyatkom Adlam Newa yaponskih simvoliv telebachennya ta 74 smajliv ta simvoliv ISO IEC 10646 2017 Unicode 10 0 za vinyatkom 285 simvoliv Hentaigani 3 simvoliv kvadrata Zanabazara ta 56 simvoliv smajlivDiv takozhPov yazani standarti ISO ISO 646 poziciyi vid 0 do 127 taki sami yak u ISO IEC 10646 ta Unicode a cifri 646 ta 10646 podibni Informacijni tehnologiyi en Struktura kodu simvoliv ta metodi rozshirennya Kodi upravlinnya en C0 ta C1 ISO 8859 poziciyi vid 0 do 255 UCS ta Unicode taki sami yak u ISO 8859 1 psevdonim ISO Latin 1 en Informacijni tehnologiyi Mizhnarodne vporyadkuvannya ta porivnyannya ryadkiv Kodi en dlya podannya imen scenariyiv kozhen simvol pov yazanij z odnim iz cih scenariyiv en Spisok posilan na sutnist simvoliv XML ta HTML Spisok shriftiv Unicode en en DzherelaZagalnodostupni standarti ISO vklyuchaye kopiyu ISO 10646 2014 129 megapikselnij ZIP fajl vipushenij 01 09 2014 ta elektronni vstavki 1 7 megapikselnij ZIP fajl ISO IEC JTC1 SC2 WG2 robocha grupa vidpovidalna za ISO 10646 Poshireni zapitannya shodo UTF 8 ta Unicode Bezkoshtovni shrifti SIL redaktori ta dokumentaciya Prostij ale priyemnij priklad UTF 8 yakij pereviryaye mozhlivosti vashogo vebbrauzera ta shriftiv Problemi z naborom simvoliv dlya ADA 9x z zhovtnya 1989 r Detalno opisuyut original DIS ISO 10646 do zlittya