Форма́ти да́них — сукупність регламентованих в архітектурі ЕОМ структур для представлення різних за специфікою обробки та представлення видів інформації (цілих чисел, дробових чисел, текстових рядків тощо).
В ЕОМ інформація різного характеру представляється двійковими послідовностями з різним числом розрядів. Окремі частини цих послідовностей мають певні призначення, причому для фон-ноймановских машин ці призначення набувають сенсу тільки в контексті виконуваних команд. Поза цим контекстом і дані, і команди — усього лише послідовності двійкових розрядів, зовсім нерозрізнених за формою подання. Однак як операнди при виконанні команди, різні розряди цих послідовностей наділяються певним змістом. Тому говорять, що у фон-ноймановских машинах типи даних визначаються не самими даними, а операцією, що над ними виконується. І якщо, наприклад, в регістри-джерела операндів команди арифметичного додавання раптом виявилися завантажені розряди слова, яке містить якийсь текст, а не числа, то фон-нойманівська ЕОМ просто проігнорує ту обставину, що навряд чи має сенс додавати два текстові рядки, і поведетьтся з ними як з числами. Але це зовсім не зменшує важливості форматів даних у фон-нейманівских машинах, адже специфіка виконання тих чи інших машинних команд визначається тим форматом даних, над яким вони діють (інша справа, що фактичні операнди можуть не відповідати цьому форматові, але це вже на відповідальності програміста). Вся безліч операцій, а за ними й формати даних, можна розбити на дві великих групи: цілочисельні формати й формати для чисел із рухомою комою.
Цілочисельні формати
Цілочисельні формати використовуються для представлення цілих чисел і інформації, що може бути закодована такими числами (наприклад, символьні дані, рядки бітів, булеві вирази й ін.).
В першому випадку використовується зазвичай формат з урахуванням знака, що кодується, як правило, в старшому розряді, в другому випадку — беззнаковий формат. В іншому, номенклатура цілочисельних форматів різниться лише довжиною основного інформаційного поля. Як одиниця вимірювання довжини формату використовується слово, рівне двом або чотирьом байтам (залежно від архітектури).
Як приклад, в таблиці наведена номенклатура цілочисельних типів 64-розрядної архітектури SPARC v9.
Основною характеристикою цілочисельних форматів при виконанні арифметичних операцій, є діапазон представлень чисел, що прямо залежить від розрядності формату:
- для беззнакових форматів: 0≤i≤2b-1
- для форматів з врахуванням знаку: −2b-1≤i≤2b-1-1
Тут b — кількість інформаційних бітів в даному форматі.
Назва формата SPARC v9 | Розрядність | Діапазон |
Байт зі знаком | 8(7+1) | −27…27-1 |
Півслово зі знаком | 16(15+1) | −215…215-1 |
Слово зі знаком | 32(31+1) | −231…231-1 |
Подвійне слово зі знаком | 64(63+1) | −263…263-1 |
Байт без знака | 8 | 0…28-1 |
Беззнакове півслово | 16 | 0…216-1 |
Беззнакове слово | 32 | 0…232-1 |
Беззнакове подвійне слово | 64 | 0…264-1 |
Збільшення продуктивності ЕОМ викликане, зокрема, появою можливості оперувати з великими числами без необхідності розбивати їх на частини при завантаженні та проведенні операцій. Зважаючи на те, що в сучасних процесорах більшість цілочисельних операцій виконується над всіма розрядами числа одночасно, за один такт машинного часу, збільшення розрядності може привести до суттєвого прискорення. Однак це може спричинити необхідність адаптації існуючого програмного забезпечення, якщо при його написанні не враховувалося одне з найважливіших правил написання сумісного коду: відмова від застосування машинно-залежних типів даних.
Зрозуміло, збільшення розрядності веде до ускладнення апаратури. Причому до досить істотного ускладнення. Залежність складності обчислювальних пристроїв від розрядності операцій — як правило, зовсім не лінійна, а в найкращому разі квадратична.
В сфері фінансових і банківських обчислень, де точність є принциповою (але вона зовсім не залежить від діапазону представлення чисел), використовуються спеціалізовані двійково-десяткові формати подання цілочисельних даних. Необхідність використання двійково-десяткової арифметики пов'язана з неоднозначностями, що виникають при переведенні чисел із двійкової форми в десяткову, з якою ми маємо справу в повсякденному житті. Так, десяткове 0,1 не має цілого представлення у двійковій формі й перетворюється в нескінченний двійковий дріб. Це приводить, наприклад, до прикрих помилок округлення при проведенні банківських операцій.
У двійково-десятковому форматі кожна десяткова цифра кодується двійковим кодом і числа записуються певним чином. Для кодування однієї з 10 цифр використовується 4 двійкових розряди.
Формати з рухомою комою
Формат із рухомою комою використовується для представлення дробових або дійсних чисел.
У форматі з рухомою комою число N представляється в наступному виді:
- N=m×qp
де m — мантиса (mantissa, significand), p — порядок, q — основа системи числення.
Число у формі з рухомою комою може бути представлене безліччю способів: 2=20×10-1=0.2×101=0.002×103 і т. д. Для однозначного представлення на мантису накладається обмеження:
- q-1≤|m|<1 ,
при дотриманні якого число знаходиться в нормалізованій формі.
Різноманості форматів представлення чисел з рухомою комою було покладено кінець із введенням стандарту IEEE 754 на обчислення з рухомою комою, обов'язково присутнього в усіх сучасних ЕОМ загального призначення. Основні формати IEEE 754 зведені в таблицю. З перерахованих, у сучасних процесорах відповідно до рекомендацій IEEE 754 реалізовані формати з одинарною й подвійною точністю. Точніші формати в кожній архітектурі мають свої особливості реалізації.
Параметр | З одинарною точністю | З одинарною точністю розширений | З подвійною точністю | З подвійною точністю розширений |
Розрядність мантиси (зі знаком), n | 24 | 32 | 53 | 64 |
pmax | 127 | 1023 | 1023 | >16383 |
pmin | −127 | ≤−1023 | −1023 | ≤−16382 |
Розрядність порядка | 8 | ≤11 | 11 | 15 |
Розрядність формата | 32 | 43 | 64 | 79(80) |
Векторні формати
В зв'язку з розвитком технологій мультимедіа, в сучасні процесори почали інтегруватись засоби векторної обробки (хоча векторні процесори як такі відомі досить давно, але застосовувались до цього, як правило, лише в спеціалізованих ЕОМ). Векторні команди можуть оперувати словами високої розрядності (16 байт і вище), в які «упаковані» декілька цілочисельних або дробових операндів стандартного формату. Так, наприклад, в 16-байтний формат можуть бути вкладені 4 4-байтні елементи формату IEEE 754 одинарної точності. Вони утворять чотирикомпонентний вектор, пара яких може бути, приміром, просумована поелементно спеціальною командою додавання векторів.
Див. також
Посилання
- Формати даних(Відкритий посібник з відкритих даних)
Цю статтю треба для відповідності Вікіпедії. (Грудень 2011) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Forma ti da nih sukupnist reglamentovanih v arhitekturi EOM struktur dlya predstavlennya riznih za specifikoyu obrobki ta predstavlennya vidiv informaciyi cilih chisel drobovih chisel tekstovih ryadkiv tosho V EOM informaciya riznogo harakteru predstavlyayetsya dvijkovimi poslidovnostyami z riznim chislom rozryadiv Okremi chastini cih poslidovnostej mayut pevni priznachennya prichomu dlya fon nojmanovskih mashin ci priznachennya nabuvayut sensu tilki v konteksti vikonuvanih komand Poza cim kontekstom i dani i komandi usogo lishe poslidovnosti dvijkovih rozryadiv zovsim nerozriznenih za formoyu podannya Odnak yak operandi pri vikonanni komandi rizni rozryadi cih poslidovnostej nadilyayutsya pevnim zmistom Tomu govoryat sho u fon nojmanovskih mashinah tipi danih viznachayutsya ne samimi danimi a operaciyeyu sho nad nimi vikonuyetsya I yaksho napriklad v registri dzherela operandiv komandi arifmetichnogo dodavannya raptom viyavilisya zavantazheni rozryadi slova yake mistit yakijs tekst a ne chisla to fon nojmanivska EOM prosto proignoruye tu obstavinu sho navryad chi maye sens dodavati dva tekstovi ryadki i povedettsya z nimi yak z chislami Ale ce zovsim ne zmenshuye vazhlivosti formativ danih u fon nejmanivskih mashinah adzhe specifika vikonannya tih chi inshih mashinnih komand viznachayetsya tim formatom danih nad yakim voni diyut insha sprava sho faktichni operandi mozhut ne vidpovidati comu formatovi ale ce vzhe na vidpovidalnosti programista Vsya bezlich operacij a za nimi j formati danih mozhna rozbiti na dvi velikih grupi cilochiselni formati j formati dlya chisel iz ruhomoyu komoyu Cilochiselni formatiCilochiselni formati vikoristovuyutsya dlya predstavlennya cilih chisel i informaciyi sho mozhe buti zakodovana takimi chislami napriklad simvolni dani ryadki bitiv bulevi virazi j in V pershomu vipadku vikoristovuyetsya zazvichaj format z urahuvannyam znaka sho koduyetsya yak pravilo v starshomu rozryadi v drugomu vipadku bezznakovij format V inshomu nomenklatura cilochiselnih formativ riznitsya lishe dovzhinoyu osnovnogo informacijnogo polya Yak odinicya vimiryuvannya dovzhini formatu vikoristovuyetsya slovo rivne dvom abo chotirom bajtam zalezhno vid arhitekturi Yak priklad v tablici navedena nomenklatura cilochiselnih tipiv 64 rozryadnoyi arhitekturi SPARC v9 Osnovnoyu harakteristikoyu cilochiselnih formativ pri vikonanni arifmetichnih operacij ye diapazon predstavlen chisel sho pryamo zalezhit vid rozryadnosti formatu dlya bezznakovih formativ 0 i 2b 1 dlya formativ z vrahuvannyam znaku 2b 1 i 2b 1 1 Tut b kilkist informacijnih bitiv v danomu formati Nazva formata SPARC v9 Rozryadnist Diapazon Bajt zi znakom 8 7 1 27 27 1 Pivslovo zi znakom 16 15 1 215 215 1 Slovo zi znakom 32 31 1 231 231 1 Podvijne slovo zi znakom 64 63 1 263 263 1 Bajt bez znaka 8 0 28 1 Bezznakove pivslovo 16 0 216 1 Bezznakove slovo 32 0 232 1 Bezznakove podvijne slovo 64 0 264 1 Zbilshennya produktivnosti EOM viklikane zokrema poyavoyu mozhlivosti operuvati z velikimi chislami bez neobhidnosti rozbivati yih na chastini pri zavantazhenni ta provedenni operacij Zvazhayuchi na te sho v suchasnih procesorah bilshist cilochiselnih operacij vikonuyetsya nad vsima rozryadami chisla odnochasno za odin takt mashinnogo chasu zbilshennya rozryadnosti mozhe privesti do suttyevogo priskorennya Odnak ce mozhe sprichiniti neobhidnist adaptaciyi isnuyuchogo programnogo zabezpechennya yaksho pri jogo napisanni ne vrahovuvalosya odne z najvazhlivishih pravil napisannya sumisnogo kodu vidmova vid zastosuvannya mashinno zalezhnih tipiv danih Zrozumilo zbilshennya rozryadnosti vede do uskladnennya aparaturi Prichomu do dosit istotnogo uskladnennya Zalezhnist skladnosti obchislyuvalnih pristroyiv vid rozryadnosti operacij yak pravilo zovsim ne linijna a v najkrashomu razi kvadratichna V sferi finansovih i bankivskih obchislen de tochnist ye principovoyu ale vona zovsim ne zalezhit vid diapazonu predstavlennya chisel vikoristovuyutsya specializovani dvijkovo desyatkovi formati podannya cilochiselnih danih Neobhidnist vikoristannya dvijkovo desyatkovoyi arifmetiki pov yazana z neodnoznachnostyami sho vinikayut pri perevedenni chisel iz dvijkovoyi formi v desyatkovu z yakoyu mi mayemo spravu v povsyakdennomu zhitti Tak desyatkove 0 1 ne maye cilogo predstavlennya u dvijkovij formi j peretvoryuyetsya v neskinchennij dvijkovij drib Ce privodit napriklad do prikrih pomilok okruglennya pri provedenni bankivskih operacij U dvijkovo desyatkovomu formati kozhna desyatkova cifra koduyetsya dvijkovim kodom i chisla zapisuyutsya pevnim chinom Dlya koduvannya odniyeyi z 10 cifr vikoristovuyetsya 4 dvijkovih rozryadi Formati z ruhomoyu komoyuFormat iz ruhomoyu komoyu vikoristovuyetsya dlya predstavlennya drobovih abo dijsnih chisel U formati z ruhomoyu komoyu chislo N predstavlyayetsya v nastupnomu vidi N m qp de m mantisa mantissa significand p poryadok q osnova sistemi chislennya Chislo u formi z ruhomoyu komoyu mozhe buti predstavlene bezlichchyu sposobiv 2 20 10 1 0 2 101 0 002 103 i t d Dlya odnoznachnogo predstavlennya na mantisu nakladayetsya obmezhennya q 1 m lt 1 pri dotrimanni yakogo chislo znahoditsya v normalizovanij formi Riznomanosti formativ predstavlennya chisel z ruhomoyu komoyu bulo pokladeno kinec iz vvedennyam standartu IEEE 754 na obchislennya z ruhomoyu komoyu obov yazkovo prisutnogo v usih suchasnih EOM zagalnogo priznachennya Osnovni formati IEEE 754 zvedeni v tablicyu Z pererahovanih u suchasnih procesorah vidpovidno do rekomendacij IEEE 754 realizovani formati z odinarnoyu j podvijnoyu tochnistyu Tochnishi formati v kozhnij arhitekturi mayut svoyi osoblivosti realizaciyi Parametr Z odinarnoyu tochnistyu Z odinarnoyu tochnistyu rozshirenij Z podvijnoyu tochnistyu Z podvijnoyu tochnistyu rozshirenij Rozryadnist mantisi zi znakom n 24 32 53 64 pmax 127 1023 1023 gt 16383 pmin 127 1023 1023 16382 Rozryadnist poryadka 8 11 11 15 Rozryadnist formata 32 43 64 79 80 Vektorni formatiV zv yazku z rozvitkom tehnologij multimedia v suchasni procesori pochali integruvatis zasobi vektornoyi obrobki hocha vektorni procesori yak taki vidomi dosit davno ale zastosovuvalis do cogo yak pravilo lishe v specializovanih EOM Vektorni komandi mozhut operuvati slovami visokoyi rozryadnosti 16 bajt i vishe v yaki upakovani dekilka cilochiselnih abo drobovih operandiv standartnogo formatu Tak napriklad v 16 bajtnij format mozhut buti vkladeni 4 4 bajtni elementi formatu IEEE 754 odinarnoyi tochnosti Voni utvoryat chotirikomponentnij vektor para yakih mozhe buti primirom prosumovana poelementno specialnoyu komandoyu dodavannya vektoriv Div takozhKadr Paket danih Fajl Format fajlu Frejm Perelik fajlovih formativPosilannyaFormati danih Vidkritij posibnik z vidkritih danih Cyu stattyu treba vikifikuvati dlya vidpovidnosti standartam yakosti Vikipediyi Bud laska dopomozhit dodavannyam dorechnih vnutrishnih posilan abo vdoskonalennyam rozmitki statti Gruden 2011