Сти́снення да́них (англ. data compression) — це процедура перекодування даних, яка проводиться з метою зменшення їхнього обсягу, розміру, об'єму.
Стиснення базується на усуненні надлишку інформації, яка міститься у вихідних даних. Наприклад, повторення в тексті фрагментів (наприклад, слів природної або машинної мови). Подібний надлишок зазвичай усувається заміною повторюваних послідовностей коротшим значенням (кодом). Інший вид надлишковості пов'язаний з тим, що деякі значення в даних, що стискаються, трапляються частіше інших, при цьому можна замінювати дані, що часто трапляються, коротшими кодами, а ті, що рідко, довшими (ймовірнісне стиснення). Стиснення даних, які не мають властивості надлишку (наприклад випадковий сигнал чи шум), неможливе. Також, зазвичай, неможливо стиснути зашифровану інформацію.
Види стиснення:
- Стиснення без втрат — можливо відновлення вихідних даних без спотворень.
- Стиснення зі втратами — відновлення можливе з незначними спотвореннями.
Стиснення без втрат
Стиснення без втрат використовується при обробці та збереженні комп'ютерних програм і даних.
Для деяких типів даних спотворення не припустимі в принципі. У їх числі:
- символічні дані, зміна яких неминуче призводить до зміни їх семантики: програми та їх вихідні тексти, виконавчі масиви тощо;
- життєво важливі дані, зміни в яких можуть призвести до критичних помилок: наприклад, одержувані з медичної вимірювальної апаратури або контрольних приладів літальних, космічних апаратів тощо;
- багаторазово піддані стисненню і відновленню проміжні дані при багатоетапній обробці графічних, звукових і відеоданих.
Стиснення із втратами
Стиснення зі втратами зазвичай застосовується для зменшення обсягу звукової, фото- й відеоінформації і, як показує практика, для такого роду інформації це набагато вигідніше, але чим більша втрата даних при стисненні, тим помітніші в стиснених даних стають артефакти.
Допустимість втрат
У загальному випадку алгоритми стиснення без втрат універсальні в тому сенсі, що їх застосування безумовно можливо для даних будь-якого типу, в той час як можливість застосування стиснення зі втратами потрібно обґрунтувати.
Системні вимоги алгоритмів
Різні алгоритми можуть вимагати різної кількості ресурсів обчислювальної системи, на яких їх застосовують:
- оперативної пам'яті під проміжні дані;
- постійної пам'яті під код програми і константи;
- процесорного часу.
У цілому ці вимоги залежать від складності та «інтелектуальності» алгоритму. Загальна тенденція така: чим ефективніший і універсальніший алгоритм, тим більші вимоги до обчислювальних ресурсів він пред'являє. Тим не менш, у специфічних випадках прості і компактні алгоритми можуть працювати не гірше складних і універсальних. Системні вимоги визначають їх споживчі якості: чим менш вимогливий алгоритм, тим у простішій, а отже, компактній, надійній і дешевій системі він може працювати.
Так як алгоритми стиснення і відновлення працюють в парі, має значення співвідношення системних вимог до них. Нерідко можна, ускладнивши один алгоритм, значно спростити інший. Таким чином, можливі три варіанти:
- Алгоритм стиснення вимагає більших обчислювальних ресурсів, ніж алгоритм відновлення. Це найпоширеніше співвідношення, характерне для випадків, коли одноразово стислі дані будуть використовуватися багато разів. Як приклад можна навести цифрові аудіо- і відеопрогравачі.
- Алгоритми стиснення і відновлення вимагають приблизно рівних обчислювальних ресурсів. Найбільш прийнятний варіант для ліній зв'язку, коли стиснення і відновлення відбувається одноразово на двох її кінцях (наприклад, в цифровій телефонії).
- Алгоритм стиснення істотно менш вимогливий, ніж алгоритм відновлення. Така ситуація характерна для випадків, коли процедура стиснення реалізується простим, часто портативним пристроєм, для якого обсяг доступних ресурсів дуже критичний, наприклад, космічний апарат або велика розподілена мережа датчиків. Це можуть бути також дані, розпакування яких потрібно в дуже малому відсотку випадків, наприклад запис камер відеоспостереження.
Алгоритми стиснення даних невідомого формату
Є два основних підходи до стиснення даних невідомого формату.
- На кожному кроці алгоритму стиснення черговий стискуваний символ або міститься у вихідний буфер стискального кодера як є (зі спеціальним прапором для позначення, що він не був стиснутий), або група з кількох стискуваних символів замінюється посиланням на відповідну групу з уже закодованих символів. Оскільки відновлення стислих таким чином даних виконується дуже швидко, такий підхід часто використовується для створення саморозпаковувальних програм.
- Для кожної послідовності символів, яку стиснено, одноразово або в кожний момент часу збирається статистика її появи в кодованих даних. На основі цієї статистики обчислюється ймовірність значення чергового кодованого символу (або послідовності символів). Після цього застосовується той чи інший різновид ентропійного кодування, наприклад, арифметичне кодування або кодування Хаффмана, для представлення частіших послідовностей короткими кодовими словами, а рідкіших — довшими.
Застосування
Відео
Алгоритми стиснення відео використовують сучасні техніки кодування для зменшення надлишковості відео даних. Більшість і кодеків поєднують просторове стиснення зображення і часову компенсацію руху. Стиснення відео є практичною реалізацією стиснення даних із галузі теорії інформації. На практиці, більшість відео кодеків також паралельно використовують техніки стиснення аудіо для стиснення окремих, але поєднаних в один пакет потоків даних.
Більшість алгоритмів стиснення використовують стиснення з втратами. [en] потребує високої . Хоча кодеки виконують із коефіцієнтом стиснення 5-12, типове стиснення MPEG-4 із втратами має коефіцієнт стиснення в межах від 20 до 200. Як і при будь-якому стисненні з втратами, завжди відбувається пошук між бажаною якістю відео, затратами ресурсів на здійснення стиснення і декодування, і системними вимогами. Сильно стисненне відео може мати візуально помітні артефакти.
Деякі схеми стиснення відео зазвичай оперують квадратні групи сусідніх пікселів, що називаються . Ці групи пікселів або блоки порівнюються від одного кадру до наступного, і відео кодек посилає лише в рамках цих блоків. Ті зони відео де є більше рухів, при стиснені треба закодувати більше даних, аби зберегти більшу кількість змінних пікселів. Зазвичай коли в кадрах відео є вибухи, полум’я, стада тварин, панорамні зйомки, велика частота зміни деталй призводить до зменшення якості або збільшення змінної бітової швидкості.
Хронологія
Наступна таблиця є частковою історією міжнародних стандартів стиснення відео.
Рік | Стандарт | Видавець | Популярні реалізації |
---|---|---|---|
1984 | ITU-T | ||
1988 | H.261 | ITU-T | Відеоконференції, відеотелефонія |
1993 | ISO, IEC | Video CD | |
1995 | ISO, IEC, ITU-T | DVD Video, Blu-ray, Digital Video Broadcasting, | |
1996 | H.263 | ITU-T | Відеоконференції, відеотелефонія, відео для мобільних телефонів (3GP) |
1999 | ISO, IEC | Відео в інтернет (DivX, Xvid ...) | |
2003 | (H.264/MPEG-4 AVC) | Sony, Panasonic, Samsung, ISO, IEC, ITU-T | Blu-ray, HD DVD, Digital Video Broadcasting, , Apple TV, відеоконференції |
2009 | Відео в інтернет, HDTV трансляція, UHDTV | ||
2013 | H.265 | ISO, IEC, ITU-T |
Примітки
- . Center for Signal and Information Processing Research. Georgia Institute of Technology. Архів оригіналу за 23 травня 2013. Процитовано 6 березня 2013.
- Graphics & Media Lab Video Group (2007). Lossless Video Codecs Comparison (PDF). Moscow State University.
Література
- Вейвлет-перетворення у компресії та попередній обробці зображень / О. В. Капшій, О. І. Коваль, Б. П. Русин ; НАН України, Фіз.-мех. ін-т ім. Г. В. Карпенка. — Львів : Сполом, 2008. — 206 с. : іл., табл., портр. ; 22 см. — Бібліогр.: с. 187—203 (238 назв). — 300 пр. —
- Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. — Диалог-МИФИ, 2002. — С. 384. — . 3000 экз.
- Д. Сэломон. Сжатие данных, изображения и звука. — М.: Техносфера, 2004. — С. 368. — . 3000 экз.
Див. також
Ця стаття не містить . (лютий 2016) |
Це незавершена стаття з технології. Ви можете проєкту, виправивши або дописавши її. |
Це незавершена стаття з математики. Ви можете проєкту, виправивши або дописавши її. |
Це незавершена стаття про алгоритми. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Sti snennya da nih angl data compression ce procedura perekoduvannya danih yaka provoditsya z metoyu zmenshennya yihnogo obsyagu rozmiru ob yemu Stisnennya bazuyetsya na usunenni nadlishku informaciyi yaka mistitsya u vihidnih danih Napriklad povtorennya v teksti fragmentiv napriklad sliv prirodnoyi abo mashinnoyi movi Podibnij nadlishok zazvichaj usuvayetsya zaminoyu povtoryuvanih poslidovnostej korotshim znachennyam kodom Inshij vid nadlishkovosti pov yazanij z tim sho deyaki znachennya v danih sho stiskayutsya traplyayutsya chastishe inshih pri comu mozhna zaminyuvati dani sho chasto traplyayutsya korotshimi kodami a ti sho ridko dovshimi jmovirnisne stisnennya Stisnennya danih yaki ne mayut vlastivosti nadlishku napriklad vipadkovij signal chi shum nemozhlive Takozh zazvichaj nemozhlivo stisnuti zashifrovanu informaciyu Vidi stisnennya Stisnennya bez vtrat mozhlivo vidnovlennya vihidnih danih bez spotvoren Stisnennya zi vtratami vidnovlennya mozhlive z neznachnimi spotvorennyami Stisnennya bez vtratDokladnishe Stisnennya bez vtrat Stisnennya bez vtrat vikoristovuyetsya pri obrobci ta zberezhenni komp yuternih program i danih Dlya deyakih tipiv danih spotvorennya ne pripustimi v principi U yih chisli simvolichni dani zmina yakih neminuche prizvodit do zmini yih semantiki programi ta yih vihidni teksti vikonavchi masivi tosho zhittyevo vazhlivi dani zmini v yakih mozhut prizvesti do kritichnih pomilok napriklad oderzhuvani z medichnoyi vimiryuvalnoyi aparaturi abo kontrolnih priladiv litalnih kosmichnih aparativ tosho bagatorazovo piddani stisnennyu i vidnovlennyu promizhni dani pri bagatoetapnij obrobci grafichnih zvukovih i videodanih Stisnennya iz vtratamiDokladnishe Stisnennya z vtratami Stisnennya zi vtratami zazvichaj zastosovuyetsya dlya zmenshennya obsyagu zvukovoyi foto j videoinformaciyi i yak pokazuye praktika dlya takogo rodu informaciyi ce nabagato vigidnishe ale chim bilsha vtrata danih pri stisnenni tim pomitnishi v stisnenih danih stayut artefakti Dopustimist vtrat U zagalnomu vipadku algoritmi stisnennya bez vtrat universalni v tomu sensi sho yih zastosuvannya bezumovno mozhlivo dlya danih bud yakogo tipu v toj chas yak mozhlivist zastosuvannya stisnennya zi vtratami potribno obgruntuvati Sistemni vimogi algoritmivRizni algoritmi mozhut vimagati riznoyi kilkosti resursiv obchislyuvalnoyi sistemi na yakih yih zastosovuyut operativnoyi pam yati pid promizhni dani postijnoyi pam yati pid kod programi i konstanti procesornogo chasu U cilomu ci vimogi zalezhat vid skladnosti ta intelektualnosti algoritmu Zagalna tendenciya taka chim efektivnishij i universalnishij algoritm tim bilshi vimogi do obchislyuvalnih resursiv vin pred yavlyaye Tim ne mensh u specifichnih vipadkah prosti i kompaktni algoritmi mozhut pracyuvati ne girshe skladnih i universalnih Sistemni vimogi viznachayut yih spozhivchi yakosti chim mensh vimoglivij algoritm tim u prostishij a otzhe kompaktnij nadijnij i deshevij sistemi vin mozhe pracyuvati Tak yak algoritmi stisnennya i vidnovlennya pracyuyut v pari maye znachennya spivvidnoshennya sistemnih vimog do nih Neridko mozhna uskladnivshi odin algoritm znachno sprostiti inshij Takim chinom mozhlivi tri varianti Algoritm stisnennya vimagaye bilshih obchislyuvalnih resursiv nizh algoritm vidnovlennya Ce najposhirenishe spivvidnoshennya harakterne dlya vipadkiv koli odnorazovo stisli dani budut vikoristovuvatisya bagato raziv Yak priklad mozhna navesti cifrovi audio i videoprogravachi Algoritmi stisnennya i vidnovlennya vimagayut priblizno rivnih obchislyuvalnih resursiv Najbilsh prijnyatnij variant dlya linij zv yazku koli stisnennya i vidnovlennya vidbuvayetsya odnorazovo na dvoh yiyi kincyah napriklad v cifrovij telefoniyi Algoritm stisnennya istotno mensh vimoglivij nizh algoritm vidnovlennya Taka situaciya harakterna dlya vipadkiv koli procedura stisnennya realizuyetsya prostim chasto portativnim pristroyem dlya yakogo obsyag dostupnih resursiv duzhe kritichnij napriklad kosmichnij aparat abo velika rozpodilena merezha datchikiv Ce mozhut buti takozh dani rozpakuvannya yakih potribno v duzhe malomu vidsotku vipadkiv napriklad zapis kamer videosposterezhennya Algoritmi stisnennya danih nevidomogo formatuYe dva osnovnih pidhodi do stisnennya danih nevidomogo formatu Na kozhnomu kroci algoritmu stisnennya chergovij stiskuvanij simvol abo mistitsya u vihidnij bufer stiskalnogo kodera yak ye zi specialnim praporom dlya poznachennya sho vin ne buv stisnutij abo grupa z kilkoh stiskuvanih simvoliv zaminyuyetsya posilannyam na vidpovidnu grupu z uzhe zakodovanih simvoliv Oskilki vidnovlennya stislih takim chinom danih vikonuyetsya duzhe shvidko takij pidhid chasto vikoristovuyetsya dlya stvorennya samorozpakovuvalnih program Dlya kozhnoyi poslidovnosti simvoliv yaku stisneno odnorazovo abo v kozhnij moment chasu zbirayetsya statistika yiyi poyavi v kodovanih danih Na osnovi ciyeyi statistiki obchislyuyetsya jmovirnist znachennya chergovogo kodovanogo simvolu abo poslidovnosti simvoliv Pislya cogo zastosovuyetsya toj chi inshij riznovid entropijnogo koduvannya napriklad arifmetichne koduvannya abo koduvannya Haffmana dlya predstavlennya chastishih poslidovnostej korotkimi kodovimi slovami a ridkishih dovshimi ZastosuvannyaVideo Div takozh Videokodek Algoritmi stisnennya video vikoristovuyut suchasni tehniki koduvannya dlya zmenshennya nadlishkovosti video danih Bilshist i kodekiv poyednuyut prostorove stisnennya zobrazhennya i chasovu kompensaciyu ruhu Stisnennya video ye praktichnoyu realizaciyeyu stisnennya danih iz galuzi teoriyi informaciyi Na praktici bilshist video kodekiv takozh paralelno vikoristovuyut tehniki stisnennya audio dlya stisnennya okremih ale poyednanih v odin paket potokiv danih Bilshist algoritmiv stisnennya vikoristovuyut stisnennya z vtratami en potrebuye visokoyi Hocha kodeki vikonuyut iz koeficiyentom stisnennya 5 12 tipove stisnennya MPEG 4 iz vtratami maye koeficiyent stisnennya v mezhah vid 20 do 200 Yak i pri bud yakomu stisnenni z vtratami zavzhdi vidbuvayetsya poshuk mizh bazhanoyu yakistyu video zatratami resursiv na zdijsnennya stisnennya i dekoduvannya i sistemnimi vimogami Silno stisnenne video mozhe mati vizualno pomitni artefakti Deyaki shemi stisnennya video zazvichaj operuyut kvadratni grupi susidnih pikseliv sho nazivayutsya Ci grupi pikseliv abo bloki porivnyuyutsya vid odnogo kadru do nastupnogo i video kodek posilaye lishe v ramkah cih blokiv Ti zoni video de ye bilshe ruhiv pri stisneni treba zakoduvati bilshe danih abi zberegti bilshu kilkist zminnih pikseliv Zazvichaj koli v kadrah video ye vibuhi polum ya stada tvarin panoramni zjomki velika chastota zmini detalj prizvodit do zmenshennya yakosti abo zbilshennya zminnoyi bitovoyi shvidkosti Hronologiya Nastupna tablicya ye chastkovoyu istoriyeyu mizhnarodnih standartiv stisnennya video Istoriya standartiv stisnennya video Rik Standart Vidavec Populyarni realizaciyi1984 ITU T1988 H 261 ITU T Videokonferenciyi videotelefoniya1993 ISO IEC Video CD1995 ISO IEC ITU T DVD Video Blu ray Digital Video Broadcasting 1996 H 263 ITU T Videokonferenciyi videotelefoniya video dlya mobilnih telefoniv 3GP 1999 ISO IEC Video v internet DivX Xvid 2003 H 264 MPEG 4 AVC Sony Panasonic Samsung ISO IEC ITU T Blu ray HD DVD Digital Video Broadcasting Apple TV videokonferenciyi2009 Video v internet HDTV translyaciya UHDTV2013 H 265 ISO IEC ITU TPrimitki Center for Signal and Information Processing Research Georgia Institute of Technology Arhiv originalu za 23 travnya 2013 Procitovano 6 bereznya 2013 Graphics amp Media Lab Video Group 2007 Lossless Video Codecs Comparison PDF Moscow State University LiteraturaVejvlet peretvorennya u kompresiyi ta poperednij obrobci zobrazhen O V Kapshij O I Koval B P Rusin NAN Ukrayini Fiz meh in t im G V Karpenka Lviv Spolom 2008 206 s il tabl portr 22 sm Bibliogr s 187 203 238 nazv 300 pr ISBN 978 966 665 554 0 D Vatolin A Ratushnyak M Smirnov V Yukin Metody szhatiya dannyh Ustrojstvo arhivatorov szhatie izobrazhenij i video Dialog MIFI 2002 S 384 ISBN 5 86404 170 X 3000 ekz D Selomon Szhatie dannyh izobrazheniya i zvuka M Tehnosfera 2004 S 368 ISBN 5 94836 027 X 3000 ekz Div takozhPortal Matematika Stisnennya zobrazhen Stisnennya video Stisnennya audioCya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno lyutij 2016 Ce nezavershena stattya z tehnologiyi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi Ce nezavershena stattya z matematiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi Ce nezavershena stattya pro algoritmi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi