Тип | програмний каркас |
---|---|
Автори | d і d |
Розробник | Apache Software Foundation |
Стабільний випуск | 3.0.0 (13 грудня 2017 ) |
Версії | 3.4.0 (17 березня 2024)[1] |
Платформа | віртуальна машина Java |
Операційна система | кросплатформова програма і POSIX |
Мова програмування | Java |
Стан розробки | активний |
Ліцензія | d і GNU GPL |
Онлайн-документація | cwiki.apache.org/confluence/display/hadoop |
Репозиторій | https://git-wip-us.apache.org/repos/asf/hadoop.git, https://gitbox.apache.org/repos/asf?p=hadoop.git, https://github.com/apache/hadoop |
Вебсайт | hadoop.apache.org |
|
Apache Hadoop — вільна програмна платформа і каркас для організації [en] і обробки наборів великих даних з використанням [en] MapReduce, при якій завдання ділиться на багато дрібніших відособлених фрагментів, кожен з яких може бути запущений на окремому вузлі кластера, що складається з [en]. Всі модулі в Hadoop спроєктовані з врахуванням припущення, що апаратне забезпечення часто виходить з ладу і такі ситуації повинні автоматично опрацьовуватись фреймворком.
Ядро системи Apache Hadoop складається з розподіленої файлової системи Hadoop Distributed Filesystem (HDFS), та системи обчислень на основі моделі програмування MapReduce. Hadoop розділяє файли на великі блоки і розподіляє їх між вузлами кластера. Тоді він передає запакований код на вузли для паралельної обробки даних. Цей підхід користується [en], коли вузли маніпулюють лише даними до яких мають доступ. Це дозволяє обробляти набір даних швидше і ефективніше ніж в традиційнішій [en] яка покладається на [en] в якій обчислення та дані для них передаються через високошвидкісну мережу.
Основний фреймворк Apache Hadoop складається з наступних модулів:
- Hadoop Common — містить бібліотеки та утиліти потрібні іншим модулям Hadoop;
- Hadoop Distributed File System (HDFS) — розподілена файлова система, яка зберігає дані на звичайних машинах, надаючи дуже високу загальну пропускну здатність на кластері загалом;
- Hadoop YARN — платформа що відповідає за керування обчислювальними ресурсами в кластерах і їх використання для користувацьких завдань.
- Hadoop MapReduce — реалізація моделі програмування MapReduce для обробки великих об'ємів даних.
З часом, термін Hadoop почав вживатись не тільки щодо вищезгаданих базових модулів та підмодулів, а й до «екосистеми», тобто набору додаткових пакетів програмного забезпечення, які можуть встановлюватись поверх, або поряд з Hadoop, наприклад таких як [en], [en], [en], [en], Apache Spark, [en], [en], [en], Apache Sqoop, [en], та [en].
MapReduce та HDFS в Apache Hadoop's були натхненними статтями Google про їх алгоритм MapReduce та Google File System.
Фреймворк Hadoop написаний переважно на Java, з частиною системного коду на C та утилітами командного рядка як [en]. Хоча в програмах MapReduce звичайним є код на Java, для реалізації «map» та «reduce» частин користувацької програми можна використовувати будь-яку мову програмування завдяки «Hadoop Streaming». Інші проєкти в екосистемі Hadoop надають багатші інтерфейси користувача.
Історія
Розробка була ініційована на початку 2005 [en] з метою побудови програмної інфраструктури розподілених обчислень для проєкту Nutch — вільної програмної пошукової машини на Java, її ідейною основою стала публікація співробітників Google Джеффрі Діна і Санжая Гемавата про обчислювальну концепцію MapReduce. Новий проєкт був названий на честь іграшкового слоненяти дитини засновника проєкту.
Протягом 2005—2006 років Hadoop розвивався зусиллями двох розробників — Каттінга і Майка Кафареллі (Mike Cafarella) в режимі часткової зайнятості, спочатку в рамках проєкту Nutch, потім — проєкту Lucene. У січні 2006 року корпорація Yahoo запросила Каттінга очолити спеціально виділену команду розробки інфраструктури розподілених обчислень, до цього ж моменту відноситься виділення Hadoop в окремий проєкт. У лютому 2008 року Yahoo запустила в продуктивну експлуатацію кластерну пошукову машину на 10 тисяч процесорних ядер, керовану засобами Hadoop.
У січні 2008 року Hadoop стає проєктом верхнього рівня системи проєктів Apache Software Foundation. У квітні 2008 року Hadoop побив світовий рекорд продуктивності в стандартизованому бенчмарку сортування даних — 1 Тбайт був оброблений за 309 сек на кластері з 910 вузлів. З цього моменту починається широке застосування Hadoop за межами Yahoo — технологію для своїх сайтів впроваджують Last.fm, Facebook, The New York Times, проводиться адаптація для запуску Hadoop у хмарах Amazon EC2.
У вересні 2009 року Каттинг переходить в каліфорнійський стартап Cloudera, який, завдяки такому переходу, коментатори характеризують як «нового прапороносця Hadoop», попри те, що основна частина проєкту була створена все-таки співробітниками Facebook і Yahoo.
У квітні 2010 року корпорація Google надала Apache Software Foundation права на використання технології MapReduce, через три місяці після її захисту в патентному бюро США, тим самим позбавивши організацію від можливих патентних претензій.
Починаючи з 2010 року Hadoop неодноразово характеризується як ключова технологія «Великих Даних», прогнозується його широке розповсюдження для масово-паралельної обробки даних, і, разом з Cloudera, з'явилася серія технологічних стартапів, повністю орієнтованих на комерціалізацію Hadoop. Протягом 2010 року декілька підпроєктів Hadoop — Avro, , Hive, Pig, Zookeeper — послідовно стали проєктами верхнього рівня фонду Apache. У березні 2011 року Hadoop удостоєний щорічної інноваційної нагороди медіагрупи Guardian, на церемонії вручення технологія була названа «швейцарським армійським ножем XXI століття».
Архітектура
Hadoop складається з пакету Hadoop Common, який надає абстракції операційної та файлової системи, рушій MapReduce (або MapReduce/MR1 або YARN/MR2) та Hadoop Distributed File System (HDFS). Пакет Hadoop Common містить файли JAR та скрипти, потрібні для запуску Hadoop.
Цей розділ потребує доповнення. (вересень 2017) |
Застосування
Hadoop активно використовується у великих промислових проєктах, надаючи можливості, аналогічні платформі Google Bigtable/GFS/MapReduce, при цьому компанія Google офіційно делегувала Hadoop та іншим проєктам Apache право використання технологій, на які поширюються патенти, пов'язані з методом MapReduce. Одним з найбільших користувачів і розробників Hadoop є компанія Yahoo!, вона активно використовує цю систему в своїх пошукових кластерах (Hadoop-кластеру Yahoo, що складається з 40 тисяч вузлів, належить світовий рекорд швидкості сортування великого обсягу даних). Hadoop-кластер використовується в Facebook для обробки однієї з найбільших баз даних, в якій зберігається близько 30 петабайт інформації. Hadoop також лежить в основі платформи і активно адаптується компанією Microsoft для роботи з СУБД SQL Server, Windows Server і хмарній платформі з метою створення нових продуктів для організації розподіленої обробки великих обсягів даних. Hadoop є одним з ключових ланок суперкомп'ютера IBM Watson, який виграв бій з найкращими гравцями телевізійної гри-вікторини .
Хостинг Hadoop у хмарах
Hadoop може розгортатись як в традиційному датацентрі всередині підприємства, так і в хмарах. Хмари дозволяють організаціям розгортати Hadoop без необхідності купляти апаратне забезпечення та утримувати фахівців із відповідною кваліфікацією. До вендорів, які надають хмарні сервіси Hadoop, входять Microsoft, Amazon, IBM, Google, Oracle та [en]
Цей розділ потребує доповнення. (вересень 2017) |
Виноски
- Release 3.4.0 available
- . Архів оригіналу за 23 вересня 2017. Процитовано 10 вересня 2017.
- . ibm.com. IBM. Архів оригіналу за 8 січня 2017. Процитовано 30 жовтня 2014.
- Malak, Michael (19 вересня 2014). . datascienceassn.org. Data Science Association. Архів оригіналу за 10 вересня 2017. Процитовано 30 жовтня 2014.
- . IEEE. October 2014. Архів оригіналу (pdf) за 22 серпня 2017. Процитовано 10 вересня 2017.
- . apache.org. Apache Software Foundation. 12 вересня 2014. Архів оригіналу за 6 жовтня 2014. Процитовано 30 вересня 2014.
- Murthy, Arun (15 серпня 2012). . hortonworks.com. Hortonworks. Архів оригіналу за 11 вересня 2017. Процитовано 30 вересня 2014.
- . finance.yahoo.com. . 14 листопада 2012. Архів оригіналу за 10 вересня 2017. Процитовано 30 жовтня 2014.
- . Hadoop.apache.org. Архів оригіналу за 23 вересня 2017. Процитовано 17 жовтня 2013.
- . John Wiley & Sons. 19 грудня 2014. с. 300. ISBN . Архів оригіналу за 6 грудня 2016. Процитовано 29 січня 2015.
- . Mail-archive.com. 2 травня 2010. Архів оригіналу за 14 серпня 2017. Процитовано 5 квітня 2013.
- Dean, Jeffrey and Ghemawat, Sanjay. MapReduce: Simplified Data Processing on Large Clusters : ( )[англ.] // OSDI ’04: 6th Symposium on Operating Systems Design and Implementation. — , 2004. — С. 137-149. — DOI:10.1145/1327452.1327492.
- Cutting, Doug (24 березня 2008). Hadoop: a brief history (PDF) (англійською) . Yahoo!. Архів оригіналу (PDF) за 11 березня 2012. Процитовано 25 грудня 2011.
- Handy, Alex (9 жовтня 2009). Hadoop creator goes to Cloudera (англійською) . . Архів оригіналу за 11 березня 2012. Процитовано 25 грудня 2011.
I've said for a while now that Cloudera is the company with the Hadoop banner firmly in its grasp, despite the fact that Yahoo and Facebook both contribute mountains of code the project
- Metz, Cade (27 квітня 2010). Google blesses Hadoop with MapReduce patent license (англійською) . . Архів оригіналу за 11 березня 2012. Процитовано 30 грудня 2011.
- Моррисон, Алан та інші (17 грудня 2010). Великі Дані: як витягти з них інформацію (PDF). Технологический прогноз. Ежеквартальный журнал, российское издание, 2010 выпуск 3 (російською) . PricewaterhouseCoopers. Архів оригіналу за 11 березня 2012. Процитовано 12 листопада 2011.
К началу 2010 года Hadoop, MapReduce и ассоциированные с ними технологии с открытым кодом стали движущей силой целого нового явления, которое O’Reilly Media, The Economist и другие издания окрестили большими данными
- Winckler, Marie (25 березня 2011). Apache Hadoop takes top prize at Media Guardian Innovation Awards (англійською) . The Guardian. Архів оригіналу за 11 березня 2012. Процитовано 25 грудня 2011.
Described by the judging panel as a “Swiss army knife of the 21st century”, Apache Hadoop picked up the innovator of the year award for having the potential to change the face of media innovations
- Chouraria, Harsh (21 жовтня 2012). . cloudera.com. . Архів оригіналу за 22 жовтня 2013. Процитовано 23 жовтня 2013.
- . Архів оригіналу за 11 вересня 2017. Процитовано 10 вересня 2017.
- . Azure.microsoft.com. Архів оригіналу за 11 вересня 2017. Процитовано 22 липня 2014.
- . Архів оригіналу за 11 вересня 2017. Процитовано 10 вересня 2017.
- . Архів оригіналу за 31 березня 2016. Процитовано 8 квітня 2016.
- . Архів оригіналу за 30 березня 2022. Процитовано 19 квітня 2022.
{{}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title ()
Посилання
- Official Hadoop Homepage
- Introducing Apache Hadoop: The Modern Data Operating System [ 23 грудня 2011 у Wayback Machine.] — lecture given at Stanford University by Co-Founder and CTO of Cloudera, Amr Awadallah (video archive)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
posix compliant Apache HadoopTipprogramnij karkasAvtorid i dRozrobnikApache Software FoundationStabilnij vipusk3 0 0 13 grudnya 2017 6 rokiv tomu 2017 12 13 Versiyi3 4 0 17 bereznya 2024 1 Platformavirtualna mashina JavaOperacijna sistemakrosplatformova programa i POSIXMova programuvannyaJavaStan rozrobkiaktivnijLicenziyad i GNU GPLOnlajn dokumentaciyacwiki apache org confluence display hadoopRepozitorijhttps git wip us apache org repos asf hadoop git https gitbox apache org repos asf p hadoop git https github com apache hadoopVebsajthadoop apache org Mediafajli u Vikishovishi Apache Hadoop vilna programna platforma i karkas dlya organizaciyi en i obrobki naboriv velikih danih z vikoristannyam en MapReduce pri yakij zavdannya dilitsya na bagato dribnishih vidosoblenih fragmentiv kozhen z yakih mozhe buti zapushenij na okremomu vuzli klastera sho skladayetsya z en Vsi moduli v Hadoop sproyektovani z vrahuvannyam pripushennya sho aparatne zabezpechennya chasto vihodit z ladu i taki situaciyi povinni avtomatichno opracovuvatis frejmvorkom Yadro sistemi Apache Hadoop skladayetsya z rozpodilenoyi fajlovoyi sistemi Hadoop Distributed Filesystem HDFS ta sistemi obchislen na osnovi modeli programuvannya MapReduce Hadoop rozdilyaye fajli na veliki bloki i rozpodilyaye yih mizh vuzlami klastera Todi vin peredaye zapakovanij kod na vuzli dlya paralelnoyi obrobki danih Cej pidhid koristuyetsya en koli vuzli manipulyuyut lishe danimi do yakih mayut dostup Ce dozvolyaye obroblyati nabir danih shvidshe i efektivnishe nizh v tradicijnishij en yaka pokladayetsya na en v yakij obchislennya ta dani dlya nih peredayutsya cherez visokoshvidkisnu merezhu Osnovnij frejmvork Apache Hadoop skladayetsya z nastupnih moduliv Hadoop Common mistit biblioteki ta utiliti potribni inshim modulyam Hadoop Hadoop Distributed File System HDFS rozpodilena fajlova sistema yaka zberigaye dani na zvichajnih mashinah nadayuchi duzhe visoku zagalnu propusknu zdatnist na klasteri zagalom Hadoop YARN platforma sho vidpovidaye za keruvannya obchislyuvalnimi resursami v klasterah i yih vikoristannya dlya koristuvackih zavdan Hadoop MapReduce realizaciya modeli programuvannya MapReduce dlya obrobki velikih ob yemiv danih Z chasom termin Hadoop pochav vzhivatis ne tilki shodo vishezgadanih bazovih moduliv ta pidmoduliv a j do ekosistemi tobto naboru dodatkovih paketiv programnogo zabezpechennya yaki mozhut vstanovlyuvatis poverh abo poryad z Hadoop napriklad takih yak en en en en Apache Spark en en en Apache Sqoop en ta en MapReduce ta HDFS v Apache Hadoop s buli nathnennimi stattyami Google pro yih algoritm MapReduce ta Google File System Frejmvork Hadoop napisanij perevazhno na Java z chastinoyu sistemnogo kodu na C ta utilitami komandnogo ryadka yak en Hocha v programah MapReduce zvichajnim ye kod na Java dlya realizaciyi map ta reduce chastin koristuvackoyi programi mozhna vikoristovuvati bud yaku movu programuvannya zavdyaki Hadoop Streaming Inshi proyekti v ekosistemi Hadoop nadayut bagatshi interfejsi koristuvacha IstoriyaRozrobka bula inicijovana na pochatku 2005 en z metoyu pobudovi programnoyi infrastrukturi rozpodilenih obchislen dlya proyektu Nutch vilnoyi programnoyi poshukovoyi mashini na Java yiyi idejnoyu osnovoyu stala publikaciya spivrobitnikiv Google Dzheffri Dina i Sanzhaya Gemavata pro obchislyuvalnu koncepciyu MapReduce Novij proyekt buv nazvanij na chest igrashkovogo slonenyati ditini zasnovnika proyektu Protyagom 2005 2006 rokiv Hadoop rozvivavsya zusillyami dvoh rozrobnikiv Kattinga i Majka Kafarelli Mike Cafarella v rezhimi chastkovoyi zajnyatosti spochatku v ramkah proyektu Nutch potim proyektu Lucene U sichni 2006 roku korporaciya Yahoo zaprosila Kattinga ocholiti specialno vidilenu komandu rozrobki infrastrukturi rozpodilenih obchislen do cogo zh momentu vidnositsya vidilennya Hadoop v okremij proyekt U lyutomu 2008 roku Yahoo zapustila v produktivnu ekspluataciyu klasternu poshukovu mashinu na 10 tisyach procesornih yader kerovanu zasobami Hadoop U sichni 2008 roku Hadoop staye proyektom verhnogo rivnya sistemi proyektiv Apache Software Foundation U kvitni 2008 roku Hadoop pobiv svitovij rekord produktivnosti v standartizovanomu benchmarku sortuvannya danih 1 Tbajt buv obroblenij za 309 sek na klasteri z 910 vuzliv Z cogo momentu pochinayetsya shiroke zastosuvannya Hadoop za mezhami Yahoo tehnologiyu dlya svoyih sajtiv vprovadzhuyut Last fm Facebook The New York Times provoditsya adaptaciya dlya zapusku Hadoop u hmarah Amazon EC2 U veresni 2009 roku Katting perehodit v kalifornijskij startap Cloudera yakij zavdyaki takomu perehodu komentatori harakterizuyut yak novogo praporonoscya Hadoop popri te sho osnovna chastina proyektu bula stvorena vse taki spivrobitnikami Facebook i Yahoo U kvitni 2010 roku korporaciya Google nadala Apache Software Foundation prava na vikoristannya tehnologiyi MapReduce cherez tri misyaci pislya yiyi zahistu v patentnomu byuro SShA tim samim pozbavivshi organizaciyu vid mozhlivih patentnih pretenzij Pochinayuchi z 2010 roku Hadoop neodnorazovo harakterizuyetsya yak klyuchova tehnologiya Velikih Danih prognozuyetsya jogo shiroke rozpovsyudzhennya dlya masovo paralelnoyi obrobki danih i razom z Cloudera z yavilasya seriya tehnologichnih startapiv povnistyu oriyentovanih na komercializaciyu Hadoop Protyagom 2010 roku dekilka pidproyektiv Hadoop Avro Hive Pig Zookeeper poslidovno stali proyektami verhnogo rivnya fondu Apache U berezni 2011 roku Hadoop udostoyenij shorichnoyi innovacijnoyi nagorodi mediagrupi Guardian na ceremoniyi vruchennya tehnologiya bula nazvana shvejcarskim armijskim nozhem XXI stolittya ArhitekturaHadoop skladayetsya z paketu Hadoop Common yakij nadaye abstrakciyi operacijnoyi ta fajlovoyi sistemi rushij MapReduce abo MapReduce MR1 abo YARN MR2 ta Hadoop Distributed File System HDFS Paket Hadoop Common mistit fajli JAR ta skripti potribni dlya zapusku Hadoop Cej rozdil potrebuye dopovnennya veresen 2017 ZastosuvannyaHadoop aktivno vikoristovuyetsya u velikih promislovih proyektah nadayuchi mozhlivosti analogichni platformi Google Bigtable GFS MapReduce pri comu kompaniya Google oficijno deleguvala Hadoop ta inshim proyektam Apache pravo vikoristannya tehnologij na yaki poshiryuyutsya patenti pov yazani z metodom MapReduce Odnim z najbilshih koristuvachiv i rozrobnikiv Hadoop ye kompaniya Yahoo vona aktivno vikoristovuye cyu sistemu v svoyih poshukovih klasterah Hadoop klasteru Yahoo sho skladayetsya z 40 tisyach vuzliv nalezhit svitovij rekord shvidkosti sortuvannya velikogo obsyagu danih Hadoop klaster vikoristovuyetsya v Facebook dlya obrobki odniyeyi z najbilshih baz danih v yakij zberigayetsya blizko 30 petabajt informaciyi Hadoop takozh lezhit v osnovi platformi i aktivno adaptuyetsya kompaniyeyu Microsoft dlya roboti z SUBD SQL Server Windows Server i hmarnij platformi z metoyu stvorennya novih produktiv dlya organizaciyi rozpodilenoyi obrobki velikih obsyagiv danih Hadoop ye odnim z klyuchovih lanok superkomp yutera IBM Watson yakij vigrav bij z najkrashimi gravcyami televizijnoyi gri viktorini Hosting Hadoop u hmarahHadoop mozhe rozgortatis yak v tradicijnomu datacentri vseredini pidpriyemstva tak i v hmarah Hmari dozvolyayut organizaciyam rozgortati Hadoop bez neobhidnosti kuplyati aparatne zabezpechennya ta utrimuvati fahivciv iz vidpovidnoyu kvalifikaciyeyu Do vendoriv yaki nadayut hmarni servisi Hadoop vhodyat Microsoft Amazon IBM Google Oracle ta en Cej rozdil potrebuye dopovnennya veresen 2017 VinoskiRelease 3 4 0 available Arhiv originalu za 23 veresnya 2017 Procitovano 10 veresnya 2017 ibm com IBM Arhiv originalu za 8 sichnya 2017 Procitovano 30 zhovtnya 2014 Malak Michael 19 veresnya 2014 datascienceassn org Data Science Association Arhiv originalu za 10 veresnya 2017 Procitovano 30 zhovtnya 2014 IEEE October 2014 Arhiv originalu pdf za 22 serpnya 2017 Procitovano 10 veresnya 2017 apache org Apache Software Foundation 12 veresnya 2014 Arhiv originalu za 6 zhovtnya 2014 Procitovano 30 veresnya 2014 Murthy Arun 15 serpnya 2012 hortonworks com Hortonworks Arhiv originalu za 11 veresnya 2017 Procitovano 30 veresnya 2014 finance yahoo com 14 listopada 2012 Arhiv originalu za 10 veresnya 2017 Procitovano 30 zhovtnya 2014 Hadoop apache org Arhiv originalu za 23 veresnya 2017 Procitovano 17 zhovtnya 2013 John Wiley amp Sons 19 grudnya 2014 s 300 ISBN 9781118876220 Arhiv originalu za 6 grudnya 2016 Procitovano 29 sichnya 2015 Mail archive com 2 travnya 2010 Arhiv originalu za 14 serpnya 2017 Procitovano 5 kvitnya 2013 Dean Jeffrey and Ghemawat Sanjay MapReduce Simplified Data Processing on Large Clusters angl OSDI 04 6th Symposium on Operating Systems Design and Implementation 2004 S 137 149 DOI 10 1145 1327452 1327492 Cutting Doug 24 bereznya 2008 Hadoop a brief history PDF anglijskoyu Yahoo Arhiv originalu PDF za 11 bereznya 2012 Procitovano 25 grudnya 2011 Handy Alex 9 zhovtnya 2009 Hadoop creator goes to Cloudera anglijskoyu Arhiv originalu za 11 bereznya 2012 Procitovano 25 grudnya 2011 I ve said for a while now that Cloudera is the company with the Hadoop banner firmly in its grasp despite the fact that Yahoo and Facebook both contribute mountains of code the project Metz Cade 27 kvitnya 2010 Google blesses Hadoop with MapReduce patent license anglijskoyu Arhiv originalu za 11 bereznya 2012 Procitovano 30 grudnya 2011 Morrison Alan ta inshi 17 grudnya 2010 Veliki Dani yak vityagti z nih informaciyu PDF Tehnologicheskij prognoz Ezhekvartalnyj zhurnal rossijskoe izdanie 2010 vypusk 3 rosijskoyu PricewaterhouseCoopers Arhiv originalu za 11 bereznya 2012 Procitovano 12 listopada 2011 K nachalu 2010 goda Hadoop MapReduce i associirovannye s nimi tehnologii s otkrytym kodom stali dvizhushej siloj celogo novogo yavleniya kotoroe O Reilly Media The Economist i drugie izdaniya okrestili bolshimi dannymi Winckler Marie 25 bereznya 2011 Apache Hadoop takes top prize at Media Guardian Innovation Awards anglijskoyu The Guardian Arhiv originalu za 11 bereznya 2012 Procitovano 25 grudnya 2011 Described by the judging panel as a Swiss army knife of the 21st century Apache Hadoop picked up the innovator of the year award for having the potential to change the face of media innovations Chouraria Harsh 21 zhovtnya 2012 cloudera com Arhiv originalu za 22 zhovtnya 2013 Procitovano 23 zhovtnya 2013 Arhiv originalu za 11 veresnya 2017 Procitovano 10 veresnya 2017 Azure microsoft com Arhiv originalu za 11 veresnya 2017 Procitovano 22 lipnya 2014 Arhiv originalu za 11 veresnya 2017 Procitovano 10 veresnya 2017 Arhiv originalu za 31 bereznya 2016 Procitovano 8 kvitnya 2016 Arhiv originalu za 30 bereznya 2022 Procitovano 19 kvitnya 2022 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Obslugovuvannya CS1 Storinki z tekstom archived copy yak znachennya parametru title posilannya PosilannyaOfficial Hadoop Homepage Introducing Apache Hadoop The Modern Data Operating System 23 grudnya 2011 u Wayback Machine lecture given at Stanford University by Co Founder and CTO of Cloudera Amr Awadallah video archive