Підтримка
www.wikidata.uk-ua.nina.az
Hadoop Distributed File System HDFS ce rozpodilena fajlova sistema yaka zabezpechuye visokoshvidkisnij dostup do danih i ye odnim z klyuchovih komponentiv platformi Hadoop HDFS ce fajlova sistema na osnovi Java yaka zabezpechuye masshtabovnist i nadijne zberigannya danih priznachena dlya rozbittya velikih klasteriv na standartnih serverah HDFS MapReduce ta YARN utvoryuyut yadro Apache Hadoop Koncepciyi ta struktura HDFSHDFS ye iyerarhichnoyu fajlovoyu sistemoyu Takim chinom v HDFS ye pidtrimka vkladennya katalogiv U katalozi mozhe roztashovuvatisya nul abo bilshe fajliv a takozh bud yaka kilkist pidkatalogiv HDFS skladayetsya z nastupnih obov yazkovih komponentiv Vuzol imen NameNode programnij kod sho vikonuyetsya v zagalnomu vipadku na vidilenij mashini primirnika HDFS i vidpovidaye za fajlovi operaciyi robotu z metadanimi Vuzol danih DataNode programnij kod yak pravilo vikonuyetsya vidilenoyi mashini primirnika HDFS i vidpovidaye za operaciyi rivnya fajlu robota z blokami danih Hadoop mistit yedinij vuzol tipu NameNode i dovilnu kilkist vuzliv tipu DataNode Osnovni koncepciyi zakladeni pri proektuvanni HDFS i arhitekturni rishennya zastosovuvani dlya realizaciyi cih koncepcij Obsyag danih HDFS ne povinna mati dosyazhnih v osyazhnomu majbutnomu obmezhen na obsyag zberezhenih danih Arhitekturne rishennya HDFS zberigaye fajli poblochno Bloki v HDFS rozpodileni mizh vuzlami danih obchislyuvalnogo klastera Vsi bloki krim ostannogo bloku fajlu mayut odnakovij rozmir krim togo blok mozhe buti rozmishenij na dekilkoh vuzlah Vidmovostijkist HDFS rozcinyuye vihid z ladu vuzla danih yak normu a ne yak vinyatok dijsno jmovirnist vihodu hocha b odnogo vuzla z tisyachi navit na nadijnomu fizichnomu obladnanni istotna Arhitekturni rishennya Dlya zabezpechennya vidmovostijkosti vsi dani v HDFS repliciyuyutsya nalashtovuvanu kilkist raziv Zahist vid kopiyuvannya poshkodzhenih danih virisheno za dopomogoyu zberigannya kontrolnih sum v okremomu prihovanomu fajli Kopiyuvannya metadanih za dopomogoyu vtorinnogo vuzla imen Avtodiagnostika Diagnostika spravnosti vuzliv v Hadoop klasteri ne povinna vimagati dodatkovogo administruvannya Arhitekturni rishennya Kozhen vuzol danih cherez pevni intervali chasu vidpravlyaye diagnostichni povidomlennya vuzlu imen Loguvannya operacij nad fajlami v specialnij zhurnal vuzla imen Produktivnist U kvitni 2008 roku Hadoop pobiv svitovij rekord produktivnosti v standartizovannom testi produktivnosti po sortuvannyu danih 1 Tbajt buv obroblenij za 309 sek na klasteri z 910 vuzliv Arhitekturni rishennya Princip odin raz zapisati bagato raziv prochitati Write once and read many WORM povnistyu zvilnyaye sistemu vid blokuvan tipu zapis chitannya Pozbutisya vid konfliktiv mnozhinnogo zapisu arhitektori virishili dozvolivshi zapis u fajl v odin chas tilki odnomu procesu HDFS optimizovanij pid potokovu peredachu danih Znizhennya navantazhennya na kanali peredachi danih a same ci kanali najchastishe ye vuzkim miscem u rozpodilenih seredovishah a takozh bilsh racionalne vikoristannya prostoru na zhorstkih diskah dozvolilo dosyagti stisnennya danih Replikaciya vidbuvayetsya v asinhronnomu rezhimi Zberigannya vsih metadanih vuzla NameNode v operativnij pam yati Vuzol imenVuzol imen NameNode yavlyaye soboyu programnij kod sho vikonuyetsya v zagalnomu vipadku na vidilenij mashini ekzemplyara HDFS i vidpovidaye za fajlovi operaciyi taki yak vidkrittya i zakrittya fajliv stvorennya i vidalennya katalogiv Krim togo NameNode vidpovidaye za upravlinnya prostorom imen fajlovoyi sistemi upravlinnya dostupom z boku zovnishnih kliyentiv vidpovidnist mizh fajlami i repliciyuvatisya na vuzlah danih blokami Hadoop mistit yedinij vuzol tipu NameNode sho porodzhuye vrazlivist vsogo klastera viklikanu vihodom vuzol tipu NameNode odinichna tochka vidmovi HDFS pidtrimuye vtorinnij vuzol imen Secondary NameNode Chasto cej fakt ye prichinoyu omani sho pri vidmovi pervinnogo vuzla imen jogo avtomatichno zaminit vtorinnij vuzol imen Naspravdi pidtrimki avtomatichnogo vidnovlennya klastera pislya vidmovi pervinnogo vuzla NameNode u versiyi 1 0 0 nemaye Vtorinnij vuzol imen vikonuye taki funkciyi kopiyuye obraz HDFS roztashovanij u fajli FsImage i log tranzakcij operacij z fajlovimi blokami EditLog u timchasovu papku zastosovuye zmini nakopicheni v balci tranzakcij do obrazu HDFS zapisuye novij obraz FsImage na vuzol NameNode pislya chogo vidbuvayetsya ochishennya EditLogVuzol danihVuzol danih DataNode yak i vuzol NameNode takozh yavlyaye soboyu programnij kod sho vikonuyetsya yak pravilo na vidilenij mashini ekzemplyara HDFS i vidpovidaye za operaciyi rivnya fajlu taki yak zapis i chitannyadanih vikonannya komand stvorennya vidalennya i replikaciyi blokiv otrimani vid vuzla NameNode Krim togo vuzol DataNode vidpovidaye za periodichnu vidpravku povidomlennya pro stan heartbeat povidomlennya obrobku zapitiv na chitannya i zapis sho nadhodyat vid kliyentiv fajlovoyi sistemi HDFSKliyenti HDFSKliyenti yavlyayut soboyu programnih kliyentiv sho pracyuyut z fajlovoyu sistemoyu U roli kliyenta mozhe vistupati bud yakij dodatok abo koristuvach yakij vzayemodiye cherez specialnij API z fajlovoyu sistemoyu HDFS Dlya kliyenta HDFS viglyadaye yak zvichajna fajlova sistema iyerarhiya katalogiv z vkladenimi v nih pidkatalogami i fajlami Yak i u fajlovih sistemah zagalnogo priznachennya kliyentovi za nayavnosti dostatnih prav dozvoleni nastupni operaciyi stvorennya vidalennya perejmenuvannya peremishennya Vishenazvani operaciyi zastosovuvani do katalogiv i fajliv Najbilsh istotna vidminnist roboti kliyenta z fajlovoyu sistemoyu HDFS vid roboti z fajlovoyu sistemoyu zagalnogo priznachennya ce te sho pri stvorenni fajlu kliyent mozhe yavno vkazati rozmir bloku fajlu za umovchannyam 64 Mb i kilkist stvoryuvanih replik za zamovchuvannyam znachennya dorivnyuye 3
Топ