Відмовостійкий кластер, кластер високої доступності (англ. High-Availability cluster, HA cluster) — кластер, що спроектований відповідно до методик забезпечення високої доступності і гарантує мінімальний час простою за рахунок апаратної надмірності. Без кластеризації збій сервера призводить до того, що підтримувані ним додатки або мережеві сервіси виявляються недоступними. Відмовостійка кластеризація виправляє дану ситуацію, перезапускаючи додатки на інших вузлах кластера без втручання адміністратора, в разі виявлення апаратних або програмних збоїв. Процес перезапуску відомий як аварійне перемикання. В рамках цього процесу програмне забезпечення кластеризації може додатково налаштувати вузол перед запуском програми на ньому (наприклад, імпортувати і монтувати відповідні файлові системи, переналаштовуючи мережеве обладнання або запускаючи будь-які службові додатки).
Відмовостійкі кластери широко використовуються для підтримки важливих баз даних, зберігання файлів в мережі, бізнес-додатків і систем масового обслуговування клієнтів.
Реалізації HA-кластерів є спробами досягнення відмовостійкості кластера в цілому, шляхом виключення критичних точок відмови, в тому числі за рахунок резервування обчислювальних потужностей та здійснення підключення до мережі і сховищ даних, об'єднаних в надлишкову мережу зберігання даних.
Вимоги до архітектури додатка
Чи не кожен додаток може працювати в високодоступному кластерному середовищі. Відповідні рішення повинні бути закладені на ранній стадії розробки програмного забезпечення. Для роботи в HA-кластері додаток повинен відповідати, як мінімум, наступним технічним вимогам, останні два з яких мають вирішальне значення для його надійної роботи в кластері і які повинні повною мірою задовольнити наступне:
- Повинен бути відносно простий спосіб запуску, зупинки, примусової зупинки, і перевірки стану додатка. На практиці це означає, що додаток має мати інтерфейс командної стрічки або скрипту для управління ним, в тому числі для роботи з декількома запущеними екземплярами додатка.
- Додаток повинен вміти використовувати загальне сховище даних (NAS / SAN).
- Важливо, що додаток має зберігати в загальному сховищі максимально можливу кількість даних про свій поточний стан.
- Додаток не повинен пошкоджувати дані при виході з ладу або відновленні з збереженого стану.
Схеми побудови
Найчастіше зустрічаються двовузлові HA-кластери — це мінімальна конфігурація, необхідна для забезпечення відмовостійкості. Але часто кластери містять велику кількість вузлів. Всі ці конфігурації, як правило, можуть бути описані однією з наступних моделей:
- Active / active — Частина трафіку, що обробляє відмову вузла, перенаправляється до працюючого вузла або розподіляється між кількома працюючими вузлами. Така схема використовується в тому випадку, коли вузли мають однорідну конфігурацію програмного забезпечення і виконують однакову задачу.
- Active / passive — Має повне резервування (дійсну копію) кожного вузла. Резерв використовується тільки тоді, коли відмовляє відповідний основний вузол. Ця конфігурація вимагає значних надлишкових апаратних засобів.
- N + 1 — Має один повноцінний резервний вузол, до якого в момент відмови переходить роль вузла, що не доступний в даний момент часу. У разі гетерогенної програмної конфігурації основних вузлів додатковий вузол, повинен бути здатний взяти на себе роль кожного з основних вузлів, за резервування котрих, він відповідає. Така схема застосовується в кластерах, які обслуговують кілька різнорідних сервісів, що працюють одночасно.
- N + M — Якщо один кластер обслуговує кілька сервісів, включення в кластер єдиного резервного вузла може виявитися недостатнім для належного рівня резервування. У таких випадках в кластер включається кілька резервних серверів, кількість яких є компромісом між ціною рішення і необхідної надійністю.
- N-к-1 — Дозволяє резервному вузлу вмикатися в роботу тимчасово, поки вузол, що відмовив, не буде відновлений, після цього вихідне навантаження повертається на основний вузол для збереження вихідного рівня доступності системи.
- N-к-N — це поєднання active / active і N + M кластерів. У N-к-N кластері сервіси, екземпляри систем або об'єднання вузлів, що відмовили, перерозподіляються між іншими активними вузлами. Тим самим усувається (як в схемі active / active) необхідність окремого резервного вузла, але при цьому всі вузли кластера повинні володіти деякою надлишковою потужністю понад мінімально необхідною. Терміни логічний хост або кластерний логічний хост використовуються для позначення мережевої адреси, яка використовується для доступу до сервісів, що надаються кластером. Ідентифікатор логічного хоста не прив'язаний до одного вузла кластера. Це насправді мережева адреса котра пов'язана з сервісом, що надана кластером. Якщо вузол кластера, наприклад, працює з базою даних виходить з ладу, базу даних буде перезапущено на іншому вузлі кластера, а мережева адреса, за якою користувачі отримують доступ до бази даних, збережеться для будь-якого нового вузла, причому користувачі матимуть доступ до бази даних.
Надійність окремого вузла
HA-кластери, крім описаних схем міжвузлового резервування, використовують всі методи, які використовуються в окремих (некластерних) системах і в мережевій інфраструктурі для максимального підвищення надійності. До них належать:
- Резервування і реплікацію дисків: відмова частини внутрішніх дисків не призводить до збоїв системи. DRBD є одним із прикладів.
- Резервування зовнішніх мережевих з'єднань: пошкодження кабелю, відмова комутатора або мережевого інтерфейсу не призводять до повного відключення від мережі.
- Резервування внутрішніх з'єднань мережі зберігання даних (SAN): пошкодження кабелю, збій комутатора або мережевого інтерфейсу не приведуть до втрати з'єднання серверів зі сховищем.
- Надлишкові схеми електроживлення різного устаткування, як правило, захищені джерелами безперебійного живлення, і резервуються блоки живлення: відмова одиничного введення, ДБЖ або БЖ не призводить до критичної відмови живлення системи.
Заходи щодо забезпечення безперебійної роботи окремого вузла, допомагають звести до мінімуму ймовірність звернення до механізмів або, власне, відмовостійкої кластеризації. У разі виконання останніх, доступ до сервісу може перериватися, хоча б і ненадовго, проте, доцільніше попереджати критичні відмови обладнання.
Алгоритми відновлення при відмовах
Системи, які обробляють помилки в розподілених комп'ютерних системах, використовують різні стратегії усунення наслідків при збоях. Наприклад, Apache Cassandra API Hector (API) передбачає три варіанти обробки помилок:
- Fail Fast, скрипт — «FAIL FAST», повідомляє клієнта про помилку, що виникла в недоступному вузлі.
- On Fail, Try One — Next Available, скрипт — «ON_FAIL_TRY_ONE_NEXT_AVAILABLE», означає, що система при збої вузла пробує перевести запит на інший вільний вузол і після першої невдалої спроби повідомляє про помилку.
- On Fail, Try All, скрипт — «ON_FAIL_TRY_ALL_AVAILABLE», означає, що система після першої невдалої спроби намагається всі наявні всі вузли і тільки потім повідомляє про помилку.
Для контролю працездатності вузлів в кластері зазвичай використовується передача безперервного періодичного сигналу («пульсу», англ. Heartbeat) у внутрішній мережі кластера від кожного з вузлів, за наявністю якого, керуюче ПЗ робить висновок про нормальну роботу сусідніх вузлів. З цим пов'язана неочевидна, але серйозна проблема «розділеного мозку» (англ. Split-brain_ (computing)) — в разі одночасного розриву безлічі з'єднань у внутрішній мережі кластера через збій живлення, несправності мережного обладнання і т. д., вузол, що не здатний коректно обробити інформацію, починає поводитися так, як ніби всі інші вузли кластера вийшли з ладу, запускаючи дублюючі вузли, у вже працюючому кластері, що може привести до пошкодження даних в загальному сховищі.
Див. також
Примітки
- Погорілий С. Технологія віртуалізації. Динамічна реконфігурація ресурсів кластера / С. Погорілий, І. Білоконь, Ю. Бойко // Математичні машини і системи. — 2012. — № 3. — С. 3 — 18. 5.
- Bilokon I. Research of Genetic Algorithm for searching optimal configurations of computing cluster with virtual machine nodes / I. Bilokon, S. Pogorilyy[4] // Theoretical and Applied Aspects of cybernetics. Proc. of the 2nd International Scientific Conference of students and Young Scientists[5]. — Kyiv: Bukrek, 2012. — Р. 13 — 18. 8.
- Погорілий С. Д. До задачі оптимізації завантаженості ресурсів кластера з вузлами у вигляді віртуальних машин / С. Д. Погорілий, І. В. Білоконь // Матеріали 8 міжнар. наук.- практ. конф. з програмування «УкрПРОГ–2012». Проблеми програмування, (Київ, 22–24 травня 2012 р.). — Київ, 2012. — № 2–3. — С. 93 — 101.
Література
- Погорілий С. Технологія віртуалізації. Динамічна реконфігурація ресурсів кластера / С. Погорілий, І. Білоконь, Ю. Бойко // Математичні машини і системи. — 2012. — № 3. — С. 3 — 18. 5.
- Погорілий С. Д. До задачі оптимізації завантаженості ресурсів кластера з вузлами у вигляді віртуальних машин / С. Д. Погорілий, І. В. Білоконь // Матеріали 8 міжнар. наук.- практ. конф. з програмування «УкрПРОГ–2012». Проблеми програмування, (Київ, 22–24 травня 2012 р.). — Київ, 2012. — № 2–3. — С. 93 — 101.
- Bilokon I. Research of Genetic Algorithm for searching optimal configurations of computing cluster with virtual machine nodes / I. Bilokon, S. Pogorilyy // Theoretical and Applied Aspects of cybernetics. Proc. of the 2nd International Scientific Conference of students and Young Scientists. — Kyiv: Bukrek, 2012. — Р. 13 — 18. 8.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Vidmovostijkij klaster klaster visokoyi dostupnosti angl High Availability cluster HA cluster klaster sho sproektovanij vidpovidno do metodik zabezpechennya visokoyi dostupnosti i garantuye minimalnij chas prostoyu za rahunok aparatnoyi nadmirnosti Bez klasterizaciyi zbij servera prizvodit do togo sho pidtrimuvani nim dodatki abo merezhevi servisi viyavlyayutsya nedostupnimi Vidmovostijka klasterizaciya vipravlyaye danu situaciyu perezapuskayuchi dodatki na inshih vuzlah klastera bez vtruchannya administratora v razi viyavlennya aparatnih abo programnih zboyiv Proces perezapusku vidomij yak avarijne peremikannya V ramkah cogo procesu programne zabezpechennya klasterizaciyi mozhe dodatkovo nalashtuvati vuzol pered zapuskom programi na nomu napriklad importuvati i montuvati vidpovidni fajlovi sistemi perenalashtovuyuchi merezheve obladnannya abo zapuskayuchi bud yaki sluzhbovi dodatki Vidmovostijki klasteri shiroko vikoristovuyutsya dlya pidtrimki vazhlivih baz danih zberigannya fajliv v merezhi biznes dodatkiv i sistem masovogo obslugovuvannya kliyentiv Realizaciyi HA klasteriv ye sprobami dosyagnennya vidmovostijkosti klastera v cilomu shlyahom viklyuchennya kritichnih tochok vidmovi v tomu chisli za rahunok rezervuvannya obchislyuvalnih potuzhnostej ta zdijsnennya pidklyuchennya do merezhi i shovish danih ob yednanih v nadlishkovu merezhu zberigannya danih Vimogi do arhitekturi dodatkaChi ne kozhen dodatok mozhe pracyuvati v visokodostupnomu klasternomu seredovishi Vidpovidni rishennya povinni buti zakladeni na rannij stadiyi rozrobki programnogo zabezpechennya Dlya roboti v HA klasteri dodatok povinen vidpovidati yak minimum nastupnim tehnichnim vimogam ostanni dva z yakih mayut virishalne znachennya dlya jogo nadijnoyi roboti v klasteri i yaki povinni povnoyu miroyu zadovolniti nastupne Povinen buti vidnosno prostij sposib zapusku zupinki primusovoyi zupinki i perevirki stanu dodatka Na praktici ce oznachaye sho dodatok maye mati interfejs komandnoyi strichki abo skriptu dlya upravlinnya nim v tomu chisli dlya roboti z dekilkoma zapushenimi ekzemplyarami dodatka Dodatok povinen vmiti vikoristovuvati zagalne shovishe danih NAS SAN Vazhlivo sho dodatok maye zberigati v zagalnomu shovishi maksimalno mozhlivu kilkist danih pro svij potochnij stan Dodatok ne povinen poshkodzhuvati dani pri vihodi z ladu abo vidnovlenni z zberezhenogo stanu Shemi pobudoviNajchastishe zustrichayutsya dvovuzlovi HA klasteri ce minimalna konfiguraciya neobhidna dlya zabezpechennya vidmovostijkosti Ale chasto klasteri mistyat veliku kilkist vuzliv Vsi ci konfiguraciyi yak pravilo mozhut buti opisani odniyeyu z nastupnih modelej Active active Chastina trafiku sho obroblyaye vidmovu vuzla perenapravlyayetsya do pracyuyuchogo vuzla abo rozpodilyayetsya mizh kilkoma pracyuyuchimi vuzlami Taka shema vikoristovuyetsya v tomu vipadku koli vuzli mayut odnoridnu konfiguraciyu programnogo zabezpechennya i vikonuyut odnakovu zadachu Active passive Maye povne rezervuvannya dijsnu kopiyu kozhnogo vuzla Rezerv vikoristovuyetsya tilki todi koli vidmovlyaye vidpovidnij osnovnij vuzol Cya konfiguraciya vimagaye znachnih nadlishkovih aparatnih zasobiv N 1 Maye odin povnocinnij rezervnij vuzol do yakogo v moment vidmovi perehodit rol vuzla sho ne dostupnij v danij moment chasu U razi geterogennoyi programnoyi konfiguraciyi osnovnih vuzliv dodatkovij vuzol povinen buti zdatnij vzyati na sebe rol kozhnogo z osnovnih vuzliv za rezervuvannya kotrih vin vidpovidaye Taka shema zastosovuyetsya v klasterah yaki obslugovuyut kilka riznoridnih servisiv sho pracyuyut odnochasno N M Yaksho odin klaster obslugovuye kilka servisiv vklyuchennya v klaster yedinogo rezervnogo vuzla mozhe viyavitisya nedostatnim dlya nalezhnogo rivnya rezervuvannya U takih vipadkah v klaster vklyuchayetsya kilka rezervnih serveriv kilkist yakih ye kompromisom mizh cinoyu rishennya i neobhidnoyi nadijnistyu N k 1 Dozvolyaye rezervnomu vuzlu vmikatisya v robotu timchasovo poki vuzol sho vidmoviv ne bude vidnovlenij pislya cogo vihidne navantazhennya povertayetsya na osnovnij vuzol dlya zberezhennya vihidnogo rivnya dostupnosti sistemi N k N ce poyednannya active active i N M klasteriv U N k N klasteri servisi ekzemplyari sistem abo ob yednannya vuzliv sho vidmovili pererozpodilyayutsya mizh inshimi aktivnimi vuzlami Tim samim usuvayetsya yak v shemi active active neobhidnist okremogo rezervnogo vuzla ale pri comu vsi vuzli klastera povinni voloditi deyakoyu nadlishkovoyu potuzhnistyu ponad minimalno neobhidnoyu Termini logichnij host abo klasternij logichnij host vikoristovuyutsya dlya poznachennya merezhevoyi adresi yaka vikoristovuyetsya dlya dostupu do servisiv sho nadayutsya klasterom Identifikator logichnogo hosta ne priv yazanij do odnogo vuzla klastera Ce naspravdi merezheva adresa kotra pov yazana z servisom sho nadana klasterom Yaksho vuzol klastera napriklad pracyuye z bazoyu danih vihodit z ladu bazu danih bude perezapusheno na inshomu vuzli klastera a merezheva adresa za yakoyu koristuvachi otrimuyut dostup do bazi danih zberezhetsya dlya bud yakogo novogo vuzla prichomu koristuvachi matimut dostup do bazi danih Nadijnist okremogo vuzlaHA klasteri krim opisanih shem mizhvuzlovogo rezervuvannya vikoristovuyut vsi metodi yaki vikoristovuyutsya v okremih neklasternih sistemah i v merezhevij infrastrukturi dlya maksimalnogo pidvishennya nadijnosti Do nih nalezhat Rezervuvannya i replikaciyu diskiv vidmova chastini vnutrishnih diskiv ne prizvodit do zboyiv sistemi DRBD ye odnim iz prikladiv Rezervuvannya zovnishnih merezhevih z yednan poshkodzhennya kabelyu vidmova komutatora abo merezhevogo interfejsu ne prizvodyat do povnogo vidklyuchennya vid merezhi Rezervuvannya vnutrishnih z yednan merezhi zberigannya danih SAN poshkodzhennya kabelyu zbij komutatora abo merezhevogo interfejsu ne privedut do vtrati z yednannya serveriv zi shovishem Nadlishkovi shemi elektrozhivlennya riznogo ustatkuvannya yak pravilo zahisheni dzherelami bezperebijnogo zhivlennya i rezervuyutsya bloki zhivlennya vidmova odinichnogo vvedennya DBZh abo BZh ne prizvodit do kritichnoyi vidmovi zhivlennya sistemi Zahodi shodo zabezpechennya bezperebijnoyi roboti okremogo vuzla dopomagayut zvesti do minimumu jmovirnist zvernennya do mehanizmiv abo vlasne vidmovostijkoyi klasterizaciyi U razi vikonannya ostannih dostup do servisu mozhe pererivatisya hocha b i nenadovgo prote docilnishe poperedzhati kritichni vidmovi obladnannya Algoritmi vidnovlennya pri vidmovahSistemi yaki obroblyayut pomilki v rozpodilenih komp yuternih sistemah vikoristovuyut rizni strategiyi usunennya naslidkiv pri zboyah Napriklad Apache Cassandra API Hector API peredbachaye tri varianti obrobki pomilok Fail Fast skript FAIL FAST povidomlyaye kliyenta pro pomilku sho vinikla v nedostupnomu vuzli On Fail Try One Next Available skript ON FAIL TRY ONE NEXT AVAILABLE oznachaye sho sistema pri zboyi vuzla probuye perevesti zapit na inshij vilnij vuzol i pislya pershoyi nevdaloyi sprobi povidomlyaye pro pomilku On Fail Try All skript ON FAIL TRY ALL AVAILABLE oznachaye sho sistema pislya pershoyi nevdaloyi sprobi namagayetsya vsi nayavni vsi vuzli i tilki potim povidomlyaye pro pomilku Dlya kontrolyu pracezdatnosti vuzliv v klasteri zazvichaj vikoristovuyetsya peredacha bezperervnogo periodichnogo signalu pulsu angl Heartbeat u vnutrishnij merezhi klastera vid kozhnogo z vuzliv za nayavnistyu yakogo keruyuche PZ robit visnovok pro normalnu robotu susidnih vuzliv Z cim pov yazana neochevidna ale serjozna problema rozdilenogo mozku angl Split brain computing v razi odnochasnogo rozrivu bezlichi z yednan u vnutrishnij merezhi klastera cherez zbij zhivlennya nespravnosti merezhnogo obladnannya i t d vuzol sho ne zdatnij korektno obrobiti informaciyu pochinaye povoditisya tak yak nibi vsi inshi vuzli klastera vijshli z ladu zapuskayuchi dublyuyuchi vuzli u vzhe pracyuyuchomu klasteri sho mozhe privesti do poshkodzhennya danih v zagalnomu shovishi Div takozhParalelni obchislennya Grid sistema KlasterizaciyaPrimitkiPogorilij S Tehnologiya virtualizaciyi Dinamichna rekonfiguraciya resursiv klastera S Pogorilij I Bilokon Yu Bojko Matematichni mashini i sistemi 2012 3 S 3 18 5 Bilokon I Research of Genetic Algorithm for searching optimal configurations of computing cluster with virtual machine nodes I Bilokon S Pogorilyy 4 Theoretical and Applied Aspects of cybernetics Proc of the 2nd International Scientific Conference of students and Young Scientists 5 Kyiv Bukrek 2012 R 13 18 8 Pogorilij S D Do zadachi optimizaciyi zavantazhenosti resursiv klastera z vuzlami u viglyadi virtualnih mashin S D Pogorilij I V Bilokon Materiali 8 mizhnar nauk prakt konf z programuvannya UkrPROG 2012 Problemi programuvannya Kiyiv 22 24 travnya 2012 r Kiyiv 2012 2 3 S 93 101 LiteraturaPogorilij S Tehnologiya virtualizaciyi Dinamichna rekonfiguraciya resursiv klastera S Pogorilij I Bilokon Yu Bojko Matematichni mashini i sistemi 2012 3 S 3 18 5 Pogorilij S D Do zadachi optimizaciyi zavantazhenosti resursiv klastera z vuzlami u viglyadi virtualnih mashin S D Pogorilij I V Bilokon Materiali 8 mizhnar nauk prakt konf z programuvannya UkrPROG 2012 Problemi programuvannya Kiyiv 22 24 travnya 2012 r Kiyiv 2012 2 3 S 93 101 Bilokon I Research of Genetic Algorithm for searching optimal configurations of computing cluster with virtual machine nodes I Bilokon S Pogorilyy Theoretical and Applied Aspects of cybernetics Proc of the 2nd International Scientific Conference of students and Young Scientists Kyiv Bukrek 2012 R 13 18 8