Blue Gene — проєкт комп'ютерної архітектури, розроблений для створення декількох суперкомп'ютерів і спрямований на досягнення швидкості обробки даних, що перевищує 1 петафлопс. Вже успішно досягнута швидкість майже в 20 петафлопс. Є спільним проєктом фірми IBM (Підрозділ Rochester MN і [en]), Ліверморської національної лабораторії, Міністерства енергетики США (яке частково фінансує проєкт) та академічних кіл. Передбачено чотири етапи проєкту: Blue Gene/C, Blue Gene/L, Blue Gene/P і Blue Gene/Q.
Проєкт був нагороджений Національною Медаллю США в області технологій та інновацій 18 вересня 2009. Президент Барак Обама вручив нагороду 7 жовтня 2009.
Історія
У грудні 1999 року IBM оголосила про дослідницьку ініціативу вартістю у 100 млн доларів для створення впродовж 5-ти років високо паралельних комп'ютерів, які повинні застосовуватися для вивчення бімолекулярних явищ, таких як згортання білків. Проєкт мав дві основні мети: щоб розширити наше розуміння механізмів які відповідають за згортання білків з допомогою великомасштабного моделювання, а також відкрити нові методи побудови високопаралельних суперкомп'ютерних архітектур та відповідного програмного забезпечення.
Початковий дизайн Blue Gene був побудований на ранній версії архітектури [en], яку розробив [en]. На початковому етапі дослідження і розробка, здійснювалися у Дослідницькому центрі імені Томаса Ватсона. У IBM Алан Кара почав працювати над розширенням [en] архітектури для розширення спектру виконуваних задач на суперкомп'ютері.
У листопаді 2004 року система яка мала 16 стійок, у кожній з яких 1024 обчислювальних вузлів, зайняла перше місце в рейтингу ТОП500, з продуктивністю у тесті Linpack в 70,72 TFLOPS. Тим самим вона обігнала NEC, Earth Simulator, який носив титул найшвидшого комп'ютера в світі з 2002 року. З 2004 по 2007 Blue Gene / L установлений в Ліверморській національній лабораторії поступово розширився до 104 стійок, і досягнув 478 TFLOPS в Linpack і 596 TFLOPS пікової продуктивності, та займав першу позицію в списку TOP500 протягом 3,5 років, поки в червні 2008 року його не змістив суперкомп'ютер IBM Roadrunner який був першою системою, продуктивність якої перейшла за 1 петафлопс.
Blue Gene/L
Blue Gene / L — це перший комп'ютер серії IBM Blue Gene, розроблений спільно з Ліверморської національної лабораторією. Його теоретична пікова продуктивність становить 360 терафлопс, а реальна продуктивність, отримана на тесті Linpack, близько 280 терафлопс. Після апгрейда в 2007 році реальна продуктивність збільшилася до 478 терафлопс при піковому продуктивності в 596 терафлопс. У листопаді 2006 року 27 комп'ютерів зі списку TOP500 мали архітектуру Blue Gene/L.
Основні характеристики
The Blue Gene/L був унікальним у таких аспектах :
- Зміна швидкості процесорів для зниження енергоспоживання. Blue Gene/L використовує процесорні ядра PowerPC, які мають низьку частоту і низьке споживання енергії, разом з блоком для операцій з плаваючою точкою. У той час як продуктивність кожного чипа була відносно низькою, система може досягти кращого відношення продуктивності до споживаної електроенергії, для програм які можуть використовувати більше число обчислювальних вузлів.
- Два процесора на вузол з двома режимами роботи: в штатному режимі один процесор обчислювальний, другий займається комунікаціями; за відсутності пересилань обидва процесора можуть працювати як обчислювальні.
- Дизайн SOC. Всі компоненти вузла знаходяться на чипі, крім 512 MB зовнішньої DRAM.
- Велика кількість обчислювальних вузлів(масштабується від 1024 до 65,536)
- Комунікаційна мережа: 3-вимірний [en] (в максимальній конфігурації вузла 64x32x32), пропускна здатність 175 Мб / сек. по кожному напрямку, латентність 1,5 мкс.
- Операційна система: обчислювальні вузли — спеціальне легке ядро, вузли вводу-виводу — вбудована Linux, керуючі вузли — SuSE SLES 9 Linux
Blue Gene/P
26 червня 2007 IBM представила Blue Gene/P, друге покоління суперкомп'ютерів Blue Gene. Розроблений для роботи з піковою продуктивністю в 1 петафлопс. Blue Gene/P може бути налаштований для досягнення пікової продуктивності більш, ніж 3 петафлопса. Крім того, він у сім разів більш енергетично ефективний ніж будь-які інші суперкомп'ютери. Blue Gene/P виконаний з використанням великої кількості невеликих, малопотужних чипів, що зв'язуються через п'ять спеціалізованих мереж.
Архітектура
Кожен чип Blue Gene/P складається з чотирьох процесорних ядер PowerPC 450 з тактовою частотою 850 МГц. Чип, 2 або 4 ГБ оперативної пам'яті і мережеві інтерфейси утворюють обчислювальний вузол суперкомп'ютера. 32 обчислювальних вузла об'єднуються в карту (Compute Node card), до якої можна під'єднати від 0 до 2 вузлів вводу-виводу. Системна стійка вміщує в себе 32 таких карти.
Конфігурація Blue Gene/P з піковою продуктивністю 1 петафлопс являє собою 72 системні стійки, містять 294,912 процесорних ядер, об'єднаних в високошвидкісну оптичну мережу. Конфігурація Blue Gene/P може бути розширена до 216 стійок із загальним числом процесорних ядер 884,736, щоб досягти пікову продуктивність в 3 петафлопса. У стандартній конфігурації системна стійка Blue Gene/P містить 4,096 процесорних ядер.
Опис обчислювального комплексу
- 1024 чотириядерних обчислювальних вузла в кожній з стійок
- 16 вузлів вводу-виводу в стійці (у поточній конфігурації активні 8, тобто одна I/O-карта на 128 обчислювальних вузлів)
- виділені комунікаційні мережі для міжпроцесорних обмінів та глобальних операцій
- програмування з використанням MPI, OpenMP / pthreads, POSIX I/O
- висока енергоефективність: ~ 372 MFlops / W (див. список Green500)
- система повітряного охолодження
Стійка (rack, cabinet) складається з двох midplane'ів. У midplane входить 16 node-карт (compute node card), на кожній з яких встановлено 32 обчислювальних вузла (compute card). Midplane, 8 x 8 x 8 = 512 обчислювальних вузлів, — мінімальний розділ, на якому стає доступна топологія тривимірного тора; для розділів менших розмірів використовується топологія тривимірної решітки. Node-карта може містити до двох вузлів вводу-виводу (I/O card). Обчислювальний вузол має у своєму складі чотирьохядерний процесор, 2 ГБ спільної пам'яті і мережеві інтерфейси.
Мікропроцесорне ядро
- модель: PowerPC 450
- робоча частота: 850 MHz
- адресація: 32-бітна
- кеш інструкцій 1-го рівня (L1 instruction): 32 KB
- кеш даних 1-го рівня (L1 data): 32 KB
- кеш 2-го рівня (L2): 14 потоків попередньої вибірки (stream prefetching): 14 x 256 байтів
- два блоки 64-бітної арифметики з плаваючою точкою (Floating Point Unit, FPU), кожен з яких може видавати за один такт результат суміщеної операції множення-складання (Fused Multiply-Add, FMA)
- пікова продуктивність: 2 FPU x 2 FMA x 850 MHz = 3,4 GFlop / sec per core
Обчислювальні вузли
Обчислювальні вузли та I/O-карти в апаратній сенсі невиразні і є взаємозамінними, різниця між ними полягає лише в способі їх використання. У них немає локальної файлової системи, тому всі операції введення-виведення перенаправляються зовнішніх пристроїв.
Обчислювальний вузол:
- чотири мікропроцесорних ядра PowerPC 450 (4-way SMP)
- пікова продуктивність: 4 cores x 3,4 GFlop / sec per core = 13,6 GFlop / sec
- пропускна здатність пам'яті: 13,6 GB / sec
- 2 ГБ загальної пам'яті
- 2 x 4 МБ кеш-пам'яті третього рівня (L3)
- легковаге ядро (compute node kernel, CNK), що являє собою Linux-подібну операційну систему, що підтримує значне підмножина Linux-сумісних системних викликів
- асинхронні операції міжпроцесорних обмінів (виконуються паралельно з обчисленнями)
- операції введення-виведення перенаправляються I/O-картками через мережу колективних операцій
Вузол вводу-виводу
- не враховується при розрахунку пікової продуктивності
- використовує мережу колективних операцій для комунікацій з обчислювальними вузлами
- підключений до зовнішніх пристроїв через Ethernet-порт за допомогою 10-гігабітний функціональної мережі
- операційна система на основі Linux (Mini-Control Program, MCP) з мінімальним набором пакетів, необхідних для підтримки клієнта мережевої файлової системи і Ethernet-підключень
Комунікаційні мережі
- Тривимірний тор (three-dimensional torus)
- мережу загального призначення, що об'єднують всі обчислювальні вузли; призначена для операцій типу «точка-точка»
- обчислювальний вузол має двонаправлені зв'язку з шістьма сусідами
- пропускна здатність кожного з'єднання — 425 MB / s (5,1 GB / s для всіх 12 каналів)
- латентність (найближчий сусід):
- 32-байтний пакет: 0,1 μs
- 256-байтний пакет: 0,8 μs
- Глобальні колективні операції (global collective)
- комунікації типу «один-до-багатьох» (broadcast-операції і редукція)
- використовується обчислювальними вузлами для обмінів з I / O-картами
- кожен обчислювальний вузол і I / O-карта мають три двонаправлені зв'язку
- пропускна здатність кожного з'єднання — 850 MB / s (1,7 GB / s для двох каналів)
- латентність (повний обхід): 3,0 μs
- Глобальні переривання (global interrupt)
- операції бар'єрів і переривань (глобальні AND-та OR-операції)
- Функціональна мережа
- з'єднує вузли вводу-виводу з зовнішнім оточенням
- 10-гігабітна оптична Ethernet-мережа
- Сервісна мережа (service / control)
-
- завантаження, моніторинг, діагностика, налагодження, доступ до лічильників продуктивності
- гігабітна Ethernet-мережу (4 з'єднання на стійку).
Щоб розвантажити процесорний ядро від операцій, пов'язаних з передачею повідомлень по мережі тривимірного тора, використовується пристрій прямого доступу до пам'яті (direct memory access, DMA). Крім зменшення навантаження на ядро, цей механізм зменшує ймовірність взаємного блокування процесів, які обмінюються повідомленнями, яка може виникнути внаслідок помилок програміста.
Оточення Blue Gene/P включає
- фронтенд (front end node) — система, відкрита для доступу по протоколу SSH; служить для доступу користувачів на обчислювальний комплекс; вся зв'язок з комплексом здійснюється тільки через цю машину; призначена для розробки користувачами програм, компілювання проєктів і постановки завдань у чергу; робота з ній здійснюється в інтерактивному режимі
- сервісний вузол (service node) — забезпечує контроль над системою Blue Gene / P; до цієї машини доступу по SSH немає
- систему управління розподіленої файлової системою IBM General Parallel File System (GPFS)
Blue Gene/P у світі
12 листопада 2007 в Німеччині почала працювати перша система під назвою JUGENE з 65536 процесорами, в Jülich Research Centre, з обчислювальною потужністю в 167 терафлопс. Він став найбільш швидким суперкомп'ютером в Європі і шостим у всьому світі. Перша лабораторія в Сполучених Штатах використовує Blue Gene/P — Argonne National Laboratory. Перші стійки Blue Gene/P використовувалися до 2007 року. Перша установка була системою в 111-teraflop, яка мала приблизно 32,000 процесорів, і призначалася для науково-дослідного товариства США навесні 2008. Повній системі була присвоєна третя сходинка в листі Червневого Топ 500 2008 року. З 2008 року на факультеті ВМК МГУ імені М. В. Ломоносова працює суперкомп'ютер IBM Blue Gene/P.
Blue Gene/Q
Blue Gene/Q — третє покоління архітектури. Метою розробників стало досягнення 20-петафлопсного рубежу в 2011 році. Blue Gene/Q є еволюційним продовженням архітектур Blue Gene/L і /P, працюючим на більш високій частоті і споживає менше енергії на один флопс продуктивності.
Архітектура
BlueGene/Q — це мультиядерна, 64-бітна система на чипі, побудована за технологією PowerPC (якщо бути абсолютно конкретним, то це чотиритактних архітектура PowerPC A2). Кожен з чипів містить 18 ядер, разом набирають півтора мільярда (1,47) транзисторів. 16 ядер використовуються для, власне, обчислень, на одному працює операційна система, і, нарешті останнє ядро відповідає за надійність обчислень всієї системи. На частоті в 1,6 Ггц, кожен чип здатний видати 204,8 Гфлопс, споживаючи потужність в 55 Ватт. Природно, частиною чипа є і контролери пам'яті і операцій введення-виведення. Blue Gene/Q містить 4 блоки обчислень над числами з плаваючою комою, що дає 4 виконаних операції за один такт на кожному ядрі.
18 ядер, за твердженням співробітників IBM, потрібні для надійності. Якщо на одному з ядер процесора був зафіксований збій, воно може бути відключено і переведено на «лаву запасних». Власне, виявлення і зміна конфігурації «помилкового» ядра може бути проведено на будь-якому етапі виробництва або складання системи — не тільки коли чип вже тестується, а й на ранніх етапах, наприклад, інсталяції чипа в обчислювальний кластер. У випадку з Sequoia буде використовуватися близько 100 000 чипів, для того щоб досягти заповітних 20 петафлопс. Величезна кількість процесорів робить завдання перепризначення ядер дуже важливою: у компанії IBM підрахували, що при даному (100 тисяч) кількості чипів в суперкомп'ютері кожні 3 тижні в середньому буде виходити з ладу 1 процесорний блок. Також відомо, що в Blue Gene/Q реалізована підтримка транзакційної пам'яті не на програмному, а апаратному рівні.
Технічні характеристики
- Масштабування до 512 стійок, максимальна продуктивність до 100 петафлопс
- Вбудований інтерконект 5D Torus забезпечуєвеличезну пропускну здатність
- 4 об'єднаних модуля обчислень з плаваючою точкою FPU для інструкцій подвійний і четверний ширини SIMD — архітектури з подвійною точністю забезпечує більш високу продуктивність навіть при обробці однопотокових додатків
- Упереджувальний вибірка для повторюваних звернень до пам'яті в довільно довгих сегментах коду забезпечує більш високу продуктивність при обробці однопотокових додатків
- Багаторежимна кеш-пам'ять спільно з транзакційної пам'яттю виключають необхідність програмної обробки блокувань, спекулятивне виконання команд дозволяє OpenMP розпаралелити код з урахуванням залежності даних
- Конвеєрна обробка атомарних операцій у кеш -пам'яті другого рівня з низькими затримками навіть при високому рівні конкуренції забезпечують швидку обробку завдань OpenMP
- Модуль виведення з режиму сну дозволяє переводити потоки SMT у сплячий режим в очікуванні події, що дозволяє виключити витрати, пов'язані із збереженням регістрів
- Сімнадцяте ядро обробляє переривання подій функцій надійності, доступності та зручності обслуговування (RAS) і зменшує рівень шуму і спотворень для операційної системи.
Порівняльна характеристика архітектур Blue Gene/P та Blue Gene/Q
Характеристика | Blue Gene/P | Blue Gene/Q |
---|---|---|
Обчислювальний вузол | ||
Процесор | 32-bit PowerPC 450 | 64-bit PowerPC A2 |
Ядер на вузол | 4 | 16 + 1 + 1 |
Частота | 850 MHz | 1.6 GHz |
Пікова продуктивність на вузол | 13.6 Gflops | 204.8 Gflops |
Когерентність кешу | SMP hardware | SMP hardware + speculation |
L1 кеш | 32 KB data; 32 KB instruction | 16 KB data; 16 KB instruction |
L2 кеш | 2 KB; 14 stream prefetching, private | 32 MB; 16 stream prefetching, shared |
L3 кеш (розподілений) | 8 MB | n/a |
Пам'ять на вузол | 2 GB — 4 GB | 16 GB |
Пропускна здатність пам'яті | 13.6 GB/s | 43 GB/s |
Floating-point блок (на ядро) | 2 | 4 |
Мережа Тор | ||
Топологія | 3D | 5D |
Пропускна здатність (на вузол) | 5.1 GB/s (6links*2way*425MB/s) | 40 GB/s (10links*2way*2GB/s) |
Апаратна затримка (найближчий сусід) | <1 us | <1 us |
Апаратна затримка (найгірший випадок) | 5 us | 3 us |
Колективна мережа | ||
Пропускна здатність | 5.1 GB/s | 40 GB/s |
Апаратна затримка(круговий обхід, найгірший випадок — 72 стійки) | 3 us | n/a |
Властивості системи (на стійку) | ||
Пікова продуктивність | 13.9 Tflops | 209.7 Tflops |
Охолодження | Повітряне 100 % | Водяне 90 %, Повітряне 10 % |
Енергоспоживання(пікове) | ~32 kW | ~100 kW |
Енергоефективність (GFlops на Ватт) | 0.37 | 2.1 |
Першою системою, побудованої з архітектури Blue Gene/Q, стала система Sequoia, яку встановили у Ліверморської національної лабораторії в 2011 році. Ця система розраховувала наукові програми лабораторії. Вона складається з 98304 обчислювальних вузлів, що містять 1,6 млн процесорних ядер і 1,6 Пб пам'яті. Розташовується система в 96 стійках, споживана потужність за проєктом становить 6 МВт.
Інша система архітектури Blue Gene/Q під назвою Mira буде встановлена в Аргонській національній лабораторії в 2012 році. Вона міститиме близько 50 тис. обчислювальних вузлів (16 ядер на вузол), 70 Пб дискового простору і мати рідинну систему охолодження.
Див. також
Посилання
- IBM Research: Blue Gene [ 22 серпня 2006 у Wayback Machine.] — сторінка проєкту на сайті IBM.
- Фотогалерея[недоступне посилання з червня 2019]
- https://computing.llnl.gov/tutorials/bgp/ [ 10 травня 2013 у Wayback Machine.]
- http://hpc.cmc.msu.ru/bgp [ 27 червня 2013 у Wayback Machine.]
- http://www.3dnews.ru/577851 [ 9 жовтня 2015 у Wayback Machine.]
- http://public.dhe.ibm.com/common/ssi/ecm/ru/dcd12345ruru/DCD12345RURU.PDF[недоступне посилання з червня 2019]
Це незавершена стаття про інформаційні технології. Ви можете проєкту, виправивши або дописавши її. |
Це незавершена стаття зі штучного інтелекту. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Blue Gene proyekt komp yuternoyi arhitekturi rozroblenij dlya stvorennya dekilkoh superkomp yuteriv i spryamovanij na dosyagnennya shvidkosti obrobki danih sho perevishuye 1 petaflops Vzhe uspishno dosyagnuta shvidkist majzhe v 20 petaflops Ye spilnim proyektom firmi IBM Pidrozdil Rochester MN i en Livermorskoyi nacionalnoyi laboratoriyi Ministerstva energetiki SShA yake chastkovo finansuye proyekt ta akademichnih kil Peredbacheno chotiri etapi proyektu Blue Gene C Blue Gene L Blue Gene P i Blue Gene Q Superkompyuter Blue Gene P v Argonskij nacionalnij laboratoriyi Proyekt buv nagorodzhenij Nacionalnoyu Medallyu SShA v oblasti tehnologij ta innovacij 18 veresnya 2009 Prezident Barak Obama vruchiv nagorodu 7 zhovtnya 2009 IstoriyaU grudni 1999 roku IBM ogolosila pro doslidnicku iniciativu vartistyu u 100 mln dolariv dlya stvorennya vprodovzh 5 ti rokiv visoko paralelnih komp yuteriv yaki povinni zastosovuvatisya dlya vivchennya bimolekulyarnih yavish takih yak zgortannya bilkiv Proyekt mav dvi osnovni meti shob rozshiriti nashe rozuminnya mehanizmiv yaki vidpovidayut za zgortannya bilkiv z dopomogoyu velikomasshtabnogo modelyuvannya a takozh vidkriti novi metodi pobudovi visokoparalelnih superkomp yuternih arhitektur ta vidpovidnogo programnogo zabezpechennya Pochatkovij dizajn Blue Gene buv pobudovanij na rannij versiyi arhitekturi en yaku rozrobiv en Na pochatkovomu etapi doslidzhennya i rozrobka zdijsnyuvalisya u Doslidnickomu centri imeni Tomasa Vatsona U IBM Alan Kara pochav pracyuvati nad rozshirennyam en arhitekturi dlya rozshirennya spektru vikonuvanih zadach na superkomp yuteri U listopadi 2004 roku sistema yaka mala 16 stijok u kozhnij z yakih 1024 obchislyuvalnih vuzliv zajnyala pershe misce v rejtingu TOP500 z produktivnistyu u testi Linpack v 70 72 TFLOPS Tim samim vona obignala NEC Earth Simulator yakij nosiv titul najshvidshogo komp yutera v sviti z 2002 roku Z 2004 po 2007 Blue Gene L ustanovlenij v Livermorskij nacionalnij laboratoriyi postupovo rozshirivsya do 104 stijok i dosyagnuv 478 TFLOPS v Linpack i 596 TFLOPS pikovoyi produktivnosti ta zajmav pershu poziciyu v spisku TOP500 protyagom 3 5 rokiv poki v chervni 2008 roku jogo ne zmistiv superkomp yuter IBM Roadrunner yakij buv pershoyu sistemoyu produktivnist yakoyi perejshla za 1 petaflops Blue Gene LBlok shema chipa Blue Gene L sho mistit dva yadra PowerPC 440 Blue Gene L ce pershij komp yuter seriyi IBM Blue Gene rozroblenij spilno z Livermorskoyi nacionalnoyi laboratoriyeyu Jogo teoretichna pikova produktivnist stanovit 360 teraflops a realna produktivnist otrimana na testi Linpack blizko 280 teraflops Pislya apgrejda v 2007 roci realna produktivnist zbilshilasya do 478 teraflops pri pikovomu produktivnosti v 596 teraflops U listopadi 2006 roku 27 komp yuteriv zi spisku TOP500 mali arhitekturu Blue Gene L Osnovni harakteristiki The Blue Gene L buv unikalnim u takih aspektah Zmina shvidkosti procesoriv dlya znizhennya energospozhivannya Blue Gene L vikoristovuye procesorni yadra PowerPC yaki mayut nizku chastotu i nizke spozhivannya energiyi razom z blokom dlya operacij z plavayuchoyu tochkoyu U toj chas yak produktivnist kozhnogo chipa bula vidnosno nizkoyu sistema mozhe dosyagti krashogo vidnoshennya produktivnosti do spozhivanoyi elektroenergiyi dlya program yaki mozhut vikoristovuvati bilshe chislo obchislyuvalnih vuzliv Dva procesora na vuzol z dvoma rezhimami roboti v shtatnomu rezhimi odin procesor obchislyuvalnij drugij zajmayetsya komunikaciyami za vidsutnosti peresilan obidva procesora mozhut pracyuvati yak obchislyuvalni Dizajn SOC Vsi komponenti vuzla znahodyatsya na chipi krim 512 MB zovnishnoyi DRAM Velika kilkist obchislyuvalnih vuzliv masshtabuyetsya vid 1024 do 65 536 Komunikacijna merezha 3 vimirnij en v maksimalnij konfiguraciyi vuzla 64x32x32 propuskna zdatnist 175 Mb sek po kozhnomu napryamku latentnist 1 5 mks Operacijna sistema obchislyuvalni vuzli specialne legke yadro vuzli vvodu vivodu vbudovana Linux keruyuchi vuzli SuSE SLES 9 LinuxBlue Gene PIyerarhiya obchislyuvalnih elementiv Blue Gene 26 chervnya 2007 IBM predstavila Blue Gene P druge pokolinnya superkomp yuteriv Blue Gene Rozroblenij dlya roboti z pikovoyu produktivnistyu v 1 petaflops Blue Gene P mozhe buti nalashtovanij dlya dosyagnennya pikovoyi produktivnosti bilsh nizh 3 petaflopsa Krim togo vin u sim raziv bilsh energetichno efektivnij nizh bud yaki inshi superkomp yuteri Blue Gene P vikonanij z vikoristannyam velikoyi kilkosti nevelikih malopotuzhnih chipiv sho zv yazuyutsya cherez p yat specializovanih merezh Arhitektura Kozhen chip Blue Gene P skladayetsya z chotiroh procesornih yader PowerPC 450 z taktovoyu chastotoyu 850 MGc Chip 2 abo 4 GB operativnoyi pam yati i merezhevi interfejsi utvoryuyut obchislyuvalnij vuzol superkomp yutera 32 obchislyuvalnih vuzla ob yednuyutsya v kartu Compute Node card do yakoyi mozhna pid yednati vid 0 do 2 vuzliv vvodu vivodu Sistemna stijka vmishuye v sebe 32 takih karti Konfiguraciya Blue Gene P z pikovoyu produktivnistyu 1 petaflops yavlyaye soboyu 72 sistemni stijki mistyat 294 912 procesornih yader ob yednanih v visokoshvidkisnu optichnu merezhu Konfiguraciya Blue Gene P mozhe buti rozshirena do 216 stijok iz zagalnim chislom procesornih yader 884 736 shob dosyagti pikovu produktivnist v 3 petaflopsa U standartnij konfiguraciyi sistemna stijka Blue Gene P mistit 4 096 procesornih yader Opis obchislyuvalnogo kompleksu 1024 chotiriyadernih obchislyuvalnih vuzla v kozhnij z stijok 16 vuzliv vvodu vivodu v stijci u potochnij konfiguraciyi aktivni 8 tobto odna I O karta na 128 obchislyuvalnih vuzliv vidileni komunikacijni merezhi dlya mizhprocesornih obminiv ta globalnih operacij programuvannya z vikoristannyam MPI OpenMP pthreads POSIX I O visoka energoefektivnist 372 MFlops W div spisok Green500 sistema povitryanogo oholodzhennya Stijka rack cabinet skladayetsya z dvoh midplane iv U midplane vhodit 16 node kart compute node card na kozhnij z yakih vstanovleno 32 obchislyuvalnih vuzla compute card Midplane 8 x 8 x 8 512 obchislyuvalnih vuzliv minimalnij rozdil na yakomu staye dostupna topologiya trivimirnogo tora dlya rozdiliv menshih rozmiriv vikoristovuyetsya topologiya trivimirnoyi reshitki Node karta mozhe mistiti do dvoh vuzliv vvodu vivodu I O card Obchislyuvalnij vuzol maye u svoyemu skladi chotirohyadernij procesor 2 GB spilnoyi pam yati i merezhevi interfejsi Mikroprocesorne yadro model PowerPC 450 robocha chastota 850 MHz adresaciya 32 bitna kesh instrukcij 1 go rivnya L1 instruction 32 KB kesh danih 1 go rivnya L1 data 32 KB kesh 2 go rivnya L2 14 potokiv poperednoyi vibirki stream prefetching 14 x 256 bajtiv dva bloki 64 bitnoyi arifmetiki z plavayuchoyu tochkoyu Floating Point Unit FPU kozhen z yakih mozhe vidavati za odin takt rezultat sumishenoyi operaciyi mnozhennya skladannya Fused Multiply Add FMA pikova produktivnist 2 FPU x 2 FMA x 850 MHz 3 4 GFlop sec per coreObchislyuvalni vuzli Obchislyuvalni vuzli ta I O karti v aparatnij sensi nevirazni i ye vzayemozaminnimi riznicya mizh nimi polyagaye lishe v sposobi yih vikoristannya U nih nemaye lokalnoyi fajlovoyi sistemi tomu vsi operaciyi vvedennya vivedennya perenapravlyayutsya zovnishnih pristroyiv Obchislyuvalnij vuzol chotiri mikroprocesornih yadra PowerPC 450 4 way SMP pikova produktivnist 4 cores x 3 4 GFlop sec per core 13 6 GFlop sec propuskna zdatnist pam yati 13 6 GB sec 2 GB zagalnoyi pam yati 2 x 4 MB kesh pam yati tretogo rivnya L3 legkovage yadro compute node kernel CNK sho yavlyaye soboyu Linux podibnu operacijnu sistemu sho pidtrimuye znachne pidmnozhina Linux sumisnih sistemnih viklikiv asinhronni operaciyi mizhprocesornih obminiv vikonuyutsya paralelno z obchislennyami operaciyi vvedennya vivedennya perenapravlyayutsya I O kartkami cherez merezhu kolektivnih operacijVuzol vvodu vivodu ne vrahovuyetsya pri rozrahunku pikovoyi produktivnosti vikoristovuye merezhu kolektivnih operacij dlya komunikacij z obchislyuvalnimi vuzlami pidklyuchenij do zovnishnih pristroyiv cherez Ethernet port za dopomogoyu 10 gigabitnij funkcionalnoyi merezhi operacijna sistema na osnovi Linux Mini Control Program MCP z minimalnim naborom paketiv neobhidnih dlya pidtrimki kliyenta merezhevoyi fajlovoyi sistemi i Ethernet pidklyuchenKomunikacijni merezhi Trivimirnij tor three dimensional torus merezhu zagalnogo priznachennya sho ob yednuyut vsi obchislyuvalni vuzli priznachena dlya operacij tipu tochka tochka obchislyuvalnij vuzol maye dvonapravleni zv yazku z shistma susidami propuskna zdatnist kozhnogo z yednannya 425 MB s 5 1 GB s dlya vsih 12 kanaliv latentnist najblizhchij susid 32 bajtnij paket 0 1 ms 256 bajtnij paket 0 8 ms dd dd Globalni kolektivni operaciyi global collective komunikaciyi tipu odin do bagatoh broadcast operaciyi i redukciya vikoristovuyetsya obchislyuvalnimi vuzlami dlya obminiv z I O kartami kozhen obchislyuvalnij vuzol i I O karta mayut tri dvonapravleni zv yazku propuskna zdatnist kozhnogo z yednannya 850 MB s 1 7 GB s dlya dvoh kanaliv latentnist povnij obhid 3 0 ms dd Globalni pererivannya global interrupt operaciyi bar yeriv i pererivan globalni AND ta OR operaciyi dd Funkcionalna merezhaz yednuye vuzli vvodu vivodu z zovnishnim otochennyam 10 gigabitna optichna Ethernet merezha dd Servisna merezha service control zavantazhennya monitoring diagnostika nalagodzhennya dostup do lichilnikiv produktivnosti gigabitna Ethernet merezhu 4 z yednannya na stijku dd Shob rozvantazhiti procesornij yadro vid operacij pov yazanih z peredacheyu povidomlen po merezhi trivimirnogo tora vikoristovuyetsya pristrij pryamogo dostupu do pam yati direct memory access DMA Krim zmenshennya navantazhennya na yadro cej mehanizm zmenshuye jmovirnist vzayemnogo blokuvannya procesiv yaki obminyuyutsya povidomlennyami yaka mozhe viniknuti vnaslidok pomilok programista Otochennya Blue Gene P vklyuchaye frontend front end node sistema vidkrita dlya dostupu po protokolu SSH sluzhit dlya dostupu koristuvachiv na obchislyuvalnij kompleks vsya zv yazok z kompleksom zdijsnyuyetsya tilki cherez cyu mashinu priznachena dlya rozrobki koristuvachami program kompilyuvannya proyektiv i postanovki zavdan u chergu robota z nij zdijsnyuyetsya v interaktivnomu rezhimi servisnij vuzol service node zabezpechuye kontrol nad sistemoyu Blue Gene P do ciyeyi mashini dostupu po SSH nemaye sistemu upravlinnya rozpodilenoyi fajlovoyi sistemoyu IBM General Parallel File System GPFS Blue Gene P u sviti 12 listopada 2007 v Nimechchini pochala pracyuvati persha sistema pid nazvoyu JUGENE z 65536 procesorami v Julich Research Centre z obchislyuvalnoyu potuzhnistyu v 167 teraflops Vin stav najbilsh shvidkim superkomp yuterom v Yevropi i shostim u vsomu sviti Persha laboratoriya v Spoluchenih Shtatah vikoristovuye Blue Gene P Argonne National Laboratory Pershi stijki Blue Gene P vikoristovuvalisya do 2007 roku Persha ustanovka bula sistemoyu v 111 teraflop yaka mala priblizno 32 000 procesoriv i priznachalasya dlya naukovo doslidnogo tovaristva SShA navesni 2008 Povnij sistemi bula prisvoyena tretya shodinka v listi Chervnevogo Top 500 2008 roku Z 2008 roku na fakulteti VMK MGU imeni M V Lomonosova pracyuye superkomp yuter IBM Blue Gene P Blue Gene QThe IBM Blue Gene Q Blue Gene Q tretye pokolinnya arhitekturi Metoyu rozrobnikiv stalo dosyagnennya 20 petaflopsnogo rubezhu v 2011 roci Blue Gene Q ye evolyucijnim prodovzhennyam arhitektur Blue Gene L i P pracyuyuchim na bilsh visokij chastoti i spozhivaye menshe energiyi na odin flops produktivnosti Arhitektura BlueGene Q ce multiyaderna 64 bitna sistema na chipi pobudovana za tehnologiyeyu PowerPC yaksho buti absolyutno konkretnim to ce chotiritaktnih arhitektura PowerPC A2 Kozhen z chipiv mistit 18 yader razom nabirayut pivtora milyarda 1 47 tranzistoriv 16 yader vikoristovuyutsya dlya vlasne obchislen na odnomu pracyuye operacijna sistema i nareshti ostannye yadro vidpovidaye za nadijnist obchislen vsiyeyi sistemi Na chastoti v 1 6 Ggc kozhen chip zdatnij vidati 204 8 Gflops spozhivayuchi potuzhnist v 55 Vatt Prirodno chastinoyu chipa ye i kontroleri pam yati i operacij vvedennya vivedennya Blue Gene Q mistit 4 bloki obchislen nad chislami z plavayuchoyu komoyu sho daye 4 vikonanih operaciyi za odin takt na kozhnomu yadri 18 yader za tverdzhennyam spivrobitnikiv IBM potribni dlya nadijnosti Yaksho na odnomu z yader procesora buv zafiksovanij zbij vono mozhe buti vidklyucheno i perevedeno na lavu zapasnih Vlasne viyavlennya i zmina konfiguraciyi pomilkovogo yadra mozhe buti provedeno na bud yakomu etapi virobnictva abo skladannya sistemi ne tilki koli chip vzhe testuyetsya a j na rannih etapah napriklad instalyaciyi chipa v obchislyuvalnij klaster U vipadku z Sequoia bude vikoristovuvatisya blizko 100 000 chipiv dlya togo shob dosyagti zapovitnih 20 petaflops Velichezna kilkist procesoriv robit zavdannya perepriznachennya yader duzhe vazhlivoyu u kompaniyi IBM pidrahuvali sho pri danomu 100 tisyach kilkosti chipiv v superkomp yuteri kozhni 3 tizhni v serednomu bude vihoditi z ladu 1 procesornij blok Takozh vidomo sho v Blue Gene Q realizovana pidtrimka tranzakcijnoyi pam yati ne na programnomu a aparatnomu rivni Tehnichni harakteristiki Masshtabuvannya do 512 stijok maksimalna produktivnist do 100 petaflops Vbudovanij interkonekt 5D Torus zabezpechuyevelicheznu propusknu zdatnist 4 ob yednanih modulya obchislen z plavayuchoyu tochkoyu FPU dlya instrukcij podvijnij i chetvernij shirini SIMD arhitekturi z podvijnoyu tochnistyu zabezpechuye bilsh visoku produktivnist navit pri obrobci odnopotokovih dodatkiv Uperedzhuvalnij vibirka dlya povtoryuvanih zvernen do pam yati v dovilno dovgih segmentah kodu zabezpechuye bilsh visoku produktivnist pri obrobci odnopotokovih dodatkiv Bagatorezhimna kesh pam yat spilno z tranzakcijnoyi pam yattyu viklyuchayut neobhidnist programnoyi obrobki blokuvan spekulyativne vikonannya komand dozvolyaye OpenMP rozparaleliti kod z urahuvannyam zalezhnosti danih Konveyerna obrobka atomarnih operacij u kesh pam yati drugogo rivnya z nizkimi zatrimkami navit pri visokomu rivni konkurenciyi zabezpechuyut shvidku obrobku zavdan OpenMP Modul vivedennya z rezhimu snu dozvolyaye perevoditi potoki SMT u splyachij rezhim v ochikuvanni podiyi sho dozvolyaye viklyuchiti vitrati pov yazani iz zberezhennyam registriv Simnadcyate yadro obroblyaye pererivannya podij funkcij nadijnosti dostupnosti ta zruchnosti obslugovuvannya RAS i zmenshuye riven shumu i spotvoren dlya operacijnoyi sistemi Porivnyalna harakteristika arhitektur Blue Gene P ta Blue Gene QHarakteristika Blue Gene P Blue Gene QObchislyuvalnij vuzolProcesor 32 bit PowerPC 450 64 bit PowerPC A2Yader na vuzol 4 16 1 1Chastota 850 MHz 1 6 GHzPikova produktivnist na vuzol 13 6 Gflops 204 8 GflopsKogerentnist keshu SMP hardware SMP hardware speculationL1 kesh 32 KB data 32 KB instruction 16 KB data 16 KB instructionL2 kesh 2 KB 14 stream prefetching private 32 MB 16 stream prefetching sharedL3 kesh rozpodilenij 8 MB n aPam yat na vuzol 2 GB 4 GB 16 GBPropuskna zdatnist pam yati 13 6 GB s 43 GB sFloating point blok na yadro 2 4Merezha TorTopologiya 3D 5DPropuskna zdatnist na vuzol 5 1 GB s 6links 2way 425MB s 40 GB s 10links 2way 2GB s Aparatna zatrimka najblizhchij susid lt 1 us lt 1 usAparatna zatrimka najgirshij vipadok 5 us 3 usKolektivna merezhaPropuskna zdatnist 5 1 GB s 40 GB sAparatna zatrimka krugovij obhid najgirshij vipadok 72 stijki 3 us n aVlastivosti sistemi na stijku Pikova produktivnist 13 9 Tflops 209 7 TflopsOholodzhennya Povitryane 100 Vodyane 90 Povitryane 10 Energospozhivannya pikove 32 kW 100 kWEnergoefektivnist GFlops na Vatt 0 37 2 1 Pershoyu sistemoyu pobudovanoyi z arhitekturi Blue Gene Q stala sistema Sequoia yaku vstanovili u Livermorskoyi nacionalnoyi laboratoriyi v 2011 roci Cya sistema rozrahovuvala naukovi programi laboratoriyi Vona skladayetsya z 98304 obchislyuvalnih vuzliv sho mistyat 1 6 mln procesornih yader i 1 6 Pb pam yati Roztashovuyetsya sistema v 96 stijkah spozhivana potuzhnist za proyektom stanovit 6 MVt Insha sistema arhitekturi Blue Gene Q pid nazvoyu Mira bude vstanovlena v Argonskij nacionalnij laboratoriyi v 2012 roci Vona mistitime blizko 50 tis obchislyuvalnih vuzliv 16 yader na vuzol 70 Pb diskovogo prostoru i mati ridinnu sistemu oholodzhennya Div takozhDeep Blue IBM WatsonPosilannyaIBM Research Blue Gene 22 serpnya 2006 u Wayback Machine storinka proyektu na sajti IBM Fotogalereya nedostupne posilannya z chervnya 2019 https computing llnl gov tutorials bgp 10 travnya 2013 u Wayback Machine http hpc cmc msu ru bgp 27 chervnya 2013 u Wayback Machine http www 3dnews ru 577851 9 zhovtnya 2015 u Wayback Machine http public dhe ibm com common ssi ecm ru dcd12345ruru DCD12345RURU PDF nedostupne posilannya z chervnya 2019 Ce nezavershena stattya pro informacijni tehnologiyi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi Ce nezavershena stattya zi shtuchnogo intelektu Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi