Pascal - це кодове ім'я мікроархітектури, яка була розроблена компанією Nvidia як наступник мікроархітектури Maxwell у 2016 році. Ця архітектура оснащена новітніми ядрами Nvidia, які використовують пам'ять, що дозволяє пам'яті краще стекуватися на GPU матриці, а також дає можливість підтримки пропускної здатності зі швидкістю до 1 ТБ/с. Цей 3D-чип на інтеграційній пластині дозволяє не тільки значно збільшити BW (смугу пропускання), але також дає приріст ефективності до 4 разів і в 2,5 рази збільшує VRAM-ємність графічної одиниці.
Технології
3D-Memory
Суть цієї технології полягає в тому, щоб упакувати мікросхеми пам'яті (Stacks DRAM) разом з GPU. Це дозволяє графічному процесору швидше отримувати дані з пам'яті. Тобто швидкість обміну даними GPU з пам'яттю збільшується. Nvidia вказує, що пропускна спроможність збільшується в декілька раз, обсяг пам'яті вдвічі, а енергоефективність - в чотири рази. Мікросхеми пам'яті з'єднуються з GPU за допомогою спеціальних міжшарових з'єднань під назвою .
Unified Memory
Як можна здогадатися з назви, це свого роду концепція спільної пам'яті. Якщо точніше, то графічний процесор може використовувати пам'ять центрального процесора і навпаки.
Спільна пам'ять створює так званий пул керованої пам'яті, що є спільним між CPU і GPU і таким чином долає CPU-GPU розрив. Керована пам'ять доступна як на CPU, так і на GPU за допомогою одного покажчика. Головне те, що система автоматично переносить дані, виділені в єдиній пам'яті між хостом і пристроєм, так що вона виглядає як пам'ять процесора для коду, який працює на процесорі, і, як GPU-пам'ять для коду, що працює на GPU.
NVLink
збільшує швидкість обміну інформацією між GPU і CPU. За даними Nvidia, ця технологія піднімає швидкість з існуючого значення 16 ГБ / с (PCI Express) до 80 ГБ / с. Крім цього буде задіяна і в конфігураціях, що складаються з декількох 3D-адаптерів.
Module
NVIDIA розробила модуль для розміщення графічних процесорів, що використовують Pascal . Якщо порівнювати з розміром плат, які використовуються зараз, то в NVIDIA змогли розмістити більш продуктивний чип використовуючи лише 1/3 розміру теперішніх PCI Express відеокарт. Модуль буде розміщувати в собі графічний чип Pascal, відеопам'ять, а також в обов'язковому порядку згадану вище технологію .
Mixed-precision computing
Обчислення змішаної точності в Pascal використовуються для подвійного прискорення розрахунків, яким достатньо 16-бітної «половинної» точності обчислень - вони вдвічі швидші, ніж звичайні FP32 (одинарна точність). Збільшена продуктивність таких обчислень дасть приріст швидкості класифікації та згортки - двох важливих кроках deep learning, при збереженні достатньої точності обчислень.
Ядра Pascal
В даний час відомо про два ядра Pascal:
- PK104
- PK100
PK104 буде наступником GM204 (Maxwell), в той час як PK100 буде флагманом архітектури Pascal GPU від Nvidia. Обидва чипи будуть виготовлені з використанням 14nm або на 16nm технологічного процесу, використовуючи . Nvidia використовувала 28nm технологічний процес протягом 3 років, але зріст в плані продуктивності стрибає з кожним поколінням. Звичайно, що стає важко підтримувати такі процесори без переходу на більш низький технологічний процес - що вони і планують зробити у наступній архітектурі. Використання дозволить Nvidia збільшити відеобуфер на графічних процесорах до 32Гб.
Посилання
- . Архів оригіналу за 15 січня 2020. Процитовано 10 травня 2022.
- . 17 березня 2015. Архів оригіналу за 2 квітня 2015. Процитовано 10 травня 2015.
- . 25 березня 2014. Архів оригіналу за 25 березня 2014. Процитовано 10 травня 2015.
- . 18 березня 2015. Архів оригіналу за 18 травня 2015. Процитовано 10 травня 2015.
- . 26 березня 2015. Архів оригіналу за 4 квітня 2014. Процитовано 10 травня 2015.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Pascal ce kodove im ya mikroarhitekturi yaka bula rozroblena kompaniyeyu Nvidia yak nastupnik mikroarhitekturi Maxwell u 2016 roci Cya arhitektura osnashena novitnimi yadrami Nvidia yaki vikoristovuyut pam yat sho dozvolyaye pam yati krashe stekuvatisya na GPU matrici a takozh daye mozhlivist pidtrimki propusknoyi zdatnosti zi shvidkistyu do 1 TB s Cej 3D chip na integracijnij plastini dozvolyaye ne tilki znachno zbilshiti BW smugu propuskannya ale takozh daye pririst efektivnosti do 4 raziv i v 2 5 razi zbilshuye VRAM yemnist grafichnoyi odinici Tehnologiyi3D Memory Sut ciyeyi tehnologiyi polyagaye v tomu shob upakuvati mikroshemi pam yati Stacks DRAM razom z GPU Ce dozvolyaye grafichnomu procesoru shvidshe otrimuvati dani z pam yati Tobto shvidkist obminu danimi GPU z pam yattyu zbilshuyetsya Nvidia vkazuye sho propuskna spromozhnist zbilshuyetsya v dekilka raz obsyag pam yati vdvichi a energoefektivnist v chotiri razi Mikroshemi pam yati z yednuyutsya z GPU za dopomogoyu specialnih mizhsharovih z yednan pid nazvoyu Unified Memory Yak mozhna zdogadatisya z nazvi ce svogo rodu koncepciya spilnoyi pam yati Yaksho tochnishe to grafichnij procesor mozhe vikoristovuvati pam yat centralnogo procesora i navpaki Spilna pam yat stvoryuye tak zvanij pul kerovanoyi pam yati sho ye spilnim mizh CPU i GPU i takim chinom dolaye CPU GPU rozriv Kerovana pam yat dostupna yak na CPU tak i na GPU za dopomogoyu odnogo pokazhchika Golovne te sho sistema avtomatichno perenosit dani vidileni v yedinij pam yati mizh hostom i pristroyem tak sho vona viglyadaye yak pam yat procesora dlya kodu yakij pracyuye na procesori i yak GPU pam yat dlya kodu sho pracyuye na GPU NVLink zbilshuye shvidkist obminu informaciyeyu mizh GPU i CPU Za danimi Nvidia cya tehnologiya pidnimaye shvidkist z isnuyuchogo znachennya 16 GB s PCI Express do 80 GB s Krim cogo bude zadiyana i v konfiguraciyah sho skladayutsya z dekilkoh 3D adapteriv Module NVIDIA rozrobila modul dlya rozmishennya grafichnih procesoriv sho vikoristovuyut Pascal Yaksho porivnyuvati z rozmirom plat yaki vikoristovuyutsya zaraz to v NVIDIA zmogli rozmistiti bilsh produktivnij chip vikoristovuyuchi lishe 1 3 rozmiru teperishnih PCI Express videokart Modul bude rozmishuvati v sobi grafichnij chip Pascal videopam yat a takozh v obov yazkovomu poryadku zgadanu vishe tehnologiyu Mixed precision computing Obchislennya zmishanoyi tochnosti v Pascal vikoristovuyutsya dlya podvijnogo priskorennya rozrahunkiv yakim dostatno 16 bitnoyi polovinnoyi tochnosti obchislen voni vdvichi shvidshi nizh zvichajni FP32 odinarna tochnist Zbilshena produktivnist takih obchislen dast pririst shvidkosti klasifikaciyi ta zgortki dvoh vazhlivih krokah deep learning pri zberezhenni dostatnoyi tochnosti obchislen Yadra PascalV danij chas vidomo pro dva yadra Pascal PK104 PK100 PK104 bude nastupnikom GM204 Maxwell v toj chas yak PK100 bude flagmanom arhitekturi Pascal GPU vid Nvidia Obidva chipi budut vigotovleni z vikoristannyam 14nm abo na 16nm tehnologichnogo procesu vikoristovuyuchi Nvidia vikoristovuvala 28nm tehnologichnij proces protyagom 3 rokiv ale zrist v plani produktivnosti stribaye z kozhnim pokolinnyam Zvichajno sho staye vazhko pidtrimuvati taki procesori bez perehodu na bilsh nizkij tehnologichnij proces sho voni i planuyut zrobiti u nastupnij arhitekturi Vikoristannya dozvolit Nvidia zbilshiti videobufer na grafichnih procesorah do 32Gb Posilannya Arhiv originalu za 15 sichnya 2020 Procitovano 10 travnya 2022 17 bereznya 2015 Arhiv originalu za 2 kvitnya 2015 Procitovano 10 travnya 2015 25 bereznya 2014 Arhiv originalu za 25 bereznya 2014 Procitovano 10 travnya 2015 18 bereznya 2015 Arhiv originalu za 18 travnya 2015 Procitovano 10 travnya 2015 26 bereznya 2015 Arhiv originalu za 4 kvitnya 2014 Procitovano 10 travnya 2015