Hoper — кодова назва мікроархітектури графічних процесорів, розробленої Nvidia в якості наступника архітектури Ampere, яка була випущена в 2022 році. Вона названа на честь Ґрейс Мюррей Гоппер (англ. Grace Murray Hopper) — американської вченої у галузі комп'ютерних наук та контр-адмірала військово-морських сил США, що була одною з перших програмістів комп'ютера Марк I.
Процес виробництва (нм) | TSMC 4 нм |
---|---|
Попередник | Ampere |
Спроможності
Порівняльна таблиця GP100, GV100, GA100 та GH100
GPU features | NVIDIA Tesla P100 | NVIDIA Tesla V100 | NVIDIA A100 | NVIDIA H100 |
---|---|---|---|---|
GPU codename | GP100 | GV100 | GA100 | GH100 |
GPU architecture | NVIDIA Pascal | NVIDIA Volta | NVIDIA Ampere | NVIDIA Hopper |
Compute capability | 6.0 | 7.0 | 8.0 | 9.0 |
Threads / warp | 32 | 32 | 32 | 32 |
Max warps / SM | 64 | 64 | 64 | 64 |
Max threads / SM | 2048 | 2048 | 2048 | 2048 |
Max thread blocks / SM | 32 | 32 | 32 | 32 |
Max Thread Blocks / Thread Block Clusters | N/A | N/A | N/A | 16 |
Max 32-bit registers / SM | 65536 | 65536 | 65536 | 65536 |
Max registers / block | 65536 | 65536 | 65536 | 65536 |
Max registers / thread | 255 | 255 | 255 | 255 |
Max thread block size | 1024 | 1024 | 1024 | 1024 |
FP32 cores / SM | 64 | 64 | 64 | 128 |
Ratio of SM registers to FP32 cores | 1024 | 1024 | 1024 | 512 |
Shared Memory Size / SM | 64 KB | Configurable up to 96 KB | Configurable up to 164 KB | Configurable up to 228 KB |
Матриця порівняння підтримки точності обчислень
Supported CUDA Core Precisions | Supported Tensor Core Precisions | |||||||||||||||||
FP8 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP8 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NVIDIA Tesla P4 | Ні | Ні | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA P100 | Ні | Так | Так | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA Volta | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA Turing | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Так | Так | Так | Ні | Ні |
NVIDIA A100 | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Ні | Так | Ні | Так | Так | Так | Так | Так | Так |
NVIDIA H100 | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Так | Так | Ні | Так | Ні | Ні | Так | Так | Так |
Позначення:
- FPnn: floating point with nn bits
- INTn: integer with n bits
- INT1: binary
- TF32: TensorFloat32
- BF16: bfloat16
Порівняння потужностей декодування
Відео | H.264 decode (1080p30) | H.265 (HEVC) decode (1080p30) | VP9 decode (1080p30) |
---|---|---|---|
V100 | 16 | 22 | 22 |
A100 | 75 | 157 | 108 |
H100 | 170 | 340 | 260 |
Зображення/сек | JPEG 4:4:4 decode(1080p) | JPEG 4:2:0 decode(1080p) |
---|---|---|
A100 | 1490 | 2950 |
H100 | 3310 | 6350 |
Примітки
- NVIDIA A100 Tensor Core GPU Architecture (PDF). www.nvidia.com. Процитовано 18 вересня 2020.
- NVIDIA H100 Tensor Core GPU Architecture Whitepaper. NVIDIA.
- NVIDIA Tensor Cores: Versatility for HPC & AI. NVIDIA.
- Abstract. docs.nvidia.com.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Hoper kodova nazva mikroarhitekturi grafichnih procesoriv rozroblenoyi Nvidia v yakosti nastupnika arhitekturi Ampere yaka bula vipushena v 2022 roci Vona nazvana na chest Grejs Myurrej Gopper angl Grace Murray Hopper amerikanskoyi vchenoyi u galuzi komp yuternih nauk ta kontr admirala vijskovo morskih sil SShA sho bula odnoyu z pershih programistiv komp yutera Mark I Nvidia HoperProces virobnictva nm TSMC 4 nmPoperednikAmpereSpromozhnostiPorivnyalna tablicya GP100 GV100 GA100 ta GH100 GPU features NVIDIA Tesla P100 NVIDIA Tesla V100 NVIDIA A100 NVIDIA H100GPU codename GP100 GV100 GA100 GH100GPU architecture NVIDIA Pascal NVIDIA Volta NVIDIA Ampere NVIDIA HopperCompute capability 6 0 7 0 8 0 9 0Threads warp 32 32 32 32Max warps SM 64 64 64 64Max threads SM 2048 2048 2048 2048Max thread blocks SM 32 32 32 32Max Thread Blocks Thread Block Clusters N A N A N A 16Max 32 bit registers SM 65536 65536 65536 65536Max registers block 65536 65536 65536 65536Max registers thread 255 255 255 255Max thread block size 1024 1024 1024 1024FP32 cores SM 64 64 64 128Ratio of SM registers to FP32 cores 1024 1024 1024 512Shared Memory Size SM 64 KB Configurable up to 96 KB Configurable up to 164 KB Configurable up to 228 KB Matricya porivnyannya pidtrimki tochnosti obchislen Supported CUDA Core Precisions Supported Tensor Core PrecisionsFP8 FP16 FP32 FP64 INT1 INT4 INT8 TF32 BF16 FP8 FP16 FP32 FP64 INT1 INT4 INT8 TF32 BF16NVIDIA Tesla P4 Ni Ni Tak Tak Ni Ni Tak Ni Ni Ni Ni Ni Ni Ni Ni Ni Ni NiNVIDIA P100 Ni Tak Tak Tak Ni Ni Ni Ni Ni Ni Ni Ni Ni Ni Ni Ni Ni NiNVIDIA Volta Ni Tak Tak Tak Ni Ni Tak Ni Ni Ni Tak Ni Ni Ni Ni Ni Ni NiNVIDIA Turing Ni Tak Tak Tak Ni Ni Tak Ni Ni Ni Tak Ni Ni Tak Tak Tak Ni NiNVIDIA A100 Ni Tak Tak Tak Ni Ni Tak Ni Tak Ni Tak Ni Tak Tak Tak Tak Tak TakNVIDIA H100 Ni Tak Tak Tak Ni Ni Tak Ni Tak Tak Tak Ni Tak Ni Ni Tak Tak Tak Poznachennya FPnn floating point with nn bits INTn integer with n bits INT1 binary TF32 TensorFloat32 BF16 bfloat16 Porivnyannya potuzhnostej dekoduvannya Video H 264 decode 1080p30 H 265 HEVC decode 1080p30 VP9 decode 1080p30 V100 16 22 22A100 75 157 108H100 170 340 260Zobrazhennya sek JPEG 4 4 4 decode 1080p JPEG 4 2 0 decode 1080p A100 1490 2950H100 3310 6350PrimitkiNVIDIA A100 Tensor Core GPU Architecture PDF www nvidia com Procitovano 18 veresnya 2020 NVIDIA H100 Tensor Core GPU Architecture Whitepaper NVIDIA NVIDIA Tensor Cores Versatility for HPC amp AI NVIDIA Abstract docs nvidia com