Ця стаття не містить . (лютий 2020) |
У обчислювальній техніці, особливо в цифровій обробці сигналів поєднане множення-додавання (multiply-accumulate) — поширена операція, при якій множаться два числа і складаються з акумулятором.
Коли операція виконується над числами з рухомою комою, то може виконуватися подвійне округлення (типово для процесорів цифрових сигналів) або одноразове (додавання відбувається з більш точним внутрішнім поданням добутку). Версія з одноразовим округленням також називається fused multiply-add (FMA) або fused multiply-accumulate (FMAC).
Призначення
Дана інструкція дозволяє більш ефективно реалізувати операції ділення і добування квадратного кореня (при відсутності апаратної реалізації), множення векторів і матриць, обчислення поліномів за схемою Горнера.
Реалізація в процесорах
Операція включена в стандарт IEEE 754-2008. У стандарт 1999 для мови програмування Сі включена підтримка операції FMA (функція fma () з math.h).
Сучасні комп'ютери можуть мати спеціалізований блок множення-складання або MAC (multiply-accumulate), що складається з помножувача, який реалізує комбінаційну логіку, і суматора, а також акумулятор, в якому зберігається результат. Вихід акумулятора подається на один із входів суматора, і таким чином кожен такт результат з помножувача складається з акумулятором. Реалізація MAC вимагає додаткової логіки на кристалі, але обчислення відбуваються швидше, ніж при використанні методу зрушень і складань типового для перших комп'ютерів. FMA також працює з більш високою точністю .
З'явившись на сигнальних процесорах, операція (FMA) включена в системи команд процесорів: IBM POWER1 (1990), Fujitsu SPARC64 (1995), HP PA-8000 (1996), Sony Emotion Engine (1999), Intel Itanium (2001), IBM Cell (2005).
Також вона реалізована в процесорах AMD з підтримкою [en] (Bulldozer) і FMA3 (Trinity). Intel реалізувала FMA3 в процесорах на ядрі Haswell.
Технологія присутня в NVIDIA GPU серій GeForce 200 (GTX 200), GeForce 300 і NVIDIA Tesla GPGPU C1060 & C2050 / C2070. AMD додала FMA в лінію Radeon з серії HD 5000.
Інструкції FMA, реалізовані в процесорах Intel Sandy Bridge:
- VFMADD
- VFMSUB
- VFNMADD
- VFNMSUB
- VFMADDSUB
- VFMSUBADD
Джерела
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno lyutij 2020 U obchislyuvalnij tehnici osoblivo v cifrovij obrobci signaliv poyednane mnozhennya dodavannya multiply accumulate poshirena operaciya pri yakij mnozhatsya dva chisla i skladayutsya z akumulyatorom a a b c displaystyle a leftarrow a b times c Koli operaciya vikonuyetsya nad chislami z ruhomoyu komoyu to mozhe vikonuvatisya podvijne okruglennya tipovo dlya procesoriv cifrovih signaliv abo odnorazove dodavannya vidbuvayetsya z bilsh tochnim vnutrishnim podannyam dobutku Versiya z odnorazovim okruglennyam takozh nazivayetsya fused multiply add FMA abo fused multiply accumulate FMAC PriznachennyaDana instrukciya dozvolyaye bilsh efektivno realizuvati operaciyi dilennya i dobuvannya kvadratnogo korenya pri vidsutnosti aparatnoyi realizaciyi mnozhennya vektoriv i matric obchislennya polinomiv za shemoyu Gornera Realizaciya v procesorahOperaciya vklyuchena v standart IEEE 754 2008 U standart 1999 dlya movi programuvannya Si vklyuchena pidtrimka operaciyi FMA funkciya fma z math h Suchasni komp yuteri mozhut mati specializovanij blok mnozhennya skladannya abo MAC multiply accumulate sho skladayetsya z pomnozhuvacha yakij realizuye kombinacijnu logiku i sumatora a takozh akumulyator v yakomu zberigayetsya rezultat Vihid akumulyatora podayetsya na odin iz vhodiv sumatora i takim chinom kozhen takt rezultat z pomnozhuvacha skladayetsya z akumulyatorom Realizaciya MAC vimagaye dodatkovoyi logiki na kristali ale obchislennya vidbuvayutsya shvidshe nizh pri vikoristanni metodu zrushen i skladan tipovogo dlya pershih komp yuteriv FMA takozh pracyuye z bilsh visokoyu tochnistyu Z yavivshis na signalnih procesorah operaciya FMA vklyuchena v sistemi komand procesoriv IBM POWER1 1990 Fujitsu SPARC64 1995 HP PA 8000 1996 Sony Emotion Engine 1999 Intel Itanium 2001 IBM Cell 2005 Takozh vona realizovana v procesorah AMD z pidtrimkoyu en Bulldozer i FMA3 Trinity Intel realizuvala FMA3 v procesorah na yadri Haswell Tehnologiya prisutnya v NVIDIA GPU serij GeForce 200 GTX 200 GeForce 300 i NVIDIA Tesla GPGPU C1060 amp C2050 C2070 AMD dodala FMA v liniyu Radeon z seriyi HD 5000 Instrukciyi FMA realizovani v procesorah Intel Sandy Bridge VFMADD a b c d displaystyle a b times c d VFMSUB a b c d displaystyle a b times c d VFNMADD a b c d displaystyle a b times c d VFNMSUB a b c d displaystyle a b times c d VFMADDSUB A o d d B o d d C o d d D o d d displaystyle Aodd Bodd times Codd Dodd VFMSUBADD A e v e n B e v e n C e v e n D e v e n displaystyle Aeven Beven times Ceven Deven DzherelaCya stattya ye zagotovkoyu Vi mozhete dopomogti proyektu dorobivshi yiyi Ce povidomlennya varto zaminiti tochnishim