Тензорний блок обробки (англ. tensor processing unit, TPU) — це інтегральна схема специфічного застосування (ASIC) призначена для прискорення розрахунків штучного інтелекту, що була розроблена компанією Google спеціально для машинного навчання нейронних мереж.
Огляд
Тензорний блок обробки був анонсований у травні 2016 року на конференції (Google I/O), де компанія оголосила, що TPU вже більше року використовується в її дата-центрах. Чип було розроблено спеціально для програмного каркаса TensorFlow, математичної бібліотеки символьних обчислень, що використовується для таких застосунків машинного навчання як штучні нейронні мережі. Водночас Google продовжував використовувати центральні і графічні процесори для інших видів машинного навчання. Окрім тензорного блоку від Google, з'являються й інші різновиди прискорювачів штучного інтелекту від інших виробників, що, зокрема, націлені на ринки вбудованої електроніки та робототехніки.
TPU є власністю Google і комерційно не розповсюджується, хоча 12 лютого 2018 року The New York Times повідомила, що Google «дозволить іншим компаніям купувати доступ до цих чипів за допомогою служби хмарних обчислень». Google стверджує, що TPU були використані в серії ігор у ґо комп'ютера проти людини, у яких програма AlphaGo здобула перемогу над корейський майстром Лі Седолом, а також у системі AlphaZero, яка навчилася грати у шахи, сьоґі і ґо на надлюдському рівні знаючи лише правила цих ігор та здобула перевагу над іншими провідними програмами в цих іграх. Google також використовувала TPU для обробки тексту в Google Street View і змогла знайти весь текст у власній базі даних менш ніж за п'ять днів. В Google Фото окремий TPU може обробляти більше 100 мільйонів фотографій на день. TPU також використовується в системі , яку Google використовує для надання результатів пошуку.
У порівнянні з графічним процесором, TPU розрахований на великі обсяги обчислень з низькою точністю (наприклад, лише 8-бітною точністю), з вищою кількістю операцій вводу-виводу в секунду на ват. У TPU відсутністі апаратні засоби для растрування/відображення текстур. Чип TPU монтується разом із радіатором та може розміститися в гнізді жорсткого диска в стійці центру обробки даних.
У 2018 році TPU були використані для навчання ботів, що грають у StarCraft, поширену комп'ютерну стратегію реального часу. Таким чином комп'ютер вперше зміг здобути переконливу перемогу над професійними гравцями. Для навчання боти (окремі версії програми) грали між собою у турнір. Кожен бот використовував 16 тензорних процесорів TPU (що, за словами керівника DeepMind, відповідало потужності близько 50 графічних процесорів). Натреновані таким чином на тензорних блоках нейронні мережі були застосовані на типовому графічному процесорі для гри проти професійних гравців-людей.
Покоління
Перше покоління
TPU першого покоління є 8-бітним процесором множення матриць, який керується командами CISC від головного процесора через шину (PCIe 3.0). Він виготовлений на процесі 28 нм з розміром кристалу ≤ 331 мм2. Тактова частота 700 МГц, тепловий розрахунок на потужність 28-40 Вт. Має 28 МіБ пам'яті на чипі і 4 МіБ 32-розрядних акумуляторів, які отримують результати систолічного масиву розміру 256х256 з 8-бітних множників. Всередині TPU також міститься 8 ГіБ двоканальної оперативної пам'яті DDR3 SDRAM з частотою 2133 МГц, що пропонує 34 Гб/с пропускної спроможності. Команди переносять дані на або з головного процесора, виконують множення матриць, згортки, застосовують функції активації.
Друге покоління
TPU другого покоління було анонсовано у травні 2017 року. У Google заявили, що продуктивність першого покоління TPU була обмеженою через недостатню пропускну здатність оперативної пам'яті. У другому поколінні було використано 16 Гб пам'яті [en], через що пропускна здатність збільшилася до 600 Гб/с, а продуктивність — до 45 TFLOPS. Нові TPU було об'єднано в модулі з чотирьох чипів із загальною продуктивністю 180 TFLOPS. 64 таких модулі об'єднувалися у блоки модулів із 256-ма чипами та загальною продуктивністю 11,5 PFLOPS. В той час як TPU першого покоління обмежувалися цілими числами, TPU другого покоління також можуть обчислювати числа з рухомою комою. Це робить TPU другого покоління корисними як для навчання, так і для застосування моделей машинного навчання. У Google заявили, що TPU другого покоління будуть доступні на Google Compute Engine для використання у застосунках TensorFlow.
Третє покоління
TPU третього покоління було анонсовано 8 травня 2018 року. Google оголосив, що самі процесори вдвічі потужніші, ніж TPU другого покоління, а кожен блок модулів міститиме вчетверо більше чипів, ніж в попередньому поколінні. Відтак, кожен блок модулів буде увосьмеро продуктивнішим порівняно з другим поколінням.
Див. Також
- Зоровий процесор — подібний пристрій спеціалізований для машинного зору.
- Структурний тензор, математична основа тензорних блоків обробки
- ШІ-прискорювач
Примітки
- Google's Tensor Processing Unit explained: this is what the future of computing looks like. TechRadar (англ.). Процитовано 19 січня 2017.
- Jouppi, Norm (18 травня 2016). Google supercharges machine learning tasks with TPU custom chip. Google Cloud Platform Blog (амер.). Google. Процитовано 22 січня 2017.
- "TensorFlow: Open source machine learning" "It is machine learning software being used for various kinds of perceptual and language understanding tasks" — Jeffrey Dean, minute 0:47 / 2:17 from Youtube clip
- Google Makes Its Special A.I. Chips Available to Others. The New York Times (англ.). Процитовано 12 лютого 2018.
- McGourty, Colin (6 грудня 2017). DeepMind’s AlphaZero crushes chess. chess24.com (англ.).
- Google's Tensor Processing Unit could advance Moore's Law 7 years into the future. PCWorld (англ.). Процитовано 19 січня 2017.
- Armasu, Lucian (19 травня 2016). Google's Big Chip Unveil For Machine Learning: Tensor Processing Unit With 10x Better Efficiency (Updated). Tom's Hardware. Процитовано 26 червня 2016.
- DeepMind StarCraft II Demonstration — YouTube, 24.01.2019. (англ.)
- Jouppi, Norman P.; Young, Cliff; Patil, Nishant; Patterson, David; Agrawal, Gaurav; Bajwa, Raminder; Bates, Sarah; Bhatia, Suresh; Boden, Nan; Borchers, Al; Boyle, Rick; Cantin, Pierre-luc; Chao, Clifford; Clark, Chris; Coriell, Jeremy; Daley, Mike; Dau, Matt; Dean, Jeffrey; Gelb, Ben; Ghaemmaghami, Tara Vazir; Gottipati, Rajendra; Gulland, William; Hagmann, Robert; Ho, C. Richard; Hogberg, Doug; Hu, John; Hundt, Robert; Hurt, Dan; Ibarz, Julian; Jaffey, Aaron; Jaworski, Alek; Kaplan, Alexander; Khaitan, Harshit; Koch, Andy; Kumar, Naveen; Lacy, Steve; Laudon, James; Law, James; Le, Diemthu; Leary, Chris; Liu, Zhuyuan; Lucke, Kyle; Lundin, Alan; MacKean, Gordon; Maggiore, Adriana; Mahony, Maire; Miller, Kieran; Nagarajan, Rahul; Narayanaswami, Ravi; Ni, Ray; Nix, Kathy; Norrie, Thomas; Omernick, Mark; Penukonda, Narayana; Phelps, Andy; Ross, Jonathan; Ross, Matt; Salek, Amir; Samadiani, Emad; Severn, Chris; Sizikov, Gregory; Snelham, Matthew; Souter, Jed; Steinberg, Dan; Swing, Andy; Tan, Mercedes; Thorson, Gregory; Tian, Bo; Toma, Horia; Tuttle, Erick; Vasudevan, Vijay; Walter, Richard; Wang, Walter; Wilcox, Eric; Yoon, Doe Hyun (26 червня 2017). In-Datacenter Performance Analysis of a Tensor Processing Unit™ (PDF). Toronto, Canada. Процитовано 17 November 2017.
- Kennedy, Patrick (22 серпня 2017). Case Study on the Google TPU and GDDR5 from Hot Chips 29. Serve The Home. Процитовано 23 серпня 2017.
- Bright, Peter (17 травня 2017). Google brings 45 teraflops tensor flow processors to its compute cloud. Ars Technica. Процитовано 30 травня 2017.
- Kennedy, Patrick (17 травня 2017). Google Cloud TPU Details Revealed. Serve The Home. Процитовано 30 травня 2017.
- Frumusanu, Andre (8 травня 2018). Google I/O Opening Keynote Live-Blog. Процитовано 9 травня 2018.
- Feldman, Michael (11 травня 2018). Google Offers Glimpse of Third-Generation TPU Processor. Top 500. Процитовано 14 травня 2018.
- Teich, Paul (10 травня 2018). Tearing Apart Google’s TPU 3.0 AI Coprocessor. The Next Platform. Процитовано 14 травня 2018.
Посилання
- Фото чипу та плати Google TPU
- Фотографія платформи Google TPU v2
- Фотографія платформи Google TPU v3
- Фотографія модуля TPU v2 від Google
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Tenzornij blok obrobki angl tensor processing unit TPU ce integralna shema specifichnogo zastosuvannya ASIC priznachena dlya priskorennya rozrahunkiv shtuchnogo intelektu sho bula rozroblena kompaniyeyu Google specialno dlya mashinnogo navchannya nejronnih merezh Tensor Processing Unit 3 0OglyadTenzornij blok obrobki buv anonsovanij u travni 2016 roku na konferenciyi Google I O de kompaniya ogolosila sho TPU vzhe bilshe roku vikoristovuyetsya v yiyi data centrah Chip bulo rozrobleno specialno dlya programnogo karkasa TensorFlow matematichnoyi biblioteki simvolnih obchislen sho vikoristovuyetsya dlya takih zastosunkiv mashinnogo navchannya yak shtuchni nejronni merezhi Vodnochas Google prodovzhuvav vikoristovuvati centralni i grafichni procesori dlya inshih vidiv mashinnogo navchannya Okrim tenzornogo bloku vid Google z yavlyayutsya j inshi riznovidi priskoryuvachiv shtuchnogo intelektu vid inshih virobnikiv sho zokrema nacileni na rinki vbudovanoyi elektroniki ta robototehniki TPU ye vlasnistyu Google i komercijno ne rozpovsyudzhuyetsya hocha 12 lyutogo 2018 roku The New York Times povidomila sho Google dozvolit inshim kompaniyam kupuvati dostup do cih chipiv za dopomogoyu sluzhbi hmarnih obchislen Google stverdzhuye sho TPU buli vikoristani v seriyi igor u go komp yutera proti lyudini u yakih programa AlphaGo zdobula peremogu nad korejskij majstrom Li Sedolom a takozh u sistemi AlphaZero yaka navchilasya grati u shahi sogi i go na nadlyudskomu rivni znayuchi lishe pravila cih igor ta zdobula perevagu nad inshimi providnimi programami v cih igrah Google takozh vikoristovuvala TPU dlya obrobki tekstu v Google Street View i zmogla znajti ves tekst u vlasnij bazi danih mensh nizh za p yat dniv V Google Foto okremij TPU mozhe obroblyati bilshe 100 miljoniv fotografij na den TPU takozh vikoristovuyetsya v sistemi yaku Google vikoristovuye dlya nadannya rezultativ poshuku U porivnyanni z grafichnim procesorom TPU rozrahovanij na veliki obsyagi obchislen z nizkoyu tochnistyu napriklad lishe 8 bitnoyu tochnistyu z vishoyu kilkistyu operacij vvodu vivodu v sekundu na vat U TPU vidsutnisti aparatni zasobi dlya rastruvannya vidobrazhennya tekstur Chip TPU montuyetsya razom iz radiatorom ta mozhe rozmistitisya v gnizdi zhorstkogo diska v stijci centru obrobki danih U 2018 roci TPU buli vikoristani dlya navchannya botiv sho grayut u StarCraft poshirenu komp yuternu strategiyu realnogo chasu Takim chinom komp yuter vpershe zmig zdobuti perekonlivu peremogu nad profesijnimi gravcyami Dlya navchannya boti okremi versiyi programi grali mizh soboyu u turnir Kozhen bot vikoristovuvav 16 tenzornih procesoriv TPU sho za slovami kerivnika DeepMind vidpovidalo potuzhnosti blizko 50 grafichnih procesoriv Natrenovani takim chinom na tenzornih blokah nejronni merezhi buli zastosovani na tipovomu grafichnomu procesori dlya gri proti profesijnih gravciv lyudej PokolinnyaPershe pokolinnya TPU pershogo pokolinnya ye 8 bitnim procesorom mnozhennya matric yakij keruyetsya komandami CISC vid golovnogo procesora cherez shinu PCIe 3 0 Vin vigotovlenij na procesi 28 nm z rozmirom kristalu 331 mm2 Taktova chastota 700 MGc teplovij rozrahunok na potuzhnist 28 40 Vt Maye 28 MiB pam yati na chipi i 4 MiB 32 rozryadnih akumulyatoriv yaki otrimuyut rezultati sistolichnogo masivu rozmiru 256h256 z 8 bitnih mnozhnikiv Vseredini TPU takozh mistitsya 8 GiB dvokanalnoyi operativnoyi pam yati DDR3 SDRAM z chastotoyu 2133 MGc sho proponuye 34 Gb s propusknoyi spromozhnosti Komandi perenosyat dani na abo z golovnogo procesora vikonuyut mnozhennya matric zgortki zastosovuyut funkciyi aktivaciyi Druge pokolinnya TPU drugogo pokolinnya bulo anonsovano u travni 2017 roku U Google zayavili sho produktivnist pershogo pokolinnya TPU bula obmezhenoyu cherez nedostatnyu propusknu zdatnist operativnoyi pam yati U drugomu pokolinni bulo vikoristano 16 Gb pam yati en cherez sho propuskna zdatnist zbilshilasya do 600 Gb s a produktivnist do 45 TFLOPS Novi TPU bulo ob yednano v moduli z chotiroh chipiv iz zagalnoyu produktivnistyu 180 TFLOPS 64 takih moduli ob yednuvalisya u bloki moduliv iz 256 ma chipami ta zagalnoyu produktivnistyu 11 5 PFLOPS V toj chas yak TPU pershogo pokolinnya obmezhuvalisya cilimi chislami TPU drugogo pokolinnya takozh mozhut obchislyuvati chisla z ruhomoyu komoyu Ce robit TPU drugogo pokolinnya korisnimi yak dlya navchannya tak i dlya zastosuvannya modelej mashinnogo navchannya U Google zayavili sho TPU drugogo pokolinnya budut dostupni na Google Compute Engine dlya vikoristannya u zastosunkah TensorFlow Tretye pokolinnya TPU tretogo pokolinnya bulo anonsovano 8 travnya 2018 roku Google ogolosiv sho sami procesori vdvichi potuzhnishi nizh TPU drugogo pokolinnya a kozhen blok moduliv mistitime vchetvero bilshe chipiv nizh v poperednomu pokolinni Vidtak kozhen blok moduliv bude uvosmero produktivnishim porivnyano z drugim pokolinnyam Div TakozhZorovij procesor podibnij pristrij specializovanij dlya mashinnogo zoru Strukturnij tenzor matematichna osnova tenzornih blokiv obrobki ShI priskoryuvachPrimitkiGoogle s Tensor Processing Unit explained this is what the future of computing looks like TechRadar angl Procitovano 19 sichnya 2017 Jouppi Norm 18 travnya 2016 Google supercharges machine learning tasks with TPU custom chip Google Cloud Platform Blog amer Google Procitovano 22 sichnya 2017 TensorFlow Open source machine learning It is machine learning software being used for various kinds of perceptual and language understanding tasks Jeffrey Dean minute 0 47 2 17 from Youtube clip Google Makes Its Special A I Chips Available to Others The New York Times angl Procitovano 12 lyutogo 2018 McGourty Colin 6 grudnya 2017 DeepMind s AlphaZero crushes chess chess24 com angl Google s Tensor Processing Unit could advance Moore s Law 7 years into the future PCWorld angl Procitovano 19 sichnya 2017 Armasu Lucian 19 travnya 2016 Google s Big Chip Unveil For Machine Learning Tensor Processing Unit With 10x Better Efficiency Updated Tom s Hardware Procitovano 26 chervnya 2016 DeepMind StarCraft II Demonstration YouTube 24 01 2019 angl Jouppi Norman P Young Cliff Patil Nishant Patterson David Agrawal Gaurav Bajwa Raminder Bates Sarah Bhatia Suresh Boden Nan Borchers Al Boyle Rick Cantin Pierre luc Chao Clifford Clark Chris Coriell Jeremy Daley Mike Dau Matt Dean Jeffrey Gelb Ben Ghaemmaghami Tara Vazir Gottipati Rajendra Gulland William Hagmann Robert Ho C Richard Hogberg Doug Hu John Hundt Robert Hurt Dan Ibarz Julian Jaffey Aaron Jaworski Alek Kaplan Alexander Khaitan Harshit Koch Andy Kumar Naveen Lacy Steve Laudon James Law James Le Diemthu Leary Chris Liu Zhuyuan Lucke Kyle Lundin Alan MacKean Gordon Maggiore Adriana Mahony Maire Miller Kieran Nagarajan Rahul Narayanaswami Ravi Ni Ray Nix Kathy Norrie Thomas Omernick Mark Penukonda Narayana Phelps Andy Ross Jonathan Ross Matt Salek Amir Samadiani Emad Severn Chris Sizikov Gregory Snelham Matthew Souter Jed Steinberg Dan Swing Andy Tan Mercedes Thorson Gregory Tian Bo Toma Horia Tuttle Erick Vasudevan Vijay Walter Richard Wang Walter Wilcox Eric Yoon Doe Hyun 26 chervnya 2017 In Datacenter Performance Analysis of a Tensor Processing Unit PDF Toronto Canada Procitovano 17 November 2017 Kennedy Patrick 22 serpnya 2017 Case Study on the Google TPU and GDDR5 from Hot Chips 29 Serve The Home Procitovano 23 serpnya 2017 Bright Peter 17 travnya 2017 Google brings 45 teraflops tensor flow processors to its compute cloud Ars Technica Procitovano 30 travnya 2017 Kennedy Patrick 17 travnya 2017 Google Cloud TPU Details Revealed Serve The Home Procitovano 30 travnya 2017 Frumusanu Andre 8 travnya 2018 Google I O Opening Keynote Live Blog Procitovano 9 travnya 2018 Feldman Michael 11 travnya 2018 Google Offers Glimpse of Third Generation TPU Processor Top 500 Procitovano 14 travnya 2018 Teich Paul 10 travnya 2018 Tearing Apart Google s TPU 3 0 AI Coprocessor The Next Platform Procitovano 14 travnya 2018 PosilannyaFoto chipu ta plati Google TPU Fotografiya platformi Google TPU v2 Fotografiya platformi Google TPU v3 Fotografiya modulya TPU v2 vid Google