P6 — суперскалярна суперконвеєрна мікроархітектура процесорів, яка розроблена компанією Intel і лежить в основі мікропроцесорів Pentium Pro, Pentium II, Pentium III, Celeron і Xeon. На відміну від x86-сумісних процесорів попередніх поколінь з CISC-ядром, процесори архітектури P6 мають RISC-ядро, що виконує складні інструкції x86 не безпосередньо, а попередньо декодуючи їх в прості внутрішні [en].
Роки виробництва: | з 1 листопада 1995 по 2003 |
---|---|
Розробник: | Intel |
Макс. частота CPU: | 150 МГц – 1,4 ГГц |
Частота FSB: | 60 МГц – 133 МГц |
Техпроцес: | 500 нм – 130 нм |
Набір команд: | x86 |
Мікроархітектура: | P6 |
Ядра: | 1 |
Кеш L1: | 16 — 32 КБ |
Кеш L2: | 128 КБ — 2048 КБ |
Попередник: | Pentium |
Наступник: | NetBurst, Pentium M |
Роз'єм(и): | |
Розширення |
Першим процесором архітектури P6 став анонсований 1 листопада 1995 процесор Pentium Pro, націлений на ринок робочих станцій і серверів. Процесори Pentium Pro випускалися паралельно з процесорами архітектури P5 (Pentium і Pentium MMX), призначеними для персональних комп'ютерів. 7 травня 1997 компанією Intel був анонсований процесор Pentium II, що прийшов на зміну процесорам архітектури P5.
У 2000 році на зміну архітектурі P6 на ринку настільних і серверних процесорів прийшла архітектура NetBurst, однак архітектура P6 отримала свій розвиток в мобільних процесорах Pentium M і Core. У 2006 році на зміну процесорам архітектури NetBurst прийшли процесори сімейства Core 2 Duo, архітектура яких також являє собою розвиток архітектури P6.
Функціональна схема
Процесори архітектури P6 складаються з чотирьох основних підсистем:
- Підсистема впорядкованої попередньої обробки (англ. In-Order Front End, IOFE) — відповідає за вибірку і декодування інструкцій в порядку, передбаченому програмою, і передбачує переходи.
- Ядро виконання зі зміною послідовності (англ. Out-of-Order Core, O2C) — відповідає за виконання мікрооперацій в оптимальному порядку і організовує взаємодію виконавчих пристроїв.
- Підсистема упорядкованого завершення (англ. In-Order Retirement, IOR) — видає результати виконання в порядку, передбаченому програмою.
- Підсистема пам'яті (англ. memory subsystem) — забезпечує взаємодію процесора з оперативною пам'яттю.
- Підсистема впорядкованої попередньої обробки
До пристроїв цієї підсистеми відносяться:
- Модуль і буфер передбачення переходів (Branch Target Buffer, BTB) — передбачають переходи і зберігають таблицю історії переходів. Для передбачення використовуються як динамічний, так і статичний методи. Останній використовується в тому випадку, якщо динамічне передбачення неможливе (у таблиці переходів відсутня необхідна інформація).
- Декодер інструкцій (Instruction Decoder) — перетворює CISC-інструкції x86 в послідовність RISC-мікрооперацій, виконуваних процесором. Включає два декодера простих інструкцій (Simple), що обробляють команди, які можуть бути виконані однією мікрооперацією, і декодер складних інструкцій (Complex), який обробляє команди, для яких потрібно кілька (до чотирьох) мікрооперацій.
- Планувальник послідовностей мікрооперацій (Microcode sequencer) — зберігає послідовності мікрооперацій, використовуваних при декодуванні складних інструкцій x86, що вимагають більше чотирьох мікрооперацій.
- Блок обчислення адреси наступної інструкції (Next IP Unit) — обчислює адресу інструкції (англ. instruction pointer, IP), яка повинна бути оброблена наступною, на підставі інформації про переривання і таблиці переходів.
- Блок вибірки інструкцій (Instruction Fetch Unit, IFU) — здійснює вибірку інструкцій з пам'яті за адресами, підготовленим блоком обчислення адреси наступної інструкції.
Процесори на ядрі Tualatin додатково містять блок передвибірки інструкцій (Prefetcher), який здійснює попередню вибірку інструкцій на підставі таблиці переходів.
- Ядро виконання зі зміною послідовності
Виконання зі зміною послідовності, при якому змінюється черговість виконання інструкцій, так, щоб це не призводило до зміни результату, дозволяє прискорити роботу за рахунок більш оптимального розподілу запитів до допоміжних блоків і мінімізації їх простоїв. До пристроїв організації виконання зі зміною послідовності відносяться:
- Таблиця призначення регістрів (Register Alias Table) — задає відповідність між регістрами архітектури x86/IA32 (Intel Architecture 32-bit) і внутрішніми регістрами, використовуваними при виконанні мікрооперацій.
- Буфер переупорядкування мікрооперацій (Reorder Buffer) — забезпечує виконання мікрооперацій в оптимальною з точки зору продуктивності послідовності.
- Станція-резервуар (Reservation Station) — містить інструкції, що відправляються на виконавчі пристрої.
До виконавчих пристроїв ядра відносяться:
- Арифметично-логічні пристрої, ALU (Arithmetic Logic Unit, ALU) — виконують цілочисельні операції.
- Блок арифметики з рухомою комою (Floating Point Unit, FPU) — виконує операції над числами з рухомою комою. Процесори Pentium III і вище мають також блок, який здійснює виконання інструкцій SSE (SIMD FPU).
- Блок генерації адрес (Address Generation Unit, AGU) — обчислює адреси даних, використовуваних інструкціями, і формує запити до кешу для завантаження/розвантаження цих даних.
- Підсистема упорядкованого завершення
- Регістровий файл (Register File) — зберігає результати операцій (стан регістрів IA32 для виконуваних інструкцій).
- Буфер переупорядкування пам'яті (Memory Reorder Buffer) — керує порядком запису даних в пам'ять для запобігання запису невірних даних через зміну порядку виконання інструкцій.
- Блок завершення (Retirement Unit) — видає результати виконання інструкцій в тій послідовності, в якій вони надійшли на виконання.
- Підсистема пам'яті
Об'єм (Кб) | Процесори |
---|---|
0 | Celeron Covington |
128 | Celeron (, ), Pentium III ((Coppermine) для консолі Xbox) |
256 | Pentium Pro, Pentium III (Coppermine, ), Xeon () |
512 | Pentium Pro, Pentium II, Pentium III (, ), Xeon (Drake, ) |
1024 | Pentium Pro, Xeon (Drake, Tanner) |
2048 | Xeon (Drake, Tanner, Cascades 2MB) |
Підсистема пам'яті здійснює взаємодію з оперативною пам'яттю. До цієї підсистеми відносяться:
- Кеш першого рівня для даних (Level 1 Data Cache, L1D) — пам'ять з малим часом доступу об'ємом 8 (для Pentium Pro) або 16 (для більш нових процесорів) кілобайт, призначена для зберігання даних.
- Кеш першого рівня для інструкцій (Level 1 Instruction Cache, L1I) — пам'ять з малим часом доступу об'ємом 8 (Pentium Pro) або 16 кілобайт, призначена для зберігання інструкцій.
- Кеш другого рівня (Level 2 Cache, L2). Пам'ять з малим часом доступу об'ємом 128, 256, 512, 1024 або 2048 кілобайт. Ширина шини L2 становить 64 або 256 (для процесорів на ядрі (Coppermine) і вище) біт. Процесори Celeron на ядрі Covington кешу другого рівня не мають.
- Блок шинного інтерфейсу (Bus Interface Unit) — керує системною шиною.
Виконання інструкції
Конвеєр складається з 12 стадій:
- IOFE (1-4) — визначення адреси інструкції та її вибірка.
- IOFE (4-6) — декодування.
- IOFE7 — перейменування регістрів.
- IOFE8 — запис мікрооперацій в станцію-резервуар.
- O2C1 — передача мікрооперацій зі станції-резервуара до виконавчих блоків.
- O2C2 — виконання мікрооперацій (один або кілька тактів).
- IOR (1-2) — завершення інструкції: запис результатів в регістри.
Виконання інструкції починається з її вибірки і декодування. Для цього з кеш-пам'яті інструкцій першого рівня за адресою з буфера передбачення переходів вибирається 64 байти (два рядки). З них 16 байт, починаючи із адреси з блоку обчислення адреси наступної інструкції, вирівнюються і передаються в декодер інструкцій, що перетворює інструкції x86 в мікрооперації. Якщо інструкції відповідає одна мікрооперація, декодування проводить один з декодерів простих інструкцій. Якщо інструкції відповідає дві, три або чотири мікрооперації, декодування проводить декодер складних інструкцій. Якщо ж інструкції відповідає більше число мікрооперацій, то вони формуються планувальником послідовностей мікрооперацій.
Після декодування інструкцій виконується перейменування регістрів, а мікрооперації і дані поміщаються в буфер — станцію резервування, звідки відповідно до оптимального порядку виконання і за умови визначеності необхідних для їх виконання операндів направляються на виконавчі блоки (максимум 5 інструкцій за такт). Статус виконання мікрооперацій і його результати зберігаються в буфері переупорядкування мікрооперацій, а так як результати виконання одних мікрооперацій можуть слугувати операндами інших, вони також поміщаються і в станцію резервування.
За результатами виконання мікрооперацій визначається їх готовність до відставки (англ. retirement). У разі готовності відбувається їх відставка в порядку, передбаченому програмою, під час якої здійснюється оновлення стану логічних регістрів, а також відкладене збереження результатів в пам'яті (управління порядком запису даних здійснює буфер переупорядкування пам'яті).
Особливості архітектури
Перші процесори архітектури P6 в момент виходу значно відрізнялися від існуючих процесорів. Процесор Pentium Pro відрізняло застосування технології динамічного виконання (зміни порядку виконання інструкцій), а також архітектура подвійної незалежної шини (англ. Dual Independent Bus), завдяки чому було знято багато обмежень на пропускну здатність пам'яті, характерні для попередників і конкурентів. Тактова частота першого процесора архітектури P6 становила 150 МГц, а (останні представники) цієї архітектури мали тактову частоту 1,4 ГГц. Процесори архітектури P6 мали 36-розрядну шину адреси, що дозволило їм адресувати до 64 ГБ пам'яті (при цьому лінійний адресний простір процесу обмежено 4 ГБ, див. PAE).
Суперскалярний механізм виконання інструкцій зі зміною їх послідовності
Принциповою відмінністю архітектури P6 від попередників є RISC-ядро, яке працює не з інструкціями x86, а з простими внутрішніми мікроопераціями. Це дозволяє зняти безліч обмежень набору команд x86, таких як нерегулярне кодування команд, змінна довжина операндів і операції цілочислових пересилань регістр-пам'ять. Крім того, мікрооперації виконуються не в тій послідовності, яка передбачена програмою, а в оптимальною з точки зору продуктивності, а застосування триконвеєрної обробки дозволяє виконувати декілька інструкцій за один такт.
'Суперконвейерізація'
Процесори архітектури P6 мають конвеєр глибиною 12 стадій. Це дозволяє досягати вищих тактових частот в порівнянні з процесорами, що мають більш короткий конвеєр при однаковій технології виробництва. Так, наприклад, максимальна тактова частота процесорів AMD K6 на ядрі (глибина конвеєра — 6 стадій, 180 нм. Технологія) становить 550 МГц, а процесори Pentium III на ядрі Coppermine здатні працювати на частоті, що перевищує 1000 МГц.
Для того, щоб запобігти ситуації очікування виконання інструкції (і, отже, простою конвеєра), від результатів якого залежить виконання або невиконання умовного переходу, в процесорах архітектури P6 використовується передбачення розгалужень. Для цього в процесорах архітектури P6 використовується поєднання статичного і динамічного передбачення: дворівневий адаптивний історичний алгоритм (англ. Bimodal branch prediction) застосовується в тому випадку, якщо буфер передбачення розгалужень містить історію переходів, в іншому випадку застосовується статичний алгоритм
Подвійна незалежна шина
З метою збільшення пропускної спроможності підсистеми пам'яті, в процесорах архітектури P6 застосовується подвійна незалежна шина. На відміну від попередніх процесорів, системна шина яких була спільною для декількох пристроїв, процесори архітектури P6 мають дві роздільні шини: Back-side bus, що сполучає процесор з кеш-пам'яттю другого рівня, і Front side bus, що сполучає процесор з північним мостом набору мікросхем.
Переваги
Процесори архітектури P6 мали конвеєризований математичний співпроцесор (FPU), що дозволив досягти переваги над попередниками і конкурентами у швидкості дійсночисельних обчислень. FPU процесорів архітектури P6 залишався найкращим серед конкурентів до появи в 1999 році процесора AMD Athlon.
Крім того, процесори архітектури P6 мали перевагу над конкурентами і в швидкості роботи з кеш-пам'яттю другого рівня. Pentium Pro і Pentium II мали подвійну незалежну шину, в той час як конкуруючі процесори (AMD K5, K6, , M-II) — традиційну системну шину до якої підключався, в тому числі, і кеш другого рівня. З появою процесорів Athlon, які також використовують архітектуру з подвійною незалежною шиною, розрив у продуктивності скоротився, але 256-розрядна BSB процесорів Pentium III (починаючи з ядра Coppermine) дозволяла утримувати перевагу у швидкості роботи з кеш-пам'яттю другого рівня над процесорами архітектури K7, що мали 64-розрядну BSB. Однак, застаріла на той момент системна шина процесорів архітектури P6 у поєднанні з великим об'ємом кеш-пам'яті першого рівня у процесорів архітектури K7 не дозволяла отримати перевагу в пропускній здатності пам'яті.
Недоліки
Основним недоліком перших процесорів архітектури P6 (Pentium Pro) була низька продуктивність при роботі з широко поширеним в той час 16-розрядним програмним забезпеченням. Це було пов'язано з тим, що при роботі з такими додатками позачергове виконання інструкцій було ускладнено (так, наприклад, процесор Pentium Pro не міг виконати читання з 32-бітного регістра, якщо до цього був виконаний запис у його 16-бітну молодшу частину, а команда, що виконала запис, не була відставлена ). У процесорі Pentium II цей недолік був виправлений, що призвело до збільшення продуктивності при роботі з 16-розрядними програмами більш ніж на третину.
Процесори архітектури P6 підтримували роботу в багатопроцесорних системах, однак при цьому використовувалася колективна системна шина, що дозволяло спростити трасування системних плат, однак негативно позначалося на продуктивності підсистеми процесор-пам'ять і обмежувало максимальну кількість процесорів в системі.
Процесори архітектури P6
Процесор | Ядро | Технологія виготовлення | Роки випуску |
---|---|---|---|
Pentium Pro | P6 | КМОН/BiCMOS, 500—350 нм | 1995—1998 |
Pentium II | Klamath, Deschutes | КМОН, 350—250 нм | 1997—1999 |
Pentium III | Katmai, Coppermine, Tualatin-256 | КМОН, 250—130 нм | 1999—2002 |
Pentium III-S | Tualatin | КМОН, 130 нм | 2001—2002 |
Celeron | Covington, Mendocino, Coppermine-128, Tualatin-256 | КМОН, 250—130 нм | 1998—2002 |
Pentium II Xeon | Drake | КМОН, 250 нм | 1998—1999 |
Pentium III Xeon | Tanner, Cascades, Cascades 2MB | КМОН, 250—180 нм | 1999—2001 |
Pentium Pro (P6) | Pentium II (Deschutes) | Pentium III (Coppermine) | Pentium IIIS (Tualatin) |
---|---|---|---|
Pentium III Mobile | Celeron (Mendocino) | Celeron (Mendocino) | Celeron (Coppermine-128) |
Схема розвитку архітектур Intel
Посилання
Офіційна інформація
- = Офіційна база даних по процесорах Pentium II (англ.)
- Документація по процесорах Pentium II [ 21 квітня 2013 у Wayback Machine.] (англ.)
- Документація по процесорах Mobile Pentium II [ 10 березня 2010 у Wayback Machine.]
- = Офіційна база даних по процесорах Pentium III (англ.)
- Документація по процесорах Pentium III [ 17 квітня 2010 у Wayback Machine.] (англ.)
- Документація по процесорах Mobile Pentium III [ 1 березня 2010 у Wayback Machine.] (англ.)
Характеристики процесорів архітектури P6
- (англ.)
- (англ.)
- Характеристики процесорів Pentium II (англ.)
- (англ.)
Огляди процесорів
- Pentium Pro: Продуктивність в іграх [ 4 квітня 2013 у Wayback Machine.]
- Процесор Celeron [ 4 квітня 2013 у Wayback Machine.]
- Огляд процесора Intel Pentium III 500 МГц [ 2 липня 2013 у Wayback Machine.]
- Mendocino: процесори Celeron 300A і 333 [ 4 квітня 2013 у Wayback Machine.]
- Огляд процесорів Intel Pentium III 600E і 600EB з ядром Coppermine [ 2 липня 2013 у Wayback Machine.]
Примітки
- На відміну від процесора Celeron на ядрі Coppermine-128, який має 4-канальний асоціативний кеш другого рівня, у цього процесора кеш 8-канальний. Див.: «Світ ігрових консолей. Частина п'ята», журнал Upgrade, 2007, № 28 (325), стр. 24
- Jon Stokes (11 липня 2004). The Pentium: An Architectural History of the World's Most Famous Desktop Processor (Part I) (англ.). Ars Technica. Архів оригіналу за 28 січня 2012. Процитовано 19 серпня 2008.
- . Архів оригіналу за 2 липня 2013. Процитовано 7 червня 2013.
- . Архів оригіналу за 4 січня 2012. Процитовано 28 квітня 2022.
- . Архів оригіналу за 2 липня 2013. Процитовано 7 червня 2013.
- . Архів оригіналу за 4 квітня 2013. Процитовано 7 червня 2013.
- Шина PCI (Peripheral Component Interconnect bus) [ 4 квітня 2013 у Wayback Machine.] — див. схему
- com/cpu/1000-p3-vs-tb.html Процесори з частотою 1000 МГц[недоступне посилання з червня 2019]
- Максим Лінь: «АРХІТЕКТУРА Р6: СПАДЩИНА ПОКОЛІНЬ» (опублікована на сайті fcenter.ru 22 листопада 2000) — збережена копія[недоступне посилання з лютого 2019]
- історія продовжується
- . Архів оригіналу за 23 лютого 2009. Процитовано 28 квітня 2022.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
P6 superskalyarna superkonveyerna mikroarhitektura procesoriv yaka rozroblena kompaniyeyu Intel i lezhit v osnovi mikroprocesoriv Pentium Pro Pentium II Pentium III Celeron i Xeon Na vidminu vid x86 sumisnih procesoriv poperednih pokolin z CISC yadrom procesori arhitekturi P6 mayut RISC yadro sho vikonuye skladni instrukciyi x86 ne bezposeredno a poperedno dekoduyuchi yih v prosti vnutrishni en Intel P6Roki virobnictva z 1 listopada 1995 po 2003Rozrobnik IntelMaks chastota CPU 150 MGc 1 4 GGcChastota FSB 60 MGc 133 MGcTehproces 500 nm 130 nmNabir komand x86Mikroarhitektura P6Yadra 1Kesh L1 16 32 KBKesh L2 128 KB 2048 KBPoperednik PentiumNastupnik NetBurst Pentium MRoz yem i Socket 8 Pentium Pro Slot 1Socket 370Socket 479Rozshirennya MMX SSE Pershim procesorom arhitekturi P6 stav anonsovanij 1 listopada 1995 procesor Pentium Pro nacilenij na rinok robochih stancij i serveriv Procesori Pentium Pro vipuskalisya paralelno z procesorami arhitekturi P5 Pentium i Pentium MMX priznachenimi dlya personalnih komp yuteriv 7 travnya 1997 kompaniyeyu Intel buv anonsovanij procesor Pentium II sho prijshov na zminu procesoram arhitekturi P5 U 2000 roci na zminu arhitekturi P6 na rinku nastilnih i servernih procesoriv prijshla arhitektura NetBurst odnak arhitektura P6 otrimala svij rozvitok v mobilnih procesorah Pentium M i Core U 2006 roci na zminu procesoram arhitekturi NetBurst prijshli procesori simejstva Core 2 Duo arhitektura yakih takozh yavlyaye soboyu rozvitok arhitekturi P6 Funkcionalna shemaFunkcionalna shema procesora Pentium III na yadri Coppermine Procesori arhitekturi P6 skladayutsya z chotiroh osnovnih pidsistem Pidsistema vporyadkovanoyi poperednoyi obrobki angl In Order Front End IOFE vidpovidaye za vibirku i dekoduvannya instrukcij v poryadku peredbachenomu programoyu i peredbachuye perehodi Yadro vikonannya zi zminoyu poslidovnosti angl Out of Order Core O2C vidpovidaye za vikonannya mikrooperacij v optimalnomu poryadku i organizovuye vzayemodiyu vikonavchih pristroyiv Pidsistema uporyadkovanogo zavershennya angl In Order Retirement IOR vidaye rezultati vikonannya v poryadku peredbachenomu programoyu Pidsistema pam yati angl memory subsystem zabezpechuye vzayemodiyu procesora z operativnoyu pam yattyu Pidsistema vporyadkovanoyi poperednoyi obrobki Do pristroyiv ciyeyi pidsistemi vidnosyatsya Modul i bufer peredbachennya perehodiv Branch Target Buffer BTB peredbachayut perehodi i zberigayut tablicyu istoriyi perehodiv Dlya peredbachennya vikoristovuyutsya yak dinamichnij tak i statichnij metodi Ostannij vikoristovuyetsya v tomu vipadku yaksho dinamichne peredbachennya nemozhlive u tablici perehodiv vidsutnya neobhidna informaciya Dekoder instrukcij Instruction Decoder peretvoryuye CISC instrukciyi x86 v poslidovnist RISC mikrooperacij vikonuvanih procesorom Vklyuchaye dva dekodera prostih instrukcij Simple sho obroblyayut komandi yaki mozhut buti vikonani odniyeyu mikrooperaciyeyu i dekoder skladnih instrukcij Complex yakij obroblyaye komandi dlya yakih potribno kilka do chotiroh mikrooperacij Planuvalnik poslidovnostej mikrooperacij Microcode sequencer zberigaye poslidovnosti mikrooperacij vikoristovuvanih pri dekoduvanni skladnih instrukcij x86 sho vimagayut bilshe chotiroh mikrooperacij Blok obchislennya adresi nastupnoyi instrukciyi Next IP Unit obchislyuye adresu instrukciyi angl instruction pointer IP yaka povinna buti obroblena nastupnoyu na pidstavi informaciyi pro pererivannya i tablici perehodiv Blok vibirki instrukcij Instruction Fetch Unit IFU zdijsnyuye vibirku instrukcij z pam yati za adresami pidgotovlenim blokom obchislennya adresi nastupnoyi instrukciyi Procesori na yadri Tualatin dodatkovo mistyat blok peredvibirki instrukcij Prefetcher yakij zdijsnyuye poperednyu vibirku instrukcij na pidstavi tablici perehodiv Yadro vikonannya zi zminoyu poslidovnosti Vikonannya zi zminoyu poslidovnosti pri yakomu zminyuyetsya chergovist vikonannya instrukcij tak shob ce ne prizvodilo do zmini rezultatu dozvolyaye priskoriti robotu za rahunok bilsh optimalnogo rozpodilu zapitiv do dopomizhnih blokiv i minimizaciyi yih prostoyiv Do pristroyiv organizaciyi vikonannya zi zminoyu poslidovnosti vidnosyatsya Tablicya priznachennya registriv Register Alias Table zadaye vidpovidnist mizh registrami arhitekturi x86 IA32 Intel Architecture 32 bit i vnutrishnimi registrami vikoristovuvanimi pri vikonanni mikrooperacij Bufer pereuporyadkuvannya mikrooperacij Reorder Buffer zabezpechuye vikonannya mikrooperacij v optimalnoyu z tochki zoru produktivnosti poslidovnosti Stanciya rezervuar Reservation Station mistit instrukciyi sho vidpravlyayutsya na vikonavchi pristroyi Do vikonavchih pristroyiv yadra vidnosyatsya Arifmetichno logichni pristroyi ALU Arithmetic Logic Unit ALU vikonuyut cilochiselni operaciyi Blok arifmetiki z ruhomoyu komoyu Floating Point Unit FPU vikonuye operaciyi nad chislami z ruhomoyu komoyu Procesori Pentium III i vishe mayut takozh blok yakij zdijsnyuye vikonannya instrukcij SSE SIMD FPU Blok generaciyi adres Address Generation Unit AGU obchislyuye adresi danih vikoristovuvanih instrukciyami i formuye zapiti do keshu dlya zavantazhennya rozvantazhennya cih danih Pidsistema uporyadkovanogo zavershennya Registrovij fajl Register File zberigaye rezultati operacij stan registriv IA32 dlya vikonuvanih instrukcij Bufer pereuporyadkuvannya pam yati Memory Reorder Buffer keruye poryadkom zapisu danih v pam yat dlya zapobigannya zapisu nevirnih danih cherez zminu poryadku vikonannya instrukcij Blok zavershennya Retirement Unit vidaye rezultati vikonannya instrukcij v tij poslidovnosti v yakij voni nadijshli na vikonannya Pidsistema pam yati Ob yem L2 procesoriv arhitekturi P6 Ob yem Kb Procesori 0 Celeron Covington 128 Celeron Pentium III Coppermine dlya konsoli Xbox 256 Pentium Pro Pentium III Coppermine Xeon 512 Pentium Pro Pentium II Pentium III Xeon Drake 1024 Pentium Pro Xeon Drake Tanner 2048 Xeon Drake Tanner Cascades 2MB Pidsistema pam yati zdijsnyuye vzayemodiyu z operativnoyu pam yattyu Do ciyeyi pidsistemi vidnosyatsya Kesh pershogo rivnya dlya danih Level 1 Data Cache L1D pam yat z malim chasom dostupu ob yemom 8 dlya Pentium Pro abo 16 dlya bilsh novih procesoriv kilobajt priznachena dlya zberigannya danih Kesh pershogo rivnya dlya instrukcij Level 1 Instruction Cache L1I pam yat z malim chasom dostupu ob yemom 8 Pentium Pro abo 16 kilobajt priznachena dlya zberigannya instrukcij Kesh drugogo rivnya Level 2 Cache L2 Pam yat z malim chasom dostupu ob yemom 128 256 512 1024 abo 2048 kilobajt Shirina shini L2 stanovit 64 abo 256 dlya procesoriv na yadri Coppermine i vishe bit Procesori Celeron na yadri Covington keshu drugogo rivnya ne mayut Blok shinnogo interfejsu Bus Interface Unit keruye sistemnoyu shinoyu Vikonannya instrukciyiKonveyer procesora Pentium Pro Konveyer skladayetsya z 12 stadij IOFE 1 4 viznachennya adresi instrukciyi ta yiyi vibirka IOFE 4 6 dekoduvannya IOFE7 perejmenuvannya registriv IOFE8 zapis mikrooperacij v stanciyu rezervuar O2C1 peredacha mikrooperacij zi stanciyi rezervuara do vikonavchih blokiv O2C2 vikonannya mikrooperacij odin abo kilka taktiv IOR 1 2 zavershennya instrukciyi zapis rezultativ v registri Vikonannya instrukciyi pochinayetsya z yiyi vibirki i dekoduvannya Dlya cogo z kesh pam yati instrukcij pershogo rivnya za adresoyu z bufera peredbachennya perehodiv vibirayetsya 64 bajti dva ryadki Z nih 16 bajt pochinayuchi iz adresi z bloku obchislennya adresi nastupnoyi instrukciyi virivnyuyutsya i peredayutsya v dekoder instrukcij sho peretvoryuye instrukciyi x86 v mikrooperaciyi Yaksho instrukciyi vidpovidaye odna mikrooperaciya dekoduvannya provodit odin z dekoderiv prostih instrukcij Yaksho instrukciyi vidpovidaye dvi tri abo chotiri mikrooperaciyi dekoduvannya provodit dekoder skladnih instrukcij Yaksho zh instrukciyi vidpovidaye bilshe chislo mikrooperacij to voni formuyutsya planuvalnikom poslidovnostej mikrooperacij Pislya dekoduvannya instrukcij vikonuyetsya perejmenuvannya registriv a mikrooperaciyi i dani pomishayutsya v bufer stanciyu rezervuvannya zvidki vidpovidno do optimalnogo poryadku vikonannya i za umovi viznachenosti neobhidnih dlya yih vikonannya operandiv napravlyayutsya na vikonavchi bloki maksimum 5 instrukcij za takt Status vikonannya mikrooperacij i jogo rezultati zberigayutsya v buferi pereuporyadkuvannya mikrooperacij a tak yak rezultati vikonannya odnih mikrooperacij mozhut sluguvati operandami inshih voni takozh pomishayutsya i v stanciyu rezervuvannya Za rezultatami vikonannya mikrooperacij viznachayetsya yih gotovnist do vidstavki angl retirement U razi gotovnosti vidbuvayetsya yih vidstavka v poryadku peredbachenomu programoyu pid chas yakoyi zdijsnyuyetsya onovlennya stanu logichnih registriv a takozh vidkladene zberezhennya rezultativ v pam yati upravlinnya poryadkom zapisu danih zdijsnyuye bufer pereuporyadkuvannya pam yati Osoblivosti arhitekturiPershi procesori arhitekturi P6 v moment vihodu znachno vidriznyalisya vid isnuyuchih procesoriv Procesor Pentium Pro vidriznyalo zastosuvannya tehnologiyi dinamichnogo vikonannya zmini poryadku vikonannya instrukcij a takozh arhitektura podvijnoyi nezalezhnoyi shini angl Dual Independent Bus zavdyaki chomu bulo znyato bagato obmezhen na propusknu zdatnist pam yati harakterni dlya poperednikiv i konkurentiv Taktova chastota pershogo procesora arhitekturi P6 stanovila 150 MGc a ostanni predstavniki ciyeyi arhitekturi mali taktovu chastotu 1 4 GGc Procesori arhitekturi P6 mali 36 rozryadnu shinu adresi sho dozvolilo yim adresuvati do 64 GB pam yati pri comu linijnij adresnij prostir procesu obmezheno 4 GB div PAE Superskalyarnij mehanizm vikonannya instrukcij zi zminoyu yih poslidovnosti Principovoyu vidminnistyu arhitekturi P6 vid poperednikiv ye RISC yadro yake pracyuye ne z instrukciyami x86 a z prostimi vnutrishnimi mikrooperaciyami Ce dozvolyaye znyati bezlich obmezhen naboru komand x86 takih yak neregulyarne koduvannya komand zminna dovzhina operandiv i operaciyi cilochislovih peresilan registr pam yat Krim togo mikrooperaciyi vikonuyutsya ne v tij poslidovnosti yaka peredbachena programoyu a v optimalnoyu z tochki zoru produktivnosti a zastosuvannya trikonveyernoyi obrobki dozvolyaye vikonuvati dekilka instrukcij za odin takt Superkonvejerizaciya Procesori arhitekturi P6 mayut konveyer glibinoyu 12 stadij Ce dozvolyaye dosyagati vishih taktovih chastot v porivnyanni z procesorami sho mayut bilsh korotkij konveyer pri odnakovij tehnologiyi virobnictva Tak napriklad maksimalna taktova chastota procesoriv AMD K6 na yadri glibina konveyera 6 stadij 180 nm Tehnologiya stanovit 550 MGc a procesori Pentium III na yadri Coppermine zdatni pracyuvati na chastoti sho perevishuye 1000 MGc Dlya togo shob zapobigti situaciyi ochikuvannya vikonannya instrukciyi i otzhe prostoyu konveyera vid rezultativ yakogo zalezhit vikonannya abo nevikonannya umovnogo perehodu v procesorah arhitekturi P6 vikoristovuyetsya peredbachennya rozgaluzhen Dlya cogo v procesorah arhitekturi P6 vikoristovuyetsya poyednannya statichnogo i dinamichnogo peredbachennya dvorivnevij adaptivnij istorichnij algoritm angl Bimodal branch prediction zastosovuyetsya v tomu vipadku yaksho bufer peredbachennya rozgaluzhen mistit istoriyu perehodiv v inshomu vipadku zastosovuyetsya statichnij algoritm Podvijna nezalezhna shina Z metoyu zbilshennya propusknoyi spromozhnosti pidsistemi pam yati v procesorah arhitekturi P6 zastosovuyetsya podvijna nezalezhna shina Na vidminu vid poperednih procesoriv sistemna shina yakih bula spilnoyu dlya dekilkoh pristroyiv procesori arhitekturi P6 mayut dvi rozdilni shini Back side bus sho spoluchaye procesor z kesh pam yattyu drugogo rivnya i Front side bus sho spoluchaye procesor z pivnichnim mostom naboru mikroshem Perevagi Procesori arhitekturi P6 mali konveyerizovanij matematichnij spivprocesor FPU sho dozvoliv dosyagti perevagi nad poperednikami i konkurentami u shvidkosti dijsnochiselnih obchislen FPU procesoriv arhitekturi P6 zalishavsya najkrashim sered konkurentiv do poyavi v 1999 roci procesora AMD Athlon Krim togo procesori arhitekturi P6 mali perevagu nad konkurentami i v shvidkosti roboti z kesh pam yattyu drugogo rivnya Pentium Pro i Pentium II mali podvijnu nezalezhnu shinu v toj chas yak konkuruyuchi procesori AMD K5 K6 M II tradicijnu sistemnu shinu do yakoyi pidklyuchavsya v tomu chisli i kesh drugogo rivnya Z poyavoyu procesoriv Athlon yaki takozh vikoristovuyut arhitekturu z podvijnoyu nezalezhnoyu shinoyu rozriv u produktivnosti skorotivsya ale 256 rozryadna BSB procesoriv Pentium III pochinayuchi z yadra Coppermine dozvolyala utrimuvati perevagu u shvidkosti roboti z kesh pam yattyu drugogo rivnya nad procesorami arhitekturi K7 sho mali 64 rozryadnu BSB Odnak zastarila na toj moment sistemna shina procesoriv arhitekturi P6 u poyednanni z velikim ob yemom kesh pam yati pershogo rivnya u procesoriv arhitekturi K7 ne dozvolyala otrimati perevagu v propusknij zdatnosti pam yati Nedoliki Osnovnim nedolikom pershih procesoriv arhitekturi P6 Pentium Pro bula nizka produktivnist pri roboti z shiroko poshirenim v toj chas 16 rozryadnim programnim zabezpechennyam Ce bulo pov yazano z tim sho pri roboti z takimi dodatkami pozachergove vikonannya instrukcij bulo uskladneno tak napriklad procesor Pentium Pro ne mig vikonati chitannya z 32 bitnogo registra yaksho do cogo buv vikonanij zapis u jogo 16 bitnu molodshu chastinu a komanda sho vikonala zapis ne bula vidstavlena U procesori Pentium II cej nedolik buv vipravlenij sho prizvelo do zbilshennya produktivnosti pri roboti z 16 rozryadnimi programami bilsh nizh na tretinu Procesori arhitekturi P6 pidtrimuvali robotu v bagatoprocesornih sistemah odnak pri comu vikoristovuvalasya kolektivna sistemna shina sho dozvolyalo sprostiti trasuvannya sistemnih plat odnak negativno poznachalosya na produktivnosti pidsistemi procesor pam yat i obmezhuvalo maksimalnu kilkist procesoriv v sistemi Procesori arhitekturi P6Procesor Yadro Tehnologiya vigotovlennya Roki vipusku Pentium Pro P6 KMON BiCMOS 500 350 nm 1995 1998 Pentium II Klamath Deschutes KMON 350 250 nm 1997 1999 Pentium III Katmai Coppermine Tualatin 256 KMON 250 130 nm 1999 2002 Pentium III S Tualatin KMON 130 nm 2001 2002 Celeron Covington Mendocino Coppermine 128 Tualatin 256 KMON 250 130 nm 1998 2002 Pentium II Xeon Drake KMON 250 nm 1998 1999 Pentium III Xeon Tanner Cascades Cascades 2MB KMON 250 180 nm 1999 2001 Pentium Pro P6 Pentium II Deschutes Pentium III Coppermine Pentium IIIS Tualatin Pentium III Mobile Celeron Mendocino Celeron Mendocino Celeron Coppermine 128 Shema rozvitku arhitektur IntelRozvitok mikroarhitektur procesoriv Intel pochinayuchi z NetBurst i Intel P6 do SkylakePosilannyaOficijna informaciya Oficijna baza danih po procesorah Pentium II angl Dokumentaciya po procesorah Pentium II 21 kvitnya 2013 u Wayback Machine angl Dokumentaciya po procesorah Mobile Pentium II 10 bereznya 2010 u Wayback Machine Oficijna baza danih po procesorah Pentium III angl Dokumentaciya po procesorah Pentium III 17 kvitnya 2010 u Wayback Machine angl Dokumentaciya po procesorah Mobile Pentium III 1 bereznya 2010 u Wayback Machine angl Harakteristiki procesoriv arhitekturi P6 angl angl Harakteristiki procesoriv Pentium II angl angl Oglyadi procesoriv Pentium Pro Produktivnist v igrah 4 kvitnya 2013 u Wayback Machine Procesor Celeron 4 kvitnya 2013 u Wayback Machine Oglyad procesora Intel Pentium III 500 MGc 2 lipnya 2013 u Wayback Machine Mendocino procesori Celeron 300A i 333 4 kvitnya 2013 u Wayback Machine Oglyad procesoriv Intel Pentium III 600E i 600EB z yadrom Coppermine 2 lipnya 2013 u Wayback Machine PrimitkiNa vidminu vid procesora Celeron na yadri Coppermine 128 yakij maye 4 kanalnij asociativnij kesh drugogo rivnya u cogo procesora kesh 8 kanalnij Div Svit igrovih konsolej Chastina p yata zhurnal Upgrade 2007 28 325 str 24 Jon Stokes 11 lipnya 2004 The Pentium An Architectural History of the World s Most Famous Desktop Processor Part I angl Ars Technica Arhiv originalu za 28 sichnya 2012 Procitovano 19 serpnya 2008 Arhiv originalu za 2 lipnya 2013 Procitovano 7 chervnya 2013 Arhiv originalu za 4 sichnya 2012 Procitovano 28 kvitnya 2022 Arhiv originalu za 2 lipnya 2013 Procitovano 7 chervnya 2013 Arhiv originalu za 4 kvitnya 2013 Procitovano 7 chervnya 2013 Shina PCI Peripheral Component Interconnect bus 4 kvitnya 2013 u Wayback Machine div shemu com cpu 1000 p3 vs tb html Procesori z chastotoyu 1000 MGc nedostupne posilannya z chervnya 2019 Maksim Lin ARHITEKTURA R6 SPADShINA POKOLIN opublikovana na sajti fcenter ru 22 listopada 2000 zberezhena kopiya nedostupne posilannya z lyutogo 2019 istoriya prodovzhuyetsya Arhiv originalu za 23 lyutogo 2009 Procitovano 28 kvitnya 2022