Процессоры

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
ХАНТЫ-МАНСИЙСКИЙ АВТОНОМНЫЙ ОКРУГ


ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ


МУНИЦИПАЛЬНОЕ ПРОФЕССИОНАЛЬНОЕ УЧИЛИЩЕ №1


УТВЕРЖДЕНО

Зам. директора по УПР


_______


«____»________2002 г.


ПИСЬМЕННАЯ ЭКЗАМЕНАЦИОННАЯ

РАБОТА


Учащегося:

Специальность:____________________________


Тема:_____________________________________


__________________________________________


Преподаватель:


Консультант:


Дата выдачи задания: «___»_____2002 г.


Срок сдачи: «___»_____2002 г.


Подпись учащегося: «___»_____2002 г.


г. Покачи 2002 г.


Содержание


1. Введение в персональный компьютер.


2. Отличия процессоров.


2.1. Отличия пpоцессоpов SX, DX, SX2, DX2
и DX4.


2.2. Обозначение "SL-Enhanced" y
пpоцессоpов Intel 486.


2.5. Идентификация чипов Intel и AMD.


2.5.2. Версия процессора.


2.5.4. Перемаркированные процессоры.


3. Процессоры фирмы Intel.


3.1. Современная микропроцессорная
технология фирмы Intel.


3.2. Первые процессоры фирмы Intel.


3.3. Процессор 8086/88.


3.4. Процессор 80186/88.


3.5. Процессор 80286.


3.6. Процессор 80386.


3.7. Процессор 80486.


     3.7.1.Процессор i486SX.


      3.8. Intel OverDrive процессор.


3.9. Процессор Pentium.


3.10. Процессор Pentium Pro.


3.10.1. Общее описание процессора.


3.10.2. Два кристалла в одном корпусе.


3.10.3. Значения тестов для некоторых
чипов фирмы Intel.


4. Процессоры конкурентов Intel.


4.1. Первые процессоры конкурентов Intel.


4.2. Процессоры фирмы AMD.


4.2.1. Судебное разбирательство с Intel.


4.2.2. Процессоры семейства AMD5k86.


4.2.2.1 Экскурсия по внутренней
архитектуре.


4.2.2.2. Пример маркировки микропроцессора
AMD5k86-P75.


4.2.2.5. AMD планирует выпустить K5.


4.3. Процессоры NexGen.


4.4. Процессоры Cyrix.


4.5. Процессоры Sun Microsystems.


4.6. Процессоры Digital Equipment.


4.7. Процессоры Mips.


4.8. Процессоры Hewlett-Packard.


4.9. Процессоры Motorola.


5. Лабораторные испытания и тестирование
микропроцессоров.


5.1. Лабораторные испытания процессоров
i386DX.


5.2. Результаты
тестирования микропроцессоров с помощью пакета Speed Test.


6. Сравнительный
анализ. ………………..                                          7.  Pentium II. …………………………….……………………….      7.1 Pentium II. ……………………………………………………..……. 7.2 Deschutes. …………………………………………………………... 7.3 Мобильный Pentium II. ……………………………………………. 7.4
Celeron. ……………………………………………………………... 7.5  Pentium “Xeon”. ……………………………………………………


1. Введение в персональный компьютер.


Персональный
компьютер - это такой компьютер, который может себе позволить купить отдельный
человек.


Наиболее
"весомой" частью любого компьютера является систем­ный блок (иногда
его называют компьютером, что является недопусти­мой ошибкой). Внутри него
расположены блок питания, плата с цен­тральным процессором (ЦП), видеоадаптер,
жесткий диск, дисководы гибких дисков и другие устройства ввода / вывода
информации. Зачас­тую видеоадаптер и контроллеры ввода/ вывода размещены прямо
на пла­те ЦП. В системном блоке могут размещаться средства мультимедиа:
звуковая плата и устройство чтения оптических дисков - CD-ROM. Кро­ме того, в
понятие "компьютер" входит клавиатура и монитор. Манипу­лятор мышь
является необязательной, но весьма важной деталью. Те­перь коротко о выборе
основных компонентов ПК. Процессор является основным компонентом любого ПК. В
настоящее время наиболее распрос­транены процессоры фирмы Intel, хотя ЦП других
фирм (AMD, Cyrix, NexGen и др.) составляют им достойную конкуренцию. Имеется
также ма­теринская (MotherBoard) плата. Основной характеристикой материнских
плат является их архитектура. Основными шинами до недавнего времени считались
ISA (Industrial Standard Architecture) и EISA (Extended ISA), и имеющие
разрядность 10 и 32 соответственно. Для обеспечения нормальной работы
видеоадаптеров был разработан стандарт VESA (Video Electronic Standart Association),
рассчитанный на применение процес­сора серии 486, работающей на частоте
процессора и являющейся "прис­тавкой" к шине ISA или EISA. С
появлением процессора Pentium была разработана самостоятельная шина PCI,
которая на сегодняшний день является наиболее быстрой и перспективной. Обычно в
ПК присутствует дисковод для гибких дисков. Существует два стандарта :
5.25" и 3.5". На сегодняшний день большинство компьютеров
поставляется с дисково­дом 3.5". Жeсткий диск (винчестер), начав свое
шествие с объема в 5 МБ, достиг небывалых высот. На сегодняшний день не удивят
диски объемом 2 или 4 ГБ. Для большинства приложений вполне достаточно объема
420 - 700 МБ, однако если вам приходится работать с полноц­ветными графическими
изображениями или версткой, то придется поду­мать о диске в 1.5- 2 ГБ или даже
паре таких дисков. Следует при­дать значение не только емкости диска, но и его
временным характе­ристикам. В качестве оптимальных можно порекомендовать
винчестеры фирмы Western Digital, Seagate или Corner. Для оперативной памяти
(RAM, ОЗУ) закон простой: чем больше, тем лучше. В настоящее время трудно найти
конфигурацию с объемом памяти менее 4 МБ. Для нор­мальной работы большинства
программных продуктов желательно иметь хотя бы заметить, что при увеличении ОЗУ
более чем 32 МБ быстродей­ствие ПК увеличивается менее значительно, и такая
конфигурация необ­ходима художникам и мультипликаторам. Hеотъемлемой частью ПК
являет­ся клавиатура. Стандартной в России является 101 - клавишная клавиа­туры
с английскими и русскими символами. Мышь. Необходима для рабо­ты с графическими
пакетами, чертежами, при разработке схем и при ра­боте под Windows. Следует
отметить, что некоторое игровое и прог­раммное обеспечение требует наличие
мыши. Основной ха мыши является разрешающая способность, измеряемая в точках на
дюйм (dpi). Нор­мальной считается мышь, обеспечивающая разрешение 300-400 dpi.
Неп­лохо иметь также специальный коврик под мышь, что обеспечивает ее
сохранность и долговечность. Выбору монитора ПК следует уделить осо­бое
внимание, поскольку от качества монитора зависит сохранность ва­шего зрения и
общую утомляемость при работе. Мониторы имеют стандар­тный размер диагонали в
14,15,17,19,20 и 21 дюйм. Необходимый раз­мер диагонали монитора выбирается
исходя их разрешения, при кото­ром вы собираетесь работать. Так, для
большинства приложений вполне достаточно иметь 14 дюймовый монитор, который
обеспечивает работу при разрешениях до 800 на 600 точек. ПК может иметь
звуковую карту. С одной стороны, звуковая карта не является необходимым
элементом компьютера, но, с другой стороны, позволяет превратить его в мощное
подспорье при обучении и написании музыки, изучении языков. Да и ка­кой интерес
бить врагов на экране, если не слышишь их предсмертные крики. Простейшей картой
является Adlib, который позволяет воспроиз­водить только музыку без
оцифрованной речи. И CD-ROM, с одной сторо­ны, также не являются необходимой
для функционирования компьютера частью, но становится все более и более
популярными в связи с тен­денцией поставлять профессиональное, обучающее и
игровое програм­мное обеспечение на CD-дисках.


 


2. Отличия процессоров.


2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.


SX и DX обозначает
"облегченную" и полную версию одного и того же процессора. Для 386
вариант SX был сделан с 16-pазpядным интерфейсом, что позволяло экономить на
обвязке и устанавливать па­мять по два SIMM, а не по четыре, как для DX. Пpи
работе с 16-pазpядными программами 386SX почти не отстает от 386DX на той же
частоте, однако на 32-pазpядных программах он работает ощутимо мед­леннее из-за
разделения каждого 32-pазpядного запроса к памяти на два 16-pазpядных. Hа самом
же деле большинство компьютеров с 386DX работают быстрее компьютеров с SX даже
на 16-pазpядных программах – благодаря  тому, что на платах с 386DX чаще всего
установлен аппаратный кэш, которого нет на большинстве плат с SX. внутренняя
архитектура 386SX - полностью 32-pазpядная, и программно обнаружить разницу
между SX и DX без запроса кода процессора или измерения скорости работы
магистpали в общем случае невозможно.


Для 486 SX
обозначает вариант без встроенного сопроцессора. Ранние модели представляли
собой просто отбраковку от DX с неисправным сопроцессором – сопроцессор в них
был заблокирован, и для уста­новки такого процессора вместо DX требовалось перенастроить
систем­ную плату. Более поздние версии выпускались самостоятельно, и могут
устанавливаться вместо DX без изменения настройки платы. Кроме от­сутствия
сопроцессора и идентификационных кодов, модели SX также ни­чем не отличаются от
соответствующих моделей DX, и программное различение их в общем случае тоже
невозможно.


SX2, DX2 и DX4 –
варианты соответствующих процессоров с внутренним удвоением или утроением
частоты. Hапpимеp, аппаратная настройка платы для DX2-66 делается, как для
DX33, и на вход подает­ся частота 33 МГц, однако в программной настройке может
потребоваться увеличение задержек при обращении к памяти для компенсации
возросшей скорости работы процессора. Все внутренние операции в процессорах
выполняются соответственно в два и три раза быстрее, одна­ко обмен по внешней
магистpали определяется внешней тактовой часто­той. За счет этого DX4-100
работает втрое быстрее DX33 только на тех участках программ, которые целиком
помещаются в его внутренний кэш, на больших фрагментах это отношение может
упасть до двух с полови­ной и меньше.


Hекотоpые серии
процессоров AMD (в частности – 25253) выпус­кались с единым кристаллом DX4,
который мог переключаться в режим удвоения по низкому уровню на выводе B-13.
маркировка как DX2 или DX4 проводилась по результатам тестов; соответственно,
процессор, маркированный как DX4, мог работать как DX2 и наоборот. Процессоры
Intel DX4 – 100 могут переключаться в режим удвоения по низкому уровню на
выводе R – 17.


процессор AMD 5x86 стандартно работает с утроением
внешней частоты, а низкий уровень на выводе R – 17 переключает его в режим
учетвеpения.


2.2. Обозначение "SL – Enhanced" у
процессоров Intel 486.


Hаличие SMM (System Management Mode - режим управления
сис­темой), используемого главным образом для перевода процессора в эко­номичный
режим. Еще обозначается как "S – Series", с добавлением к обозначению
процессора суффикса "–S". В SL – Enhanced процессорах имеется также
команда CPUID, которая возвращает идентификатор процессора.


2.3. Отличия процессоров UMC 486 U5 от Intel, AMD и
других.


Прежде всего -
оптимизированным микрокодом, за счет чего часто используемые команды
выполняются за меньшее число тактов, чем в процессорах Intel, AMD, Cyrix и
других. Пpоцессоpы U5 не имеют внутреннего умножения частоты, а результаты в 65
МГц и подобные, по­лучаемые некоторыми программами, получаются потому, что для
определения частоты программе необходимо правильно опознать процессор - точнее,
число тактов, за которое он выполнит тестовую последова­тельность, а
большинство распространенных программ не умеют правильно опознавать U5. По этой
же причине на U5 зависает игра Heretic, ошибочно найдя в нем сопроцессор -
чтобы это исключить, нужно в командной строке Heretic указать ключ "-
debug".


2.4. Чипы RISC и
CISC.


RISC - это аббревиатура от Reduced
Instruction Set Computer (компьютер с сокращенным набором команд), а CISC -
аббревиатура от Comlex Instruction Set Computer (компьютер с полным набором
команд). Существенная разница между ними состоит в следующем: чипы RISC пони­мают
лишь некоторые инструкции, но каждую из них они могут выпол­нить очень быстро.
Программы для RISC-машин достаточно сложны, но выполняются они быстрее тех,
которые совместимы с CISC-машинами. Hо, может быть, это и не так? (Исследования
производительности еще не завершены.)


Все  чипы  Intel  80x86  (как  и   чипы       Motorola    680x0


(68010,68020,..,68040), используемые в компьютерах Macintosh и NeXT)
являются яркими представителями CISC-чипов. Hекоторые рабочие стан­ции, начиная
с IBM, используют чипы RISC.


2.5. Идентификация чипов Intel и AMD.


2.5.1. Кодексы даты.


Просите у продавца
кодексы даты прежде, чем Вы купите про­цессор. Все ЦПУ имеют дату выпуска,
которая проставляется на корпу­се. Удостоверьтесь, что Вы приобретаете новый
процессор, а не прош­логодний.


Например A80486DX33 ( by Intel )


V74400223


V   - первый символ, код завода (plant
code);


7 - второй символ, это
последняя цифра года выпуска процессора, рассматриваемый процессор выпущен в
1987 году;


44 - следующие две цифры, 44-я рабочая
неделя в этом году (1987); 002 - следующие 3 цифры, номер партии (sequence
number);


3  -  код замены (change code).


Hапример E6 9433 DPD (on AMD CPUs)


E6   - версия реализации (version
release);


9433 - выпущен на 33 рабочей неделе 1994
года;


DPD  - шифр серии (wafer number);


2.5.2. Версия процессора.


Просите данные о
версии процессора. Сравните версию процес­сора, который Вам предлагают с
процессорами Intel 800-468-3548 или AMD 800-222-9323, так как более ранние
версии процессоров имеют ошибки и различные дефекты.


2.5.3. Demo-образцы.


Никогда не платите
полную цену за demo-образцы. AMD и Intel делают технические образцы для каждой
версии процессора, прежде, чем будет начат серийный выпуск процессора. Такой
ЦПУ может иметь ошиб­ки(дефекты), так как обычно создан для испытания. Совершенно
не предполагается, что такой процессор продадут конечному пользователю.


Hапример:


Нормальная версия (normal version):
i486DX-33:


Разработка образцов
(engineering samples): i486DX-33 E


2.5.4. Перемаркированные процессоры.


Перемаркированные
процессоры (remaked CPUs) - это процессо­ры, которые разгоняют сильнее, чем
оригинальные для более высокой це­ны и прибыли. Эти действия считаются
незаконными. Использование та­кого ЦПУ всегда рискованно. Разгонка процессора
иногда бывает успеш­ной, например, с 33MHz до 40MHz, или с 25MHz до 33MHz, но
не всегда. Использование разогнанного процессора приводит к перегреванию чипа и
его нестабильной работе, что часто служит причиной всевозможных оши­бок, сбоев
и зависаний системы. Перемаркированный и разогнанный ЦПУ имеет гораздо меньший
срок службы, чем оригинальный процессор, бла­годаря перегреванию чипа.

3. Процессоры фирмы Intel.


3.1. Современная микропроцессорная технология фирмы
Intel.


Достижения фирмы
Intel в искусстве проектирования и произ­водства полупроводников делают
возможным производить мощные микроп­роцессоры в все более малых корпусах.
Разработчики микропроцессоров в настоящее время работают с комплиментарным
технологическим процессом метал – оксид полупроводник (CMOS) с разрешением
менее, чем микрон.


Использование
субмикронной технологии позволяет разработчи­кам фирмы Intel располагать больше
транзисторов на каждой подложке. Это сделало возможным увеличение количества
транзисторов для се­мейства X86 от 29,000 в 8086 процессоре до 1,2 миллионов в
процессо­ре Intel486 DX2, с наивысшим достижением в Pentium процессоре. Вы­полненный
по 0.8 микронной BiCMOS технологии, он содержит 3.1 мил­лиона транзисторов.
Технология BiCMOS объединяет преимущества двух технологий: биполярной
(скорость) и CMOS ( малое энергопотребление ). С помощью более, чем в два раза
большего количества транзисторов Pentium процессора по сравнению с Intel486,
разработчики поместили на подложке компоненты, ранее располагавшимися снаружи
процессора. Наличие компонентов внутри уменьшает время доступа, что существенно
увеличивает производительность. 0.8 микронная технология фирмы Intel использует
трехслойный металл и имеет уровень, более высокий по сравнению с оригинальной
1.0 микронной технологией двухслойного ме­талла, используемой в процессоре
Intel486.


3.2. Первые процессоры фирмы Intel.


За 20-летнюю историю
развития микропроцессорной техники, ве­дущие позиции в этой области занимает
американская фирма Intel (INTegral ELectronics). До того как фирма Intel начала
выпускать микрокомпьютеры, она разрабатывала и производила другие виды интег­ральных
микросхем. Главной ее продукцией были микросхемы для кальку­ляторов. В 1971 г.
она разработала и выпустила первый в мире 4-бит­ный микропроцессор 4004. Фирма
первоначально продавала его в качес­тве встроенного контроллера (что-то вроде
средства управления улич­ным светофором или микроволновой печью). 4004 был
четырехбитовым, т.е. он мог хранить, обрабатывать и записывать в память или
считы­вать из нее четырехбитовые числа. После чипа 4004 появился 4040, но 4040
поддерживал внешние прерывания. Оба чипа имели фиксированное число внутренних
индексных регистров. Это означало, что выполняемые программы были ограничены
числом вложений подпрограмм до 7.


В 1972 г., т.е.
спустя год после появления 4004, Intel вы­пустила очередной процессор 8008, но
подлинный успех ей принес 8-битный микропроцессор 8080, который был объявлен в
1973 г. Этот микропроцессор получил очень широкое распространение во всем мире.
Сейчас в нашей стране его аналог - микропроцессор KP580ИК80 приме­няется во
многих бытовых персональных компьютерах и разнообразных контроллерах. С чипом
8080 также связано появление стека внешней па­мяти, что позволило использовать
программы любой вложенности.


Процессор 8080 был основной частью первого небольшого ком­пьютера,
который получил широкое распространение в деловом мире. Операционная система
для него была создана фирмой Digital Research и называлась Control Program for
Microcomputers (CP/M).


3.3. Процессор 8086/88.


В 1979 г. фирма
Intel первой выпустила 16-битный микропро­цессор 8086, возможности которого
были близки к возможностям процес­соров миникомпьютеров 70-х годов.
Микропроцессор 8086 оказался "пра­родителем" целого семейства,
которое называют семейством 80x86 или х86.


Hесколько позже появился микропроцессор 8088,
архитектурно повторяющий микропроцессор 8086 и имеющий 16-битный внутренние ре­гистры,
но его внешняя шина данных составляет 8 бит. Широкой попу­лярности
микропроцессора способствовало его применение фирмой IBM в персональных
компьютерах PC и PC/XT.


3.4. Процессор 80186/88.


В 1981 г. появились микропроцессоры 80186/80188,
которые сохраняли базовую архитектуру микропроцессоров 8086/8088, но содер­жали
на кристалле контроллер прямого доступа к памяти, счетчик/тай­мер и контроллер
прерываний. Кроме того, была несколько расширена система команд. Однако
широкого распространения эти микропроцессоры (как и персональные компьютеры
PCjr на их основе), не получили.


3.5. Процессор 80286.


Следующим крупным шагом в разработке новых идей стал
микроп­роцессор 80286, появившийся в 1982 году. При разработке были учтены
достижения в архитектуре микрокомпьютеров и больших компьютеров. Процессор
80286 может работать в двух режимах: в режиме реального адреса он эмулирует
микропроцессор 8086, а в защищенном режиме вир­туального адреса (Protected
Virtual Adress Mode) или P-режиме пре­доставляет программисту много новых
возможностей и средств. Среди них можно отметить расширенное адресное
пространство памяти 16 Мбайт, появление дескрипторов сегментов и дескрипторных
таблиц, на­личие защиты по четырем уровням привилегий, поддержку организации
виртуальной памяти и мультизадачности. Процессор 80286 применяется в ПК PC/AT и
младших моделях PS/2.


3.6. Процессор 80386.


При разработке
32-битного процессора 80386 потребовалось ре­шить две основные задачи -
совместимость и производительность.  Пер­вая из них была решена с помощью
эмуляции микропроцессора 8086 - ре­жим реального адреса (Real Adress Mode) или
R-режим.


В Р – режиме
процессор 80386 может выполнять 16-битные прог­раммы (код) процессора 80286 без
каких-либо дополнительных модифика­ций. Вместе с тем, в этом же режиме он может
выполнять свои "естес­твенные" 32-битные программы, что обеспечивает
повышение производи­тельности системы. Именно в этом режиме реализуются все
новые воз­можности и средства процессора 80386, среди которых можно отметить
масштабированную индексную адресацию памяти, ортогональное использо­вание
регистров общего назначения, новые команды, средства отладки. Адресное
пространство памяти в этом режиме составляет 4 Гбайт.


Микропроцессор 80386
дает разработчику систем большое число новых и эффективных возможностей,
включая производительность от 3 до 4 миллион операций в секунду, полную
32-битную архитектуру, 4 гига­битное (2 байт) физическое адресное пространство
и внутреннее обес­печение работы со страничной виртуальной памятью.


Несмотря на введение
в него последних достижений микропро­цессорной техники, 80386 сохраняет
совместимость по объектному коду с программным обеспечением, в большом
количестве написанным для его предшественников, 8086 и 80286. Особый интерес
представляет такое свойство 80386, как виртуальная машина, которое позволяет
80386 пе­реключаться в выполнении программ, управляемых различными операцион­ными
системами, например, UNIX и MS-DOS. Это свойство позволяет производителям
оригинальных систем непосредственно вводить приклад­ное программное обеспечение
для 16-битных машин в системе на базе 32-битных микропроцессоров. Операционная
система P-режима может соз­давать задачу, которая может работать в режиме
виртуального процес­сора 8086 (Virtual 8086 Mode) или V-режим. Прикладная
программа, ко­торая выполняется в этом режиме, полагает, что она работает на
про­цессоре 8086.


32-битная
архитектура 80386 обеспечивает программные ресур­сы, необходимые для поддержки
"больших " систем, характеризуемых операциями с большими числами,
большими структурами данных, больши­ми программами (или большим числом
программ) и т.п. Физическое ад­ресное пространство 80386 состоит из 2 байт или
4 Гбайт; его логи­ческое адресное пространство состоит из 2 байт или 64
терабайт (Тбайт). Восемь 32-битных общих регистров 80386 могут быть взаимоза­меняемо
использованы как операнды команд и как переменные различных способов адресации.
Типы данных включают в себя 8-, 16- или 32-бит­ные целые и порядковые,
упакованные и неупакованные десятичные, ука­затели, строки бит, байтов, слов и
двойных слов. Микропроцессор 80386 имеет полную систему команд для операций над
этими типами дан­ных, а также для управления выполнением программ. Способы
адресации 80386 обеспечивают эффективный доступ к элементам стандартных струк­тур
данных: массивов, записей, массивов записей и записей, содержа­щих массивы.


Микропроцессор 80386
реализован с помощью технологии фирмы Intel CH MOSIII - технологического
процесса, объединяющего в себе возможности высокого быстродействия технологии
HMOS с малым потреб­лением технологии кмоп. Использование геометрии 1,5 мкм и
слоев ме­таллизации дает 80386 более 275000 транзисторов на кристалле. Сей­час
выпускаются оба варианта 80386, работающих на частоте I2 и I6 МГц без состояний
ожидания, причем вариант 80386 на 16 МГц обеспечи­вает скорость работы 3-4
миллиона операций в секунду.


Микропроцессор 80386 разделен внутри на 6 автономно и
парал­лельно работающих блоков с соответствующей синхронизацией. Все внут­ренние
шины, соединяющие эти блоки, имеют разрядность 32 бит. Конве­йерная организация
функциональных блоков в 80386 допускает времен­ное наложение выполнения
различных стадий команды и позволяет однов­ременно выполнять несколько
операций. Кроме конвейерной обработки всех команд, в 80386 выполнение ряда
важных операций осуществляется специальными аппаратными узлами. Блок
умножения/деления 80386 может выполнять 32-битное умножение за 9-41 такт
синхронизации, в зависи­мости от числа значащих цифр; он может разделить
32-битные операнды за 38 тактов (в случае чисел без знаков) или за 43 такта (в
случае чисел со знаками). Регистр группового сдвига 80386 может за один такт
сдвигать от 1 до 64 бит. Обращение к более медленной памяти (и­ли к устройствам
ввода/вывода) может производиться с использованием конвейерного формирования
адреса для увеличения времени установки данных после адреса до 3 тактов при
сохранении двухтактных циклов в процессоре. Вследствие внутреннего конвейерного
формирования адреса при исполнении команды, 80386, как правило, вычисляет адрес
и опре­деляет следующий магистральный цикл во время текущего магистрально­го
цикла. Узел конвейерного формирования адреса передает эту опере­жающую
информацию в подсистему памяти, позволяя, тем самым, одному банку памяти
дешифрировать следующий магистральный цикл, в то время как другой банк
реагирует на текущий магистральный цикл.


3.7. Процессор 80486.


В 1989 г. Intel представила первого представителя
семей­ства 80х86, содержащего более миллиона (а точнее, 1,2 миллиона) 
транзисторов в чипе. Этот чип во многом сходен с 80386. Он на 100% программно
совместим с микроп­роцессорами 386(ТМ) DX & SX. Один миллион транзисторов
объединенной кэш-памяти (сверхбыстрой оперативной памяти), вместе с аппаратурой
для выполнения операций с плавающей запятой и управлением памяти на одной
микросхеме, тем не менее поддерживают программную совмести­мость с предыдущими
членами семейства процессоров архитектуры 86. Часто используемые операции выполняются
за один цикл, что сравнимо со скоростью выполнения RISC-команд.
Восьмикилобайтный унифицирован­ный кэш для кода и данных, соединенный с шиной
пакетного обмена дан­ными со скоростью 80/106 Мбайт/сек при частоте 25/33 Мгерц
гаранти­руют высокую производительность системы даже с недорогими дисками
(DRAM). Новые возможности расширяют многозадачность систем. Новые операции
увеличивают скорость работы с семафорами в памяти. Оборудо­вание на микросхеме
гарантирует непротиворечивость кэш-памяти и под­держивает средства для
реализации многоуровневого кэширования. Встроенная система тестирования
проверяет микросхемную логику, кэш-память и микросхемное постраничное
преобразование адресов памя­ти. Возможности отладки включают в себя установку
ловушек кон­трольных точек в выполненяемом коде и при доступе к данным. Процес­сор
i486 имеет встроенный в микросхему внутренний кэш для хранения 8Кбайт команд и
данных. Кэш увеличивает быстродействие системы, от­вечая на внутренние запросы
чтения быстрее, чем при выполнении цик­ла чтения оперативной памяти по шине.
Это средство уменьшает также использование процессором внешней шины. Внутренний
кэш прозрачен для работающих программ. Процессор i486 может использовать
внешний кэш второго уровня вне микросхемы процессора. Обычно внешний кэш позво­ляет
увеличить быстродействие и уменьшить полосу пропускания шины, требуемую
процессором i486.


3.7.1.Процессор i486SX


Появление
нового микропроцессора i486SX фирмы Intel  вполне можно считать одним из
важнейших событий 1991 года. Уже


предварительные
испытания показали, что компьютеры на базе i486SX с тактовой частотой   20 МГц
работают быстрее (примерно на 40%) компьютеров, основанных на i80386DX с
тактовой частотой 33 МГц. Микропроцессор i486SX, подобно оригинальному i486DX,
содержит на кристалле и кэш-память, а вот математический сопроцессор у него
заблокирован. Значительная экономия (благодаря исключению затрат на
тестирование сопроцессора) позволила фирме Intel существенно снизить цены на
новый микропроцессор. Надо сказать, что если микропроцессор i486DX был
ориентирован на применение в сетевых серверах  и рабочих станциях, то
i486SX послужил отправной точкой для создания мощных настольных компьютеров.
Вообще говоря, в семействе микропроцессоров i486 предусматривается несколько новых
возможностей для построения мультипроцессорных систем: соответствующие команды
поддерживают механизм семафоров памяти, аппаратно - реализованное выявление
недостоверности строки кэш-памяти обеспечивает согласованность между
несколькими модулями кэш-памяти и т.д. Для микропроцессоров семейства i486
допускается адресация физической памяти размером 64 Тбайт


3.8. Intel OverDrive процессор.


Возможность
постоянного совершенствования. Пользователи пер­сональных компьютеров все чаще
сталкиваются с этим по мере все воз­растающих требований к микропроцессорам со
стороны аппаратного и программного обеспечения. Фирма Intel уверена: лучшая
стратегия со­вершенствования - первоначально заложенная в систему возможность
мо­дернизации, модернизации согласно вашим нуждам. Впервые в мире та­кая
возможность предоставляется нашим потребителям. Фирма Intel приступила к
выпуску Intel OverDrive процессора, открывающего новую категорию мощных
сопроцессоров. После простой установки этого сопро­цессора на плату резко
вырастет скорость работы всей системы и прик­ладных программ в MS-DOS, Windows,
OS/2, Windows'95 и UNIX.


С помощью этой
одной-единственной микросхемы Вы сразу же сможете воспользоваться
преимуществами новой стратегии фирмы Intel, заложенной в нашей продукции. Когда
настанет неотвратимый момент, когда Вам потребуется производительность большая,
чем у Вашего ком­пьютера, то все, что Вам будет нужно - это вставить OverDrive
про­цессор в Вашу систему - и пользоваться преимуществами, которые даст Вам
новая микропроцессорная технология фирмы Intel. Более чем прос­то модернизация,
OverDrive процессор - это стратегия защиты Ваших настоящих и будущих вкладов в
персональные компьютеры.


Intel OverDrive
процессор гарантирует Вам отвечающую стан­дартам и экономичную модернизацию.
Всего лишь одна микросхема увели­чит вычислительную мощь Вашего компьютера до
требований самого сов­ременного программного обеспечения и даже тех программ,
которые еще не написаны, в MS-DOS, в Windows, в PS/2, в UNIX, от AutoCAD - до
WordPerfect.


Итак, наш первый микропроцессор
в серии Single Chip Upgrade (Качественное улучшение - одной микросхемой) - это
OverDrive процес­сор для систем на основе Intel i486SX. Установленный в
OverDrive – разъем, этот процессор позволяет системе i486SX использо­вать
новейшую технологию "удвоения скорости", используемую в процес­соре
i486DX2, и дающую общее увеличение производительности до 70%. OverDrive
процессор для систем i486SX содержит модуль операций над целыми числами, модуль
операций над числами с плавающей точкой, мо­дуль управления памятью и 8К
кэш-памяти на одном кристалле, работаю­щем на частоте, в два раза превышающей
тактовую частоту системной шины. Это уникальное свойство позволяет Вам удвоить
тактовую часто­ту Вашей системы, не тратясь на покупку и установку других
дополни­тельных компонентов. OverDrive процессор удвоит, например, внутрен­нюю
частоту МП i486SX 25 МГц до 50 МГц.


Хотя Intel OverDrive
- это совершенно новая технология ка­чественной модернизации, в нем узнаются и
фамильные черты Intel. Изготовленный и испытанный в соответствии с жесткими
стандартами Intel, OverDrive отличается зарекомендовавшими себя свойствами про­дукции
Intel: качеством и надежностью. OverDrive обеспечен постоян­ной гарантией и
привычным сервисом и поддержкой во всем мире. OverDrive полностью совместим
более чем с 50000 прикладных программ. OverDrive процессор для i486SX - только
первый из наших новых про­цессоров. Во втором полугодии 1992 года мы выпустим
OverDrive про­цессор для систем i486DX2, самих по себе представляющих новое
поко­ление технологии МП. Мощный и доступный, OverDrive процессор проло­жит для
Вас непрерывный путь к качественно новым уровням производи­тельности
персональных компьютеров.


Hекоторые результаты
лабораторных испытаний Intel OverDrive процессора:


1. Работа с
Microsoft Word for Windows 6.1 в среде Windows


3.0, популярным текстовым процессором.


Тест исполнялся на
системе с i486SX 20 МГц с файлом 330 КВ. WordPerfect, преобразованном в формат
Windows Word, было выполнено 648 контекстных поисков и замен, проверка
правописания во всем фай­ле, затем файл был сохранен.


Время исполнения:


i486SX без OverDrive =107 с


----------------------------                  ВЫИГРЫШ
= 57%


i486SX с
OverDrive = 68 с


2. Работа с Lotus
1-2-3 Release 3.0, электронной таблице, приближающейся по возможностям к
интегрированной среде, обладающей широким выбором аналитических, экономических
и статистических фун­кций.


Тест исполнялся на
i486SX 20 МГц с таблицей объемом 433К на 10000 ячеек, которая была загружена и
пересчитана. Кроме того, был обработан большой блок текстовых данных.


Время исполнения:


i486SX без OverDrive=250 с


----------------------------                  ВЫИГРЫШ
= 481%


i486SX с OverDrive = 43 с


i486SX с
i487SX =  72 с


----------------------------                  ВЫИГРЫШ
= 67%


i486SX c OverDrive =   43 c


3. Работа с AutoCAD, популярной системой
САПР.


Тест исполнялся на
i486SX 20 МГц с трехмерным архитектурным чертежом, над которым выполнялись
операции перечеркивания, панорами­рования, масштабирования, удаления скрытых
линий и повторной генера­ции файла во внешнем формате.


Время исполнения:


i486SX с i487SX =  162 с


----------------------------                  ВЫИГРЫШ
= 45%


i486SX c OverDrive =   112 c


А вот что говорят об
OverDrive процессоре те, кому уже пос­частливилось поработать с ним:


Брент Грэхэм:
(специалист по автоматизации офисов, US Bank, Портленд) "С теми
возможностями модернизации, которые предоставляет Intel 486, я не вижу причин
не использовать OverDrive процессор. Что касается его установки в систему, то с
этим справится даже мой 10-летний сынишка."


Билл     Лодж:    (руководитель   проектной    группы,


Corporation, Нью – Йорк) "Я работал с
Windows и OS/2 в сети Banyan Wines, используя OverDrive процессор без единой
заминки. Моя усовер­шенствованная система с i486SX 25 МГц работает не хуже, чем
системы на 50 МГц."


Стив  Симмонс:  (технический  менеджер,
Даллас)


"Windows визжит от счастья, когда
работает с OverDrive процессором. Расчеты на электронной таблице в Excel
выполняются мгновенно."


3.9. Процессор Pentium.


В то время, когда
Винод Дэм делал первые наброски, начав в июне 1989 года разработку Pentium процессора,
он и не подозревал, что именно этот продукт будет одним из главных достижений
фирмы Intel. Как только выполнялся очередной этап проекта, сразу начинал­ся
процесс всеобъемлющего тестирования. Для тестирования была разра­ботана
специальная технология, позволившая имитировать функциониро­вание Pentium
процессора с использованием программируемых устройств, объединенных на 14
платах с помощью кабелей. Только когда были обна­ружены все ошибки, процессор
смог работать в реальной системе. В до­полнение ко всему, в процессе разработки
и тестирования Pentium про­цессора принимали активное участие все основные
разработчики персо­нальных компьютеров и программного обеспечения, что немало
способ­ствовало общему успеху проекта. В конце 1991 года, когда была завер­шен
макет процессора, инженеры смогли запустить на нем программное обеспечение.
Проектировщики начали изучать под микроскопом разводку и прохождение сигналов
по подложке с целью оптимизации топологии и повышения эффективности работы.
Проектирование в основном было за­вершено в феврале 1992 года. Началось
всеобъемлющее тестирование опытной партии процессоров, в течение которого
испытаниям подверга­лись все блоки и узлы. В апреле 1992 года было принято
решение, что пора начинать промышленное освоение Pentium процессора. В качестве
основной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионов
транзисторов были окончательно перенесены на шаблоны. Началось промышленное
освоение производства и доводка технических характеристик, завершившиеся через
10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.


Объединяя более, чем
3.1 миллион транзисторов на одной крем­ниевой подложке, 32-разрядный Pentium
процессор характеризуется вы­сокой производительностью с тактовой частотой 60 и
66 МГц. Его су­перскалярная архитектура использует усовершенствованные способы
проектирования, которые позволяют выполнять более, чем одну команду за один
период тактовой частоты, в результате чего Pentium в состоя­нии выполнять
огромное количество PC-совместимого программного обес­печения быстрее, чем
любой другой микропроцессор. Кроме существующих наработок программного
обеспечения, высокопроизводительный ариф­метический блок с плавающей запятой
Pentium процессора обеспечивает увеличение вычислительной мощности до
необходимой для использования недоступных ранее технических и научных
приложений, первоначально предназначенных для платформ рабочих станций.


Многочисленные  нововведения  -  
характерная     особенность


Pentium процессора в виде уникального
сочетания высокой производи­тельности, совместимости, интеграции данных и
наращиваемости. Это включает:


- Суперскалярную архитектуру;


- Раздельное кэширование программного кода
и данных;


- Блок предсказания правильного адреса
перехода;


-
Высокопроизводительный блок вычислений с плавающей за­пятой;


- Расширенную 64-битовую шину данных;


- Поддержку многопроцессорного режима
работы;


- Средства задания размера страницы
памяти;


- Средства
обнаружения ошибок и функциональной избыточ­ности;


- Управление производительностью;


- Наращиваемость с
помощью Intel OverDrive процессора. Cуперскалярная архитектура
Pentium процессора представляет


собой совместимую только с Intel
двухконвейерную индустриальную ар­хитектуру, позволяющую процессору достигать
новых уровней производи­тельности посредством выполнения более, чем одной
команды за один период тактовой частоты. Термин "суперскалярная"
обозначает микроп­роцессорную архитектуру, которая содержит более одного
вычисли­тельного блока. Эти вычислительные блоки, или конвейеры, являются узлами,
где происходят все основные процессы обработки данных и ко­манд.


Появление
суперскалярной архитектуры Pentium процессора представляет собой естественное
развитие предыдущего семейства про­цессоров с 32-битовой архитектурой фирмы
Intel. Например, процессор Intel486 способен выполнять несколько своих команд
за один период тактовой частоты, однако предыдущие семейства процессоров фирмы
Intel требовали множество циклов тактовой частоты для выполнения од­ной
команды.


Возможность
выполнять множество команд за один период такто­вой частоты существует
благодаря тому, что Pentium процессор имеет два конвейера, которые могут
выполнять две инструкции одновременно. Так же, как и Intel486 с одним
конвейером, двойной конвейер Pentium процессора выполняет простую команду за
пять этапов: предвари­тельная подготовка, первое декодирование ( декодирование
команды ), второе декодирование ( генерация адреса ), выполнение и обратная
выгрузка.


В результате этих
архитектурных нововведений, по сравнению с предыдущими микропроцессорами,
значительно большее количество ко­манд может быть выполнено за одно и то же
время.


Другое важнейшее
революционное усовершенствование, реализо­ванное в Pentium процессоре, это
введение раздельного кэширования. Кэширование увеличивает производительность
посредством активизации места временного хранения для часто используемого
программного кода и данных, получаемых из быстрой памяти, заменяя по
возможности обра­щение ко внешней системной памяти для некоторых команд.
Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти,
используемой одновременно для кэширования программного кода и данных.


Проектировщики фирмы
Intel обошли это ограничение использо­ванием дополнительного контура,
выполненного на 3.1 миллионах тран­зисторов Pentium процессора ( для сравнения,
Intel486 содержит 1.2 миллиона транзисторов ) создающих раздельное внутреннее
кэширование программного кода и данных. Это улучшает производительность посред­ством
исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем
это было возможно ранее. Например, во время фа­зы предварительной подготовки,
используется код команды, полученный из КЭШа команд. В случае наличия одного
блока кэш-памяти, возможен конфликт между процессом предварительной подготовки
команды и досту­пом к данным. Выполнение раздельного кэширования для команд и
дан­ных исключает такие конфликты, давая возможность обеим командам вы­полняться
одновременно. Кэш-память программного кода и данных Pentium процессора содержит
по 8 KB информации каждая, и каждая ор­ганизована как набор двухканального
ассоциативного КЭШа - предназна­ченная для записи только предварительно
просмотренного специфициро­ванного 32-байтного сегмента, причем быстрее, чем
внешний кэш. Все эти особенности расширения производительности потребовали
использо­вания 64-битовой внутренней шины данных, которая обеспечивает воз­можность
двойного кэширования и суперскалярной конвейерной обработки одновременно с
загрузкой следующих данных. Кэш данных имеет два ин­терфейса, по одному для каждого
из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции
в течение одного ма­шинного цикла. После того, как данные достаются из КЭШа,
они записы­ваются в главную память в режиме обратной записи. Такая техника кэ­ширования
дает лучшую производительность, чем простое кэширование с непосредственной
записью, при котором процессор записывает данные одновременно в кэш и основную
память. Тем не менее, Pentium процес­сор способен динамически конфигурироваться
для поддержки кэширова­ния с непосредственной записью.


Таким образом,
кэширование данных использует два различных великолепных решения: кэш с
обратной записью и алгоритм, названный MESI (модификация, исключение,
распределение, освобождение) прото­кол. Кэш с обратной записью позволяет записывать
в кэш без обраще­ния к основной памяти в отличие от используемого до этого
непосред­ственного простого кэширования. Эти решения увеличивают производи­тельность
посредством использования преобразованной шины и предупре­дительного исключения
самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в
кэш-памяти и внешней памяти совпа­дать - великолепное решение в
усовершенствованных мультипроцессор­ных системах, где различные процессоры
могут использовать для рабо­ты одни и те же данные.


Блок предсказания
правильного адреса перехода - это следую­щее великолепное решение для
вычислений, увеличивающее производи­тельность посредством полного заполнения
конвейеров командами, осно­ванное на предварительном определении правильного
набора команд, ко­торые должны быть выполнены.


Pentium процессор
позволяет выполнять математические вычис­ления на более высоком уровне
благодаря использованию усовершенство­ванного встроенного блока вычислений с
плавающей запятой, который включает восьмитактовый конвейер и аппаратно
реализованные основные математические функции. Четырехтактовые конвейерные
команды вычисле­ний с плавающей запятой дополняют четырехтактовую целочисленную
кон­вейеризацию. Большая часть команд вычислений с плавающей запятой мо­гут выполняться
в одном целочисленном конвейере, после чего подаются в конвейер вычислений с
плавающей запятой. Обычные функции вычисле­ний с плавающей запятой, такие как
сложение, умножение и деление, реализованы аппаратно с целью ускорения
вычислений.


В результате этих
инноваций, Pentium процессор выполняет ко­манды вычислений с плавающей запятой
в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных
численных вычисле­ний, являющихся неотъемлемой частью таких усовершенствованных
ви­деоприложений, как CAD и 3D-графика.


Pentium процессор
снаружи представляет собой 32-битовое ус­тройство. Внешняя шина данных к памяти
является 64-битовой, удваи­вая количество данных, передаваемых в течение одного
шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов,
вклю­чая пакетный режим, в течение которого происходит порция данных из 256 бит
в кэш данных и в течение одного шинного цикла.


Шина данных является
главной магистралью, которая передает информацию между процессором и подсистемой
памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно
повышает ско­рость передачи по сравнению с процессором Intel486 DX - 528 MB/сек
для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта
расширенная шина данных способствует высокоскорос­тным вычислениям благодаря
поддержке одновременной подпитки команда­ми и данными процессорного блока
суперскалярных вычислений, благода­ря чему достигается еще большая общая
производительность Pentium процессора по сравнению с процессором Intel486 DX.


Давая возможность
разработчикам проектировать системы с уп­равлением энергопотреблением, защитой
и другими свойствами, Pentium процессор поддерживаем режим управления системой
(SMM), подобный ре­жиму архитектуры Intel SL.


Вместе со всем, что
сделано нового для 32-битовой микропро­цессорной архитектуры фирмы Intel,
Pentium процессор сконструирован для легкой наращиваемости с использованием
архитектуры наращивания фирмы Intel. Эти нововведения защищают инвестиции
пользователей пос­редством наращивания производительности, которая помогает
поддержи­вать уровень продуктивности систем, основанных на архитектуре про­цессоров
фирмы Intel, больше, чем продолжительность жизни отдельных компонентов.
Технология наращивания делает возможным использовать преимущества большинства
процессоров усовершенствованной технологи в уже существующих системах с помощью
простой инсталляции средства од­нокристального наращивания производительности.
Например, первое средство наращивания - это OverDrive процессор, разработанный
для процессоров Intel486 SX и Intel486 DX, использующий технологию прос­того
удвоения тактовой частоты, использованную при разработке мик­ропроцессоров
Intel486 DX2.


Первые модели процессора Pentium работали на частоте
60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-би­товой
шине данных, работающей на полной скорости процессорного ядра. Hо если скорость
процессора Pentium растет, то системному разработ­чику все труднее и дороже
обходится его согласование с материнской платой. Поэтому быстрые процессоры
Pentium используют делитель час­тоты для синхронизации внешней шины с помощью
меньшей частоты. Hап­ример, у 100 МГц процессора Pentium внешняя шина работает
на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Pentium использует одну и ту же
шину для доступа к основной памяти и к периферийным подсистемам, таким как
схемы PCI.


3.10. Процессор Pentium Pro.


3.10.1. Общее описание процессора.


Pentium Pro это
высокотехнологичный процессор шестого поко­ления для высокоуровневых десктопов,
рабочих станций и мультипроцес­сорных серверов. Массовое производство
процессора Pentium Pro, со­держащего на кристалле столько транзисторов, сколько
никогда не бы­ло на серийных процессорах, сразу в нескольких вариантах стартует
с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории
компании, да и электронной промышленности.


Hапомним некоторые
его особенности. Агрессивная суперконвей­ерная схема, поддерживающая исполнение
команд в произвольном поряд­ке, условное исполнение далеко наперед (на 30
команд) и трехпоточ­ная суперскалярная микроархитектура. Все эти методы могут
поразить воображение, но ни один из них не является чем-то оригинальным: но­вые
чипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладает
ключевым превосходством. В процессоры Pentium Pro встроена вторичная
кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде
отдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированного
на втором посадочном месте необычного двухместного корпуса процессора Pentium
Pro, значительно упростила разработчикам проектирование и конструирование
вычисли­тельных систем на его основе.


Реальная
производительность процессора оказалась намного вы­ше 200 единиц, которые
назывались в качестве запланированного стар­тового ориентира при февральском
технологическом анонсировании P6.


Pentium Pro это значительный шаг вперед. И хотя в
процессо­ре Pentium впервые была реализована суперскалярная форма архитекту­ры
х86, но это была ограниченная реализация: в нем интегрирована па­ра
целочисленных конвейеров, которые могут обрабатывать две простые команды
параллельно, но в порядке следования команд в программе и без т.н. условного
исполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярная
машина, которая способна одновремен­но отслеживать прохождение пяти команд. Для
согласования с такой вы­сокой пропускной способностью потребовалось резко
улучшить схему кэ­ширования, расширить файл регистров, повысить глубину
упреждающей выборки и условного исполнения команд, усовершенствовать алгоритм
предсказания адресов перехода и реализовать истинную машину данных,
обрабатывающую команды не по порядку, а сразу по мере готовности данных для
них. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, по
мнению Intel, суффикс Pro в имени процессора.


3.10.2. Два кристалла в одном корпусе.


Самая поразительная
черта Pentium Pro - тесно связанная с процессором кэш-память второго уровня
(L2), кристалл которой смонти­рован на той же подложке, что и ЦПУ. Именно так,
Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно
ядро про­цессора, включающее два 8-Килобайтовых блока кэш-памяти первого
уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехка­нальная порядково
– ассоциативная кэш второго уровня.


Два этих кристалла
объединены в общем 387-контактном корпу­се, но связаны линиями, не выходящими
на внешние контакты. Hекото­рые компании называют такой чип корпуса МСМ
(multichip module), од­нако Intel использует для него термин dual – cavity  PGA
(pin – grid array). Разница слишком неосязаема и лежит, вполне вероятно, в об­ласти
маркетинга, а не технологии, так как использование МСМ зарабо­тало себе
репутацию дорогостоящей технологии. Но, сравнивая цены на процессоры Pentium и
Pentium Pro, можно утверждать, что новая терми­нология исправит положение дел,
так как P6 претендует на статус мас­сового процессора. Впервые в истории
промышленности многокристальный модуль станет крупносерийным изделием.


Степень интеграции нового
процессора также поражает: он со­держит 5.5 млн. транзисторов, да еще 15.5 млн.
входит в состав крис­талла кэш-памяти. Для сравнения, последняя версия
процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число
не вклю­чена кэш L2, поскольку Pentium требует установки внешнего комплекта
микросхем статического ОЗУ для реализации вторичной кэш-памяти.


Элементарный расчет
поможет понять 6почему на 256К памяти, требуется такое огромное число
транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего
всего один транзистор на бит хранения и периодически регенерируемого,
использует для хра­нения бита ячейку из шести транзисторов:


256 x 1024 х 8 бит х
6 пр – ров  = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как
раз и выйдет 15.5 миллионов.


Площадь
процессорного кристалла равна 306 кв. мм. (для срав­нения, у первого процессора
Pentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, как
всякая регулярная структура, упакован намного плотнее - 202 кв. мм. Только
Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные
версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с
четырехслойной металлизацией.


Почему компания
Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КЭШем?
Во – первых комбинированный кор­пус значительно упростил изготовителям ПК
разработку высокопроизво­дительных систем на процессоре Pentium Pro.


Одна из главных
проблем при проектировании компьютера на быстром процессоре связана с точным
согласованием с процессором вто­ричного КЭШа по его размеру и конфигурации.
Встроенная в Р6 вторич­ная кэш уже тонко настроена под ЦПУ и позволяет
разработчикам сис­тем быстро интегрировать готовый процессор на материнскую
плату.


Во-вторых, вторичная
кэш тесно связана с ядром ЦПУ с по­мощью выделенной шины шириной 64 бита,
работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150
МГц, то кэш должна работать на частоте 150 МГц.


Поскольку в
процессоре Pentium Pro есть выделенная шина для вторичного КЭШа, это решает
сразу две проблемы: обеспечивается син­хронная работа двух устройств на полной
скорости и отсутствие конку­ренции за шину с прочими операциями ввода-вывода.
Отдельная шина L2, "задняя" шина полностью отделена от наружной,
"передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает
своими цикла­ми операциям с ОЗУ и периферией. Передняя 64-битовая шина может ра­ботать
с частотой, равной половине, трети или четверти скорости яд­ра Pentium Pro.
"Задняя" шина продолжает работать независимо, на полной скорости.


Такая реализация
представляет серьезный шаг вперед по срав­нению с организацией шины процессора
pentium и других процессоров х86. Только NexGen приближенно напоминает такую
схему. Хотя в про­цессоре Nx586 нет КЭШа L2, зато встроен ее контроллер и
полноскорос­тная шина для связи с внешней кэш-памятью. Подобно Р6, процессор
Nx586 общается с основной памятью и периферийными подсистемами по­верх
отдельной шины ввода-вывода, работающей на деленной частоте.


В экзотическом
процессором Alpha 21164 компания Digital пош­ла еще дальше, интегрировав прямо
на кристалле в дополнение к пер­вичной кэш-памяти еще и 96 Кбайт вторичной. За
счет вздувания площа­ди кристалла достигнута беспрецедентная производительность
кэширова­ния. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисто­ров,
большая часть которого образована массивом памяти.


Есть одна незадача:
необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления
соотношения цены и производи­тельности. Интегрированная в процессор кэш вроде
как скрыта с глаз. Pentium Pro сможет показаться более дорогим, чем его
конкуренты, но для создания компьютера на других процессорах потребуется
внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн
кэш-структуры означает, что другим процессорам, претендующим на со­поставимую
производительность, потребуется кэш-памяти больше, чем 256 Кбайт.


Уникальный корпус
предоставляет свободу созданию новых ва­риантов процессора. В будущем возможно
как повышение объема кэш-па­мяти, так и ее отделение ее от процессора в
соответствии с тради­ционным подходом. Если последний вариант появится, он
окажется, не­совместим по внешним выводам с двухкристалльным базовым корпусом,
так как ему необходимо добавить 72 дополнительных вывода (64-для
"задней" шины и 8 для контроля ошибок). Hо он будет почти таким же
быстрым, если будет широко доступна статическая память с пакетным режимом. По
мнению инженеров Intel, подключение внешних микросхем памяти к "передней"
шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд ли
оправдано. Отправной точкой для такой убеж­денности служат результаты натурного
моделирования прототипа систе­мы, которая в следствии высокой эффективности
интерфейса кэш L2-про­цессор, практически до теоретического предела загружает
вычисли­тельные ресурсы ядра. Процессор Alpha 21164, напротив, спроектиро­ван с
учетом необходимости кэш L3.


3.10.3. Значения тестов для некоторых чипов фирмы
Intel.


>

























































Processor


Benchmarks



Intel


Pentium


Pro


Processor


(200MHz)



Intel


Pentium


Pro


Processor


(180MHz)



Intel


Pentium


Pro


Processor


(166MHz)


w/512K L2



Intel


Pentium


Pro


Processor


(150MHz)



Intel


Pentium


Processor


(133MHz)


UNIX










SPEC95


SPECint95


SPECint_base95


SPECfp95


SPECfp_base95



8.09


8.09


6.75


5.99



7.29


7.29


6.08


5.40



7.11


7.11


6.21


5.47



6.08


6.08


5.42


4.76



4.14


4.14


3.12


2.48



SPEC92


SPECint92


SPECint_base92


SPECfp92


SPECfp_base92



366.0


336.7


283.2


234.3



327.4


3.5.8


254.6


210.4



327.1


306.6


261.3


209.6



276.3


258.3


220.0


182.0



190.9


175.9


120.6


107.3


Windows










Norton
System Index


SI32


86.7 77.6

Not


tested


67.0 34.2

Ziff-Davis


CPUmark32


541 466

Not


tested


412 278

4. Процессоры конкурентов Intel.


4.1. Первые процессоры конкурентов Intel.


Intel была не
единственной фирмой - производителем микропро­цессоров: существовали еще MOS
Technologies, Mostek, Motorola, Rockwell, Standart Microsystems Corporation,
Synertek, Texas Instruments. Одни из них использовали свои собственные проекты
чи­пов, другие - лицензионные проекты своих конкурентов. Успешнее всех в конце
70-х работала фирма Zilog. Она создала чип Z80.


В то время, когда
компьютеры, работающие под управлением СР/М, распространились в офисах,
компьютеры Apple II буквально вор­вались в школы. Фирма Apple в качестве
основного компонента своего компьютера выбрала чип фирмы MOS Technologies 6502.
Это был лицен­зионный чип фирмы Rockwell and Synertek. Apple начала
использовать процессоры Motorola во всех своих компьютерах Macintosh.
Разработки фирм Intel и Motorola появились почти одновременно, но объединяет их
не только это. Микропроцессоры Intel 80486 и Motorola 68040, напри­мер, почти
одинаковы по сложности и имеют функциональные сходные возможности. Тем не
менее, они совершенно несовместимы. Именно поэ­тому на Macintosh и PC не могут
выполняться одни и те же программы.


Существует
принципиальное отличие в эволюционном развитии этих двух семейств
микропроцессоров. Intel начала с довольно незна­чительного по нашим современным
меркам адресного пространства в 1 Мбайт и постоянно наращивала его до нынешнего
размера в 4 Гбайт. Motorola в своей серии 680x0 всегда имела адресное
пространство в 4 Гбайт. IBM поместила чипы ROM в адресное пространство своих PC
как можно выше. И не ее ошибка была в том, что позже Intel достроила
"второй этаж" и таким образом оставила ROM в конструкциях IBM где-то
посередине, открыв дорогу использованию RAM, что само по себе, мо­жет быть, и
не плохо. Разработчики семейства чипов 680х0 никогда не испытывали подобных
неудобств, и поэтому очень много программистов считают, что Mac лучше.


Intel приложила
значительные усилия, пытаясь стандартизо­вать производство ее процессоров 8086
и 8088 на предприятиях-подряд­чиках. Hесколько предприятий приняло такие
соглашения. Однако Haris выпустил свои чипы - аналоги 8086 и 8088, которые
менее всего удов­летворяли этим принятым соглашениям. Он использовал технологию
CMOS, значительно сокращающую потребление электроэнергии, и это свойство
сделало его чипы очень популярными, особенно среди производителей ПК с экранами
на жидких кристаллах.


Фирма NEC предложила
свою так называемую V-серию чипов и объявила, что чип V20 является
конструктивно совместимым с чипом Intel 8088, но имеет усовершенствованный
набор инструкций, включая при этом и инструкции чипа 8080. Это означало, что он
мог легко вы­полнять программы, написанные для CP/M, без их модификации, ис­пользуя
эмулятор программ, и при этом включать преимущества инструк­ций 8080,
содержащихся в чипе V20. Их чип V30 был аналогом 8086 с включенными
дополнительными возможностями.


Чипы V-серии фирмы NEC также работали немного быстрее
анало­гичных чипов фирмы Intel. Эти чипы имели некоторый успех, чем была
раздосадована Intel. Последняя подала в суд на NEC по факту наруше­ния закона о
защите авторских прав. NEC подала ответный иск. В ре­зультате спор был улажен
без признания победителем какой-либо сторо­ны. Интересными были детали этого
судебного разбирательства. Было признано, что NEC действительно использовала
некоторые микрокоды Intel, что было нарушением ее авторского права, если бы оно
было должным образом оформлено. Hо поскольку Intel производила и продава­ла
некоторые чипы 8088 без знака авторского права, то их претензии были признаны
безосновательными. Компания Chips and Technology, ко­торая стала известна
благодаря выпуску аналогов BIOS, в настоящее время внедрила линию по
производству процессорных чипов. Hа ней вы­пускаются аналоги 386. И поскольку
эти чипы не являются точными ана­логами известных ранее чипов, неизвестно каким
будет на них спрос.


 


 


 


 


4.2. Процессоры фирмы AMD.


4.2.1. Судебное разбирательство с Intel.


Фирма AMD была
лицензионным производителем Intel, производя­щей 80286. AMD объявила, что ее
контракт с Intel позволяет им выпус­кать легализованные копии чипов 386. Intel
категорически не согласи­лась с этим. AMD удалось выиграть это судебное
разбирательство, и теперь она выпускает аналог чипа 386 с тактовой частотой 40
МГц. Этот чип имел определенный успех, в частности, из-за его более высо­кой
скорости по сравнению с самым быстродействующим чипом серии Intel 386. При
выпуске фирмой AMD аналогов 486 фирма Intel снова по­пыталась остановить
конкурента. Однако и в этом случае закон был на стороне AMD.


 


4.2.2. Процессоры семейства AMD5k86.


Наладив в 1994 году
массовое производство чипов 5-го поколе­ния - микропроцессоров Pentium,
корпорация Intel мощно пошла в от­рыв. Интеллектуальная колоссальная мощь ее
инженеров, помноженная на богатейшие производственные возможности, казалось, не
оставляла ни­каких шансов конкурентам. между тем вдогонку за лидером бросилось
сразу несколько преследователей. Среди них, пожалуй, именно компа­ния AMD имела
самую "удачную" стартовую позицию. Компания Advanced Micro Devices
занимала второе место в мире по производству микропро­цессоров. На сегодняшний
день общее число чипов, выпущенных фирмой AMD, перевалило далеко за отметку 85
миллионов, что, согласитесь, само по себе говорит об огромном потенциале
компании.


Цифра "5"
для фирмы AMD была явно несчастливой. Intel Pentium все наращивал обороты: 66,
75, 90 Мгц... Тактовая частота новых моделей увеличивалась едва ли не каждый
месяц. А разработчи­кам компании AMD, кроме названия - "K5",
представлять было реши­тельно нечего. Ожидание становилось тягостным.


Гнетущее ощущение
несбывшихся надежд скрасил выпуск процес­сора Am5x86. Нет, чип Am5x86 не был
обещанным К5. Микропроцессор представлял собой "четверку" с большими
возможностями, которые одна­ко, явно не дотягивали до "честного"
Pentium. В прессе распространя­лись мнения специалистов, вроде:
"Производительность, сравнимая с производительностью Pentium, позволяет
отнести микропроцессор Am5x86 к устройствам пятого поколения".


А между тем,
оставаясь по своей сути (по внутренней архитек­туре) до боли знакомым 486-м,
чип Am5x86, имеющий тактовую частоту 133 МГц, мог соперничать на равных лишь со
скромным по своим возмож­ностям процессором Pentium/75 МГц. Интересно, какой
должна была бы быть тактовая частота Am5x86, чтобы показать производительность,
сравнимую с Pentium/166 МГц!


Поэтому создание
чипа пятого поколения у компании Advanced Micro Devices было еще впереди. При
проектировании своих предыдущих процессоров компания опиралась на неизменную
поддержку корпорации Intel. Но к началу разработки собственного процессора
пятого поколе­ния срок действия лицензионных соглашений с корпорацией Intel
подо­шел к концу. Так что инженерам AMD пришлось начать разработку, что
называется, с чистого листа. В частности, вышла промашка при проек­тировании
встроенного КЭШа команд. Наборы команд для процессоров разных поколений
существенно отличаются. Инженеры-разработчики ком­пании AMD немного просчитались
в оценке числа CISC-инструкций, имею­щих различную длину. В результате, не
удавалось достичь проектируе­мого уровня производительности при исполнении
программ, оптимизиро­ванных под процессор Pentium. Но спустя некоторое время и
эта, и не­которые другие ошибки были устранены. И в конце марта 1996 года ком­пания
AMD с гордостью объявила о появлении на свет нового процессо­ра пятого
поколения - AMD5k86.


 


 


 


 


 


4.2.2.1 Экскурсия по внутренней архитектуре.


Процессор AMD5k86,
известный на стадии разработки как AMD-K5 или Krypton, является первым членом
суперскалярного семейства (Superscalar family) K86. Он соединяет в себе высокую
производи­тельность и полную совместимость с операционной системой Microsoft
Windows.


Суперскалярный
RISC-процессор AMD5k86 выполнен по 0ю35-мик­ронной КМОП – технологии
(complimentary metal – oxid semiconductor process) и состоит из 4.3 млн.
транзисторов. Его дизайн базируется на богатой истории и обширном опыте
архитектур RISC и х86.


По мнению многих
специалистов, разработчики чипа AMD5k85 пошли значительно дальше
первоначального замысла: создать процессор, имеющий RISC-ядро, и при этом
совместимый с набором инструкций х86 означает совместимость с операционными
системами Microsoft Windows и всем ПО, написанным под архитектуру х86. Столь
счастливое сочетание высочайшей производительности и полной совместимости с
Microsoft Windows делает чип AMD5k86 полноправным членом 5-го поколения мик­ропроцессоров.


Микропроцессор
AMD5k86 имеет 4-потоковое суперскалярное яд­ро и осуществляет полное
переупорядочивание выполнения инструкций (full out – of – order  execution).
Чип AMDk586 унаследовал лучшие черты от двух доминирующих на сегодняшний день
микропроцессорных ветвей: семейства х86 и суперскалярных RISC-процессоров. От
первых он унас­ледовал столь необходимую для успешного продвижения на
компьютерном рынке совместимость с операционной системой WINDOWS. От семейства
суперскалярных RISC-процессоров он унаследовал высочайший уровень
производительности, характерный для чипов, применявшихся в рабочих станциях.


Разработанный
инженерами компании AMD процесс предвари­тельного декодирования позволяет
преодолеть присущие архитектуре х86 ограничения (различная длина инструкций). В
случае использования ин­струкций различной длины, чипы 4-го поколения могут
одновременно об­рабатывать 1 команду, процессоры 5-го поколения (Pentium) - 2
коман­ды. И только микропроцессор AMD5k86 способен обрабатывать до 4 ин­струкций
за такт.


Использование
раздельного КЭШа инструкций и данных (объем КЭШа инструкций в два раза
превосходит объем КЭШа данных) исключает возникновение возможных внутренних
конфликтов.


Сейчас выпускаются
микропроцессоры AMD5k86-P75, AMD5k86-P90 и AMD5k86-P100 производительность
которых (Р. - рейтинг) соответствует процессору Pentium с тактовыми частотами
75, 90 и 100 МГц.


Компания Advanced
Micro Devices планирует выпустить в этом (1996) году 3 млн. процессоров
семейства AMD5k86 со значениями Р. - рейтинга от 75 до 166. Цены на новые
процессоры будут сопоставимы с ценами обладающих аналогичной производительностью
процессоров Pentium, вероятно, даже несколько ниже. Средняя цена процессора
AMD5k86-P75 составляет около $75, чипа AMD5k86-P90 - $99.


Характеристики микропроцессора AMD5k86:


- 4-потоковое
суперскалярное ядро с 6-ю параллельно работающи­ми исполнительными
устройствами, составляющими 5-ступенчатый конве­йер;


- 4-потоковый
ассоциативный кэш команд с линейной адресацией объемом 16 Кб;


- 4-потоковый
ассоциативный кэш данных с обратной записью и ли­нейной адресацией объемом 8
Кб;


- полное переупорядочивание
выполнения инструкций, предвари­тельное (speculative) исполнение;


- динамический кэш
предсказания переходов объемом 1 Кб; в слу­чае неправильного предсказания
задержка составляет менее 3 внутрен­них тактов;


- 80-разрядное
интегрированное, высокопроизводительное устрой­ство выполнения операций с
плавающей запятой, обладающее небольшим временем задержки при выполнении
операций +/*;


- питающее
напряжение - 3В, система SSM (System Management Mode) для уменьшения
потребляемой мощности;


- 64-разрядная шина
и системный интерфейс помещены в 296-кон­такный корпус SPGA, совместимый по
выводам с процессором Pentium (P54C) и процессорным гнездом Socket-7;


- полная
совместимость с Microsoft Windows и инсталлированной базой ПО для процессоров
архитектуры х86.


 


4.2.2.2. Пример маркировки микропроцессора
AMD5k86-P75.


---------------------------------------------


|   ####   ###   ### ######    
-----------         |


|  ##  ##  ## ### ## ##   ##     `------
|           |


|  ######  ##  #  ## ##   ##      /|    |
|             |


|  ##  ##  ##     ## ######      | ----,|
|             |


|                                ----/  
|                           |


1 --------------------                                                       |


2 -------- AMD5k86тм-Р75                                       
|


3 ------------------------                                                 
|


4 -------- AMD-SSA/5-75ABQ                                  |


|   E <datecode> |              Designed
for         |


5 -----------------------                        //-------                |


|   (m) (c)1996AMD            //-------                |


|                                          //-------                |


|                                          Microsoft            |


6 -------- HEAT SINK                    ----------               |


   AND FAN REQ'D          Windows
95 тм  |


                                                                    |


                                  
`------------------------------------------


                                                


Обозначения:


1. P-рейтинг                             5.
Питающее напряжение


2. Название                                     B=3.45
- 3.60B


3. Температура корпуса                C=3.30
- 3.465B


W=55C    R=70C                      F=3.135
- 3.465B


Q=60C    Y=75C                      H=2.76
- 3.0B


X=65C    Z=85C                       J=2.57
- 2.84B


4. Серийный номер                        K=2.38
- 2.63B


6. Температурный режим


 


 


4.2.2.3. Тесты.


Система Р –
рейтингов измерения производительности процессоров была предложена в начале
1996 года компаниями AMD, Cyrix, IBM и SGS – Thomson Microelectronics.
P-рейтинг составляется, по результа­там проведения эталонного теста Winstone
96, разработанного изда­тельством Ziff – Davis  Этот тест представляет собой
набор из 13 наи­более часто применяемых приложений, таких как Microsoft Word и
Exel.


Следует заметить,
что в отличие от системы тестов iComp, ко­торой пользуется корпорация intel для
оценки производительности своих микропроцессоров, тестовый набор Winstone 96
является общедос­тупным.


В своем новом чипе
AMD5k86 компания AMD воплотила поистине новаторское сочетание набора инструкций
х86 и суперскалярной RISC-архитектуры (reduced instruction set computing
architecture). Как утверждают некоторые специалисты AMD, благодаря такому
решению микропроцессор AMD5k86 обеспечивает на 30% большую производи­тельность,
чем процессор Pentium с такой же тактовой частотой. Впро­чем, результаты
тестирования с использованием пакета тестов Winstone 96 компании Ziff – Davis
показывают, что преимущество несколько скром­нее.


Тестовая конфигурация:


>





Материнская плата


Чипсет


ОЗУ


Кэш-память L2


Видеоплата (640х480х256)


Видеодрайвер


Жесткий диск



FIC PA2002


VIA Apollo Master


EDO DRAM объемом 16 Мб


256 Кб


PCI Diamond Stealth64 3200


Diamond GT 4.02.00.218 for
Windows 95 EIDE Quantum Fireball емкостью 1.2 Гб



AMD5k85-P75 CPU (index 48.8)


Pentium 75 (index 47.4)


AMD5k85-P90 CPU (index 56.7)


Pentium 90 (index 54.9)


4.2.2.4. Материнские
платы для AMD5k86.


Список широко распространенных системных
плат, протестированных в лабораториях компании AMD и


рекомендованных для установки  процессора
AMD5k86.


>











































































Производитель
gn=top >Модель
Чипсет BIOS
Abit PH5 1.3 SiS 551 Award Pentium PCI Sys BIOS
(N35)
Abit PH5 2.1 Intel Triton Award Pentium PCI Sys BIOS
(C4)
Atrend ATC1000 Intel Triton Award i430-2A59CA29C-00
Atrend ATC1545 A1 OPTi Viper

Award OPTi Viper


ATS-1545 ver. 0.6.


Biostar 8500TAC A1 Intel Triton AMI 1993
ECS TR5510 Intel Triton Award i430FX-2A59CE1NC-00
ECS AIO Intel Triton Award i430FX-2A59CE1NC-00
FIC PA2002 1.21 VIA 570 Award 4.052G800
Gigabyte GA586ATS 1B Intel Triton Award Intel 430FX PCI-ISA
v.1.26
Hsingtech M507 1.1 Intel Triton Award 2/1/1996x
Mycomp (TMC) PCI54ITS 2.00 Intel Triton Award i430FX-2A59CM29C-00
Замечание: ранние версии указанных системных плат
нуждаются в за­мене BIOS на более новую версию, правильно распознающую чип
AMD5k86

 


4.2.2.5. AMD планирует выпустить K5.


Репутация AMD сильно
зависит от успешности затянувшегося проекта К5-первой самостоятельной пробы
архитектурных сил в области х86. Рождение К5 опасно откладывается уже не первый
раз. В первом квартале следующего года AMD планирует перевод K5 на технологичес­кий
процесс с проектными нормами 0.35 мкм и с трехуровневой металли­зацией, разработанный
при содействии с HР и запускаемый на новом за­воде AMD Fab 25 в Остине, штат
Техас. Это позволит уменьшить К5 с


4.2 миллионами транзисторов до 167 кв. мм
и поднять процент выхода годных, а также тактовую частоту.


По мнению руководства AMD в 1996 году объем выпуска К5
бу­дет наращиваться достаточно быстро, что позволит отгрузить до конца года
более пяти миллионов процессоров. Ответом на вызов Intel с ее процессором
Pentium Pro может стать только процессор К6, но уже ник­то не верит, что его
удастся увидеть раньше 1997 года. Hесмотря на всемирный переход на процессор
Pentium, в следующем году еще могут сохраниться некоторые рынки для 486-х.
Эксперты считают, что потреб­ность таких региональных рынков, как Китай, Индия,
Россия, Восточ­ная Европа и Африка, в 486-х чипах составит до 20 миллионов
процес­соров в 1996 году. AMD рассчитывает, что именно ей удастся поста­вить
большую часть от этого количества. Поэтому компания повышает тактовую частоту
486-х до 133 Мгц, чтобы конкурировать с низшими версиями процессора Pentium в
настольных ПК начального уровня. Одна­ко, AMD будет усиленно наращивать выпуск
К5, поскольку 486-е быстро выходят из моды.


4.3. Процессоры NexGen.


В то время: как
компания Intel готовила отрасль к шокирующе­му выходу в жизнь серийных моделей
серверов и настольных машин на Pentium Pro, фирма NexGen представляла форуму
свои планы по разра­ботке процессора Nx686. Этот суперскалярный х86-совместимый
процес­сор, к разработке которого подключается еще и команда архитекторов из
AMD, снятых с собственного неудачного проекта К6, будет содер­жать около 6 млн.
транзисторов, включая вычислитель с плавающей точ­кой на одном кристалле с
процессором (отказ от предыдущего двухкрис­талльного подхода, ослабившего
Nx586). Технология КМОП с проектными нормами 0,35 мкм и пятислойной
металлизацией позволила "упаковать" на одном кристалле семь
исполнительных узлов: два для целочисленных, один для операций с плавающей
точкой, по одному для обработки мультимедиа, команд переходов, команд загрузки
и команд записи. По­казатели производительности представители NexGen назвать не
смогли, но выразили предположение, что он превзойдет Pentium Pro на 16-раз­рядных
программах вдвое, а на 32-битовых - на 33 %.


До сих пор мало что
известно про Nx686, так как чип еще не анонсировался и NexGen не хочет
раскрывать козыри перед конкурента­ми в лице AMD, Cyrix и Intel. Однако, NexGen
не хочет раскрывать ко­зыри перед конкурентами в лице AMD, Cyrix и Intel.
Однако, NexGen настаивает о том, что Nx686 по производительности сопоставим с инте­ловским
Pentium Pro и AMD K5, и наследует микроархитектуру Nx586, появившуюся в 1994
году. NexGen называет ее RISC86. Базовая ее идея, как и в случае с Pentium Pro
и K5, состоит в преобразовании сложных CISC-команд программного обеспечения x86
в RISC-подобные операции, исполняемые параллельно в процессорном ядре
RISC-типа. Этот подход, известный под названием несвязанной микроархитектуры,
позволяет обо­гатить CISC-процессор новейшими достижениями RISC-архитектур и
сох­ранить совместимость с имеющимся ПО для х86.


В Nx686 эта
философия продвинута на новый логический уро­вень. Сегодня в Nx586 имеется три
исполнительных блока, трехконвей­ерное суперскалярное ядро. Он способен
выполнять в каждом такте по одной команде х86. Возможности для
совершенствования очевидны: Nx586 будет содержать пять исполнительных блоков,
четыре конвейера и нес­колько декодеров, способных справиться с выполнением
двух или даже более команд х86 за один машинный такт. Для этого потребуется
встроить дополнительные регистры переименования и очереди команд.


Подход к
использованию интегрированного кэш-контроллера и интерфейса для скоростной
кэш-памяти остается неизменным. Представи­тели NexGen говорят, что они изучают
возможность использования крис­талла вторичной кэш-памяти по образцу и подобию
Intel, тем более что их производственный партнер IBM Microelectronics способен
делать статическую память и многокристальные сборки (MCM - multichip modules).


Пример практической
реализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586,
запланированная к выпус­ку на конец этого года и включающая кристалл CPU и FPU
в одном кор­пусе. Одновременное перепроектирование топологии с масштабированием
до размера линии 0.35 микрон позволит компании NexGen основательно уменьшить
размеры кристалла ЦПУ - до 118 кв. мм - меньше в этом клас­се ничего нет.


NexGen, новичок в группе производителей процессоров
х86. Nx596 может параллельно обрабатывать на нескольких исполнительных блоках
до четырех простейших операций, которые названы командами RISC86. Процессор К5
имеет похожий четырехпоточный дешифратор, но результаты его работы компания
называет R – ops.


4.4. Процессоры Cyrix.


Первая вещь из грандиозного проекта М1 компании Cyrix,
нако­нец обнародована. Это процессор Сх 6х86-100, монстроподобный крис­талл
которого сложен и очень дорог для того, чтобы претендовать на массовый выпуск в
течении длительного срока. Его проблемы сможет ре­шить процессор, который пока
имеет кодовое название M1rx и опираю­щийся на техно процесс с пятислойной
металлизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии.
Если проект увенчает­ся успехом, то размер кристалла с 394 кв. мм уменьшится до
225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 МГц. В
этом случае эксперты предсказывают ему производительность в преде­лах 176-203
по тесту SPECint92, т.е. на уровне процессора Pentium 133 (SPECint92=190.9) или
150 МГц. Если все обещания сбудутся, то Cyrix сможет продать столько
процессоров, сколько произведет. Также компания cyrix предложила компромиссный
вариант процессора - 5х86, основанного на ядре 486-го, усиленного элементами
архитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевке
с гнез­дом 486-го.


4.5. Процессоры Sun
Microsystems.


Sun
Microsystems процессор UltraSparc-II. Впервые вводя RISC-технологию, SUN в 1988 году
объявила SPARC в качестве масштаби­руемой архитектуры, с запасом на будущее.
Однако, с 1993 года реали­зация SuperSparc стала на шаг отставать от своих
конкурентов.


С появлением
UltraSparc, четвертого поколения архитектуры SPARC, компания связывает надежды
на восстановление утраченных позиций. Он содержит ни много, ни мало, но девять
исполнительных блоков: два целочисленных АЛУ, пять блоков вычислений с
плавающей точкой (два для сложения, два для умножения и одно для деления и
извлече­ния квадратного корня), блок предсказания адреса перехода и блок
загрузки/записи. UltraSparc содержит блок обработки переходов, встроенный в
первичную кэш команд, и условно выполняет предсказан­ные переходы, но не может
выдавать команды с нарушением их очеред­ности. Эта функция перекладывается на
оптимизирующие компиляторы.


Архитектура SPARC
всегда имела регистровые окна, т.е. во­семь перекрывающихся банков по 24
двойных регистра, которые могут предотвратить остановки процессора в моменты
комплексного переключе­ния, связанные с интенсивными записями в память.
Разработчики компи­ляторов склонны считать эти окна недостаточным решением,
поэтому в UltraSparc используется иерархическая система несвязанных шин. Шина
данных разрядностью 128 бит работает на одной скорости с ядром про­цессора. Она
соединяется через буферные микросхемы с 128-разрядной системной шиной,
работающей на частоте, составляющей половину, треть или четверть скорости
процессорного ядра. Для согласования с более "медленной" периферией
служит шина ввода-вывода Sbus.


Фирма Sun реализует
эту схему на аппаратном уровне с по­мощью коммутационной микросхемы, являющейся
составной частью схемно­го комплекта окружения. Эта микросхема может
изолировать шину памя­ти от шины ввода-вывода, так что ЦПУ продолжает,
например, запись в графическую подсистему или в иное устройство ввода-вывода, а
не ос­танавливается во время чтения ОЗУ. Такая схема гарантирует полное
использование ресурсов шины и установившуюся пропускную способность


1.3 Гигабайт/с.


В процессоре UltraSparc – II используется система
команд Visual Instruction Set (VIS), включающая 30 новых команд для обра­ботки
данных мультимедиа, графики, обработки изображений и других целочисленных
алгоритмов. Команды VIS включают операции сложения, вычитания и умножения,
которые позволяют выполнять до восьми опера­ций над целыми длинной байт
параллельно с операцией загрузки или за­писи в память и с операцией перехода за
один такт. Такой подход мо­жет повысить видеопроизводительность систем.


4.6. Процессоры Digital Equipment.


Digital Equipment
процессор Alpha наиболее тесно следует в русле RISC-философии по сравнению со
своими конкурентами, "посрезав излишки сала" с аппаратуры и системы
команд с целью максимального спрямления маршрута прохождения данных.
Разработчики Alpha уверены, что очень высокая частота чипа даст вам большие
преимущества, чем причудливые аппаратные излишества. Их принцип сработал:
кристалл 21164 был самым быстрым в мире процессором со дня своего появления в
1995 году. Процессор 21164 в три раза быстрее на целочисленных вы­числениях,
чем Pentium-100, и превосходит на обработке числе с пла­вающей точкой, чем
суперкомпьютерный набор микросхем R8000 фирмы Mips. Топология процессора
следующего поколения 21164А не измени­лась, но она смаштабирована, кроме того,
модернизирован компилятор, что повысило производительность на тестах SPECmarks.
Предполагается, что готовые образцы нового процессора, изготовленные по КМОП -
техно­логии с нормами 0.35 микрон, при тактовой частоте свыше 300 МГц бу­дут
иметь производительность 500 по SPECint92 и 700 по SPECfp92.


Процессоры семейства
21164 на прибегают к преимуществам ис­полнения не в порядке очередности (out –
of – order), больше полагаясь на интеллектуальные компиляторы, которые могут
генерировать коды, сводящие к минимуму простои конвейера. Это самый гигантский
процес­сор в мире - на одном кристалле размещено 9.3 миллиона транзисторов,
большая часть которых пошла на ячейки кэш-памяти. Alpha 21164 имеет на
кристалле относительно небольшую первичную кэш прямого отображе­ния на 8 Кбайт
и 96 Кбайт вторичной. За счет вздувания площади крис­талла достигнута
беспрецедентная производительность кэширования.


В 21164 работает
четыре исполнительных блока (два для целых и два для чисел с плавающей точкой)
и может обрабатывать по две ко­манды каждого типа за такт. Он имеет
четырехступенчатый конвейер ко­манд, который "питает" отдельные
конвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. По
сравнению с прочими RISC-про­цессорами нового поколения чип 21164 имеет
относительно глубокие и простые конвейеры, что позволяет запускать их с более
высокой такто­вой частотой.


Конвейер команд
вообще не заботится о их зависимости по дан­ным (в отличие от pentium Pro,
который является ярким примером маши­ны данных), он выдает команды в порядке их
поступления на свой вход (в порядке следования по программе). Если текущие
четыре команды не­возможно послать сразу все на различные исполнительные блоки,
то конвейер команд останавливается до тех пор, пока это не станет воз­можным. В
отличие от конкурентов 21164 также не использует технику переименования
регистров, вместо нее он непосредственно обновляет содержимое своих
архитектурных регистров, когда результат достигает финальной ступени конвейера
– write – back. Для борьбы с задержками и зависимостью команд по данным в
процессоре активно ис­пользуются маршруты для обхода регистров, поэтому
совместно ис­пользуемые операнды становятся доступными до стадии write - back.


Компания Digital продвигает Альфу как платформу для
серве­ров Windows NT, а не как традиционный UNIX-сервер.


4.7. Процессоры Mips.


Mips процессор R1000
унаследовал свой суперскалярный дизайн от R8000, который предназначался для
рынка суперкомпьютеров научно­го назначения. Но R1000 ориентирован на массовые
задачи. Использова­ние в R1000 динамического планирования команд, которое
ослабляет за­висимость от перекомпиляции ПО, написанного для более старых
процес­соров, стало возможным благодаря тесным связям Mips со своим партне­ром
Silicon Graphics, имеющим богатейший тыл в виде сложных графи­ческих
приложений.


R1000 первый
однокристальный процессор от Mips. Для предот­вращения остановок конвейера в
нем использовано динамическое пред­сказание переходов, с четырьмя уровнями
условного исполнения, с ис­пользованием переименования регистров,
гарантирующего, что результа­ты не будут передаваться в реальные регистры до
тех пор, пока неяс­ность по команде перехода не будет снята. Процессор
поддерживает "теневую карту" отображения своих регистров переименования.
В слу­чае неверного предсказания адреса перехода он просто восстанавли­вает эту
карту отображения, но не выполняет фактической очистки ре­гистров и
"промывки" буферов, экономя таким образом один такт.


R1000 отличается
также радикальной схемой внеочеред­ной обработки. Порядок следования команд в
точном соответствии с программой сохраняется на трех первых ступенях конвейера,
но затем поток разветвляется на три очереди (где команды дожидаются обработ­ки
на целочисленном АЛУ, блоке вычислений с плавающей точкой и бло­ке
загрузки/записи). Эти очереди уже обслуживаются по мере освобож­дения того или
иного ресурса.


Предполагаемая
производительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрон
должна достичь 300 по SPECint92 и по SPECfp92.


Программный порядок
в конце концов восстанавливается так, что самая "старая" команда
покидает обработку первой. Аппаратная поддержка исполнения в стиле out – of –
order дает большие преимущества конечному пользователю, так как коды,
написанные под старые скаляр­ные процессоры Mips (например, R4000), начинают
работать на полной скорости и не требуют перекомпиляции. Хотя потенциально
процессор R1000 способен выдавать по пять команд на исполнение в каждом такте,
он выбирает и возвращает только четыре, не успевая закончить пятую в том же
такте.


Одно из двух устройств для вычисления двойной точности
с плавающей точкой занято сложениями, а другое умножениями/делениями и
извлечением квадратного корня. Hа кристалле R1000 реализован также интерфейс
внешней шины, позволяющий связывать в кластер до четырех процессоров без
дополнительной логики обрамления.


4.8. Процессоры Hewlett – Packard 


Hewlett – Packard
процессор PA-8000. Компания Hewlett – Packard  одной из первых освоила
RISC-технологию, выйдя еще в 1986 году со своим первым 32-разрядным процессором
PA-RISC. Практически все вы­пускаемые процессоры PA-RISC используются в рабочих
станциях HP се­рии 9000. В период с 1991 по 1993 (перед появлением систем на
базе PowerPC) HP отгрузила достаточно много таких машин, став крупнейшим
продавцом RISC-чипов в долларовом выражении.


С целью пропаганды
своих микропроцессоров среди других производителей систем компания HP стала
организатором организации Precision RISC Organization (PRO). А в 1994 году
компания взорвала бомбу, объединившись с Intel для создания новой архитектуры.
Это поставило под сомнение будущее PRO.


PA-8000 это
64-разрядный, четырехканальный суперскалярный процессор с радикальной схемой
неупорядоченного исполнения программ. В составе кристалла десять функциональных
блоков, включая два цело­численных АЛУ, два блока для сдвига целых чисел, два
блока multiply/accumulate (MAC) для чисел с плавающей запятой, два блока
деления/извлечения квадратного корня для чисел с плавающей запятой и два блока
загрузки/записи. Блоки МАС имеют трехтактовую задержку и при полной загрузке
конвейера на обработке одинарной точности обес­печивают производительность 4
FLOPS за такт. Блоки деления дают 17-тактовую задержку и не конвейеризированы,
но они могут работать одновременно с блоками МАС.


В PA-8000
использован буфер переупорядочивания команд (IRB) глубиной 56 команд,
позволяющий "просматривать" программу на следую­щие 56 команд вперед
в поисках таких четырех команд, которые можно выполнить параллельно. IRB
фактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит команды для
целочисленного блока и бло­ка плавающей точки, а буфер памяти - команды
загрузки/записи.


Как только команда
попадает в слот IRB, аппаратура просмат­ривает все команды, отправленные на
функциональные блоки, чтобы най­ти среди них такую, которая является источником
операндов для коман­ды, находящейся в слоте. Команда в слоте запускается только
после того, как будет распределена на исполнение последняя команда, кото­рая
сдерживала ее. Каждый из буферов IRB может выдавать по две ко­манды в каждом
такте, и в любом случае выдается самая "старая" ко­манда в буфере.
Поскольку PA-8000 использует переименование регис­тров и возвращает результаты
выполнения команд из IRB в порядке их следования по программе, тем самым поддерживается
точная модель об­работки исключительных ситуаций.


HP проектировала РА-8000 специально для задач
коммерческой обработки данных и сложных вычислений, типа генной инженерии, в ко­торых
объем данных настолько велик, что они не умещаются ни в один из мыслимых
внутрикристалльных КЭШей. Вот почему, РА-8000 полагается на внешние первичные
КЭШи команд и данных. Слоты в третьем 28-слото­вом буфере, который называется
буфером переупорядочивания адресов (Adress – Recorder Buffer - ARB), один к
одному ассоциированы со сло­тами в буфере памяти IRB. В АРВ содержатся
виртуальные и физические адреса всех выданных команд загрузки/записи. Кроме
того, АРВ допус­кает выполнение загрузок и записей в произвольном порядке, но с
сох­ранением согласованности и сглаживанием влияния задержки, связанной с
адресацией внешних КЭШей.


4.9. Процессоры Motorola.


Motorola/IBM
процессор PowerPC620 это первая 64-битовая реа­лизация архитектуры PowerPC.
Имея 64-битовые регистры и внутренние магистрали данных и семь миллионов
транзисторов, новому процессору требуется почти вдвое больший и сложный
кристалл, чем у PowerPC 604. Модель 620 имеет четырехканальную суперконвейерную
схему с шестью исполнительными устройствами: три целочисленных АЛУ, блок
плавающей точки, блок загрузки/записи и блок переходов. Последний способен на
четырехуровневое предсказание ветвлений в программе и условное ис­полнение с
использованием схемы переименования регистров.


ПО микроархитектуре
RISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистров
и магистралей данных, а так­же к увеличенному числу станций резервирования для
условного испол­нения команд. Прибавка производительности достигнута за счет
улуч­шенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс к
памяти, по которому за один цикл обращения можно выбрать два 64-би­товых
длинных слова, и 40-битовая шина адреса, по которой можно ад­ресовать до одного
терабайта физической памяти.


В состав шинного интерфейса входить также поддержка
кэш-па­мяти второго уровня объемом до 128 Мбайт, которая может работать на
четверти, половине или на полной скорости ЦПУ.


 


5. Лабораторные испытания и тестирование
микропроцессоров.


5.1. Лабораторные испытания процессоров i386DX.


В 1992 году на рынке
появилось три новых МП, способных за­местить существующие 386DX и обеспечить
повышение характеристик сис­тем на основе i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, и
Cyrix 486DLC. В настоящий момент
предлагаются только версии 33 МГц, хотя C&T и Cyrix обещают выпустить в
начале 1993 года вариант 40 МГц. Конечно, на такой частоте можно заставить
работать и 33 МГц вариант, но мой опыт показывает, что это ненадежно, в любой
момент машина может зависнуть. Intel RapidCAD распространяется, как про­дукт
для конечных пользователей, т.е. в машину его устанавливают именно они.
Напротив, C&T и Cyrix поставляют свои процессоры и производителям. Cyrix
также производит процессор 486SLC, заменяющий Intel/AMD 386SX. C&T объявил
о создании процессора 38600SX, но в продаже он появится только в 1993 году,
если вообще появится.


RapidCAD, грубо
говоря, представляет собой процессор 486DX без внутренней кэш-памяти и с
цоколевкой процессора 386. Для прог­рамм он соответствует 386 с сопроцессором,
так как все специфичные команды i486 удалены из набора команд. Рекламируется
этот процессор, как "абсолютный сопроцессор" и, к чему и обязывает
такое имя, он предназначен для замены процессора 386DX в существующих системах
и резкого повышения производительности операций с плавающей точкой, таких, как
CAD, электронные таблицы, математические программные па­кеты (SPSS, Mathematica
и т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132
вывода), устанавливающийся в гнездо для i386, включает в себя ЦПУ и модуль
операций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов),
устанавливающийся в гнез­до для сопроцессора i387, включает в себя ПЛМ,
подающий сигнал на схемы системной платы для правильной обработки особых
ситуаций при операциях с плавающей точкой. Большинство операций исполняется в
те­чение одного цикла, как и в i486. Однако узким местом является ин­терфейс
шины 386, так как каждый цикл шины равен двум циклам процес­сора. Это значит,
что команды выполняются быстрее, чем считываются из памяти. Поскольку операции
с плавающей точкой выполняются медлен­нее обычных команд, то замедление на них
не сказывается, и они вы­полняются с такой же скоростью, как и на i486DX.
Именно поэтому RapidCAD позволяет получить более высокие характеристики с
плаваю­щей точкой, чем любая комбинация 386/387. Результаты теста SPEC,
стандартного теста для машин под UNIX, показывают, что RapidCAD ус­коряет
операции с плавающей точкой на 85%, а с целыми числами - на 15% по сравнению с
любой комбинацией 386/387 при одинаковой такто­вой частоте. Потребляемая
мощность при 33 МГц составляет 3500 мВт. Текущая цена RapidCAD 33 МГц
составляет 300$.


Предполагается, что
процессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие от
процессора Am386 фирмы AMD, кото­рый использует микрокод, идентичный микрокоду
Intel 386, в процессо­ре 38600DX использован патентно чистый микрокод, для
обеспечения полной совместимости в набор команд даже включена недокументирован­ная
команда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&T
также выпустила процессор 38605DX, включающий кэш-память команд на 512 байт,
что еще более повысит его производительность. К сожалению, 38605DX выпускается
в корпусе PGA (144 вывода) и не мо­жет быть установлен непосредственно в разъем
i386DX. При проведении испытаний я заметил, что у 38600DX есть серьезные
проблемы коммуни­кации ЦПУ- сопроцессор, и из-за этого скорость выполнения в
большин­стве программ операций с плавающей точкой у него падает ниже уровня
i386/i387. Эта проблема существует для всех производимых на настоя­щий момент
387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87,
Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводил
такие тесты с 38700DX и пришел к ана­логичным выводам. Он связался с C&T, и
ему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц -
1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц
- 80$.


Процессор Cyrix
486DLC - последняя новинка на рынке заме­нителей i386DX. Набор его команд
совместим с i486SX, установлена 1 КВ кэш-память и аппаратно реализованный 16х16
бит умножитель. Испол­нительное устройство 486DLC, созданное с использованием
некоторых принципов RISC, выполняет большинство команд за один цикл. Аппарат­ный
умножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 - 25 циклов
у i386DX. Это особенно удобно при вычислении адресов (код, генерируемый
некоторыми неоптимизирующими компиляторами, мо­жет содержать много команд MUL
для доступа к массивам) и для прог­раммных вычислений с плавающей точкой
(напр., при эмуляции сопроцес­сора). Внутренняя кэш-память представляет собой
объединенную память команд и данных сквозной записи, и может быть
конфигурирована, как память с прямым отображением, или как 2-канальная
ассоциативная. Из-за необходимости обеспечения полной совместимости после
перезаг­рузки процессора кэш-память отключается, и должна быть включена с по­мощью
небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена при
загрузке, (напр., при "горячей" перезагруз­ке, Ctrl – Alt – Del) ,
BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либо
выполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это одна
из причин того, что после запуска процессора кэш-память отключается. Я уверен,
что в следующих вер­сиях BIOS фирмы AMI это будет учтено и встроенная
кэш-память будет поддерживаться. Кэш-память помогает процессору 486DLC
преодолеть ог­раничения интерфейса шины 386, хотя процент попаданий составляет
не более 50%. Фирма Cyrix предусмотрела некоторые возможности управле­ния кэш-памятью
процессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти.
Современные системы 386 не воспринимают эти управляющие сигналы, не имеющие
значения для i386DX, но в дальней­шем системы, разработанные с учетом этих
возможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до
4-х некэшируе­мых областей памяти, что может быть очень полезно в том случае,
ес­ли ваша система использует периферийные устройства, отображаемые в память
(напр., сопроцессор Weitek). В существующих системах 386 пе­ресылки DMA (напр.,
SCSI контроллера, платы звука) могут отключить внутренний кэш, так как не
существует других способов обеспечить соответствие кэш-памяти и основной
памяти, что, конечно, снижает ха­рактеристики 486DLC. Потребляемая мощность
486DLC 40 МГц - 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц по
текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не во
всех об­стоятельствах, особенно критичен в этом отношении многозадачный за­щищенный
режим (улучшенный режим MS- Windows). При использовании 486DLC совместно с
Cyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависает
из-за проблем синхронизации между ЦПУ и сопроцессором при исполнении команд
FSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора при
переключении задач. Лучше всего использовать 486DLC с Cyrix 387+
(распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992,
являющий­ся наиболее мощным сопроцессором среди совместимых сопроцессоров
486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать,
совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST,
распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi или
другие ftp-серверы. Если программа сообщит о соп­роцессоре 387+, то у вас
установлен либо 387+, либо аналогичная но­вая версия 83D87 и проблем с
совместимостью не будет.


При испытаниях использовалась система:


Аппаратная
конфигурация: 33,3/40 МГц системная плата, комплект микросхем Forex, кэш 128 КВ
с нулевым состоянием ожидания, прямое отображение, сквозная запись, один буфер
записи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основной
памяти, среднее сос­тояние ожидания 1,6 цикла. BIOS фирмы AMI. Процессор
Cyrix EMC87 в режиме совместимости 387, как матсопроцессор. Этот процессор
вместе с Cyrix 83D87/387+ являются самыми быстрыми сопроцессорами для рабо­ты с
386DX/486DLC/38600DX. Жесткий диск Conner 3204F, емкость 203 МВ, интерфейс IDE
(пропускная способность по тесту CORETEST 1100 КВ/с, время поиска 16 мс). Плата
SVGA (ISA, Diamond SpeedSTAR HiColor), используется ET4000, 1 МВ DRAM, как
экранный буфер, графи­ческий ускоритель отключен. Переключатели на видеоплате
установлены для наиболее надежной с быстрой работы, с пропускной способностью
6500 байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.


Программная конфигурация: MS-DOS 5.0, MS
Windows 3.1, HyperDisk


4.32 в режиме обратной записи,
используется 2 МВ расширенной памяти, в качестве менеджера памяти используется
386MAX 6.01. Эта программа также обеспечивает DPMI в некоторых тестах.


Результаты тестов


Для тестов
Whetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL и Savage больший показатель
означает большую производительность.


Для тестов MAKE RTL,
MAKE TRANK и теста String- Test меньший показатель означает большую
производительность.


33,3 МГц                          Intel 
C&T       Intel       Cyrix       Cyrix


386DX  38600DX RapidCAD 486DLC   486DLC


кэш выкл. кэш вкл.
Тесты с целыми числами


Whetstone (kWhet/s)            447     585       563        695          803


Drhystone(C) (Dhry./s)        11688 11819   12357    14150      15488


Drhystone(Pas) (Dhry./s)     10455 10877   10751    12154      13858


String-Test (ms)                    459     453       441        347          327


MAKE RTL (s)                     51,32  47,10    46,34     43,45       39,13


MAKE TRANCK (s)            62,42  55,47    55,37     53,64       46,12


WINTACH                           4,85    4.90      5.49       5.53         6.14


Тесты с плавающей запятой


DODUC (Индекс скорости)        79.0      76.4       150.3       89.4 90.7


LINPACK (Mflops)          0.2808             0.2707   0.4578     0.3158       0.3438


LLL (Mflops)                    0.3352             0.3537   0.6083     0.3816       0.4139


Whetstone (kWhet/s)        2540   2340     3990      2908        3061


Savage (решений/с)          71685 53191   72464    88757      93897


40 МГц                             Intel 
C&T       Intel       Cyrix       Cyrix


386DX  38600DX RapidCAD 486DLC   486DLC


Тесты с целыми числами                                      кэш
выкл. кэш вкл.


Whetstone (kWhet/s)            536     702       676        835          963


Drhystone(C) (Dhry./s)        14128 14116   14836    16987      18750


Drhystone(Pas) (Dhry./s)     12490 13067   12890    14573      16624


String-Test (ms)                    384     377       368        289          273


MAKE RTL (s)                     43.46  40.11    39.84     37.25       33.54


MAKE TRANCK (s)            53.00  47.59    47.07     45.36       39.00


WINTACH                           5.65    5.73      6.41       6.46         7.23


Тесты с плавающей запятой


DODUC (Индекс скорости)        94.9      77.5       180.3       105.1         106.6


LINPACK (Mflops)          0.3324             0.3260   0.5418     0.3789       0.4131


LLL (Mflops)                    0.4025             0.4204   0.7260     0.4562       0.4956


Whetstone (kWhet/s)        3061   2632     4798      3505        3677


Savage (решений/с)          86083 49587   86957    106762    112360


Среди испытанных
процессоров Cyrix 486DLC обладает самой большой производительностью по целым
числам. С включенной внутрен­ней кэш-памятью производительность по целым числам
на одинаковой так­товой частоте 486DLC на 80% превышает 386DX, среднее
увеличение ско­рости работы прикладных программ составляет 35%. При работе с
прик­ладными программами, использующими операции как с целыми числами, так и с
плавающей точкой, включенный кэш обеспечивает на 5% - 15% более высокие
показатели по сравнению с работой без КЭШа. Скорость операций с плавающей
точкой по сравнению с i386DX увеличивается на 15% - 30%


Intel RapidCAD при работе
вместо i386DX обеспечивает самые высокие характеристики при выполнении операций
с плавающей точкой. Прикладные программы, выполняющие интенсивные операции с
плавающей точкой, работают быстрее на 60% - 90% по сравнению с i386DX/387DX,
отставая от i486DX при той же тактовой частоте по скорости операций с плавающей
точкой всего на 25%. Скорость операций с целыми числами увеличивается на 15% -
35% по сравнению с i386DX/i387DX.


Процессор Chips & Technologies 38600DX обладает
несколько бо­лее высокими характеристиками при работе с целыми числами, чем
i386DX, давая среднее увеличение скорости порядка 10%.


 


 


 


5.2.
Результаты тестирования микропроцессоров с помощью па­кета The Speed Test.


Для тестирования различных
микропроцессоров иногда приме­няют специальные пакеты программ processor
benchmarks. Ниже приведе­ны результаты тестирования процессоров с помощью
пакета программ Speed Test, ARA Copyright (C) 1994,95,96 Agababyan Robert
Assotiation Used TMi0SDGL(tm)


Pentium iP5-200(3-200), 512K PB                               
1318841


Pentium iP5-200(2.5-200), 512K
PB                             1309353


Pentium iP5-200(2.5-200)                                             
1290780


Pentium iP5-200(3-200)                                                
1290780


Pentium iP5-180, 512K PB                                           
1181818


Pentium iP5-180                                                            
1151899


Pentium iP55-166, Intel Triton,
IWill TSW2                  1109756


Pentium iP5-166, 512K PB                                           
1096386


Pentium iP5-166                                                            
1076923


Pentium iP5-160, 512K PB                                           
1052023


Pentium iP5-160                                                            
1040000


Pentium iP5-150, 512K PB                                             
983784


Pentium iP5-150                                                             
968085


Pentium iP5-133, 512K PB                                             
879227


Pentium iP5-133                                                             
866667


Pentium iP54-75(1.5-120), Intel
Triton                            812500


Pentium iP54-75(2-120), Intel
Triton                               812500


Pentium iP54-75(2-120), SiS
501/503                             812500


Pentium iP5-100(2-120), Intel
Triton, ASUS P55-TP4        798246


Pentium iP5-120(1.5-120), 512K
PB                               798246


Pentium iP5-120, 512K PB                                             787879


Pentium iP5-120(1.5-120)                                               781116


Pentium iP5-120                                                              777778


Cx5x86-M1sc-100(3-150,Opt)                                        771186


Cx5x86-M1sc-100(3-150,Opt)                                        758333


Am5x86-133-X5-P75(4-200)                                          710938


Pentium iP5-100, ALR Revolution                                  679104


Pentium iP5-100, Intel Triton,
ASUS P/I-P55TP4XE     669118


Pentium iP5-100, Intel Triton                                          669118


Pentium iP54-75(100), Intel
Triton                                  669118


Am5x86-133-X5-P75(3-180),
UMC8886BF/8881F        640845


Cx5x86-M1sc-100(3-120,Opt)                                        614865


Pentium iP54-75(90), Intel
Triton, ASUSTeK P54-TP4  606667


Cx5x86-M1sc-100(3-120,Opt), SiS
471, GMB-486SG   600660


Am5x86-133-X5-P75(4-160), SiS
471, BTC 4SLD5.1   568750


Am5x86-133-X5-P75(4-160), SiS
496/7, ASUS PVI-SP3   568750


Am5x86-133-X5-P75(4-160), SiS
471                            561730


Am5x86-133-X5-P75(4-160), SiS
496 PCI                     561728


Am5x86-133-X5-P75(4-160)                                          561128


Cx5x86-M1sc-100(3-120), SiS
496/7, ASUS PVI-SP3   548193


Cx5x86-M1sc-100(3-120,Opt), SiS
471, GMB-486SG   535294


i80486DX4-100(120), UMC 8498F                                535294


Am5x86-133-X5-P75(3-150), SiS
471, BTC 4SLD5.1   529070


Cx5x86-M1sc-100(Opt)                                                  511236


Nx586-90(100), NxVL System
Logic, Alaris                  505450


Cx5x86-M1sc-100(Opt), SiS 471,
GMB-486SG             501377


Am5x86-133-X5-P75, SiS 471, BTC
4SLD5.1               469072


Am5x86-133-X5-P75, SiS 496/7,
ASUS PVI-SP3          469072


Cx5x86-M1sc-100, SiS 496/7,
ASUS PVI-SP3               455000


i80486DX4-100, UMC 881                                             455000


Nx586-90, NxVL System Logic,
Alaris                           455000


Pentium iP5-60(66), PCI58PL                                         450495


Pentium iP5-60(66), SiS
501/502/503, ASUS P5-SP      450495


Cx5x86-M1sc-100, SiS 471,
GMB-486SG                     446078


i80486DX2-66(4-100), PC Chips
18                               446078


i80486DX4-100, SiS 82C471, SOYO                             446078


OverDrive iDX4ODPR100
(486DX4-100)                      437500


i80486DX4-100, Compaq ProLinea
4/100                      433333


Am80486DX4-120SV8B, SiS 471,
BTC 4SLD5.1         425234


Am80486DX4-120, SiS 471, SOYO                               425234


Pentium iP5-60, Compaq DeskPro
XL 560                     406250


Pentium iP5-60, Compaq Proliant                                   406250


Pentium iP54-75(60), Intel
Triton                                    406250


Pentium iP5-60, OPTi
596/546/82, Bison III v1.0           406250


Pentium iP5-60, SiS
501/502/503, ASUS P5-SP             406250


Am80486DX2-80(100), UMC 8498F                             352713


Am80486DX4-100, PC Chips 18                                    350000


Am80486DX2-80(100), SiS 471                                     345351


Cx80486DX2-100, Opti VIP                                           344697


i80486DX4-100(75), UMC 881                                      337037


Pentium iP54-75(50), Intel
Triton                                    334559


Pentium iP54-75(45), Intel
Triton                                    303333


U5-S33(60), UMC 491F                                                  301325


i80486SX2-50(80), SiS 471,
S486G                               282609


i80486DX2-S-80, PC Chips 18                                       280864


i80486DX2-80, Symphony Haydn II                              280864


i80486DX2-S-80, UNICHIP
U4800VLX, U486 WB      280864


Cx80486DX2-66(80), OPTi 495SLC                              277560


U5-S33(50), SiS 471, AV7541                                        250000


U5-S33(50), SiS 471, SOYO                                           250000


U5-S33(50), UMC 491F                                                  250000


U5-S33F(50), UMC 8498F                                              250000


U5-S33(50)                                                                      246612


U5-S33(50), CONTAQ 82C596A,
G486VLI                  245946


U5-S40(50)                                                                      245946


i80486DX2-66, DELL                                                     238196


Am80486DX2-66, Forex 46C421                                   234964


Am80486DX2-66, Bioteq 82C3491                                234536


Am80486DX2-66, OPTi 495SLC                                   234536


i80486DX2-66 &E5, AcerMate
466                                234536


i80486DX2-66, ALI M1429/M1431                                234536


i80486DX2-66, SiS 82C471                                            234536


i80486DX2-66, Symphony,
Predator I                           234536


i80486DX2-66, OPTi 82C682, ALR
Evolution 4           233333


i80486DX2-66, PC Chips
11&13                                   233333


Am80486DX2-66, IMS 8849                                          232143


i80486DX2-66, Compaq ProLinea
MT 4/66                   232143


Am80486DX2-66, UNICHIP
U4800VLX, U486 WB     230964


i80486DX2-66, Intel Champion                                      230964


Cx80486DX2-66, UMC 82C491F                                  230964


OverDrive iDX2ODPR66
(486DX2-66)                          230964


Am80486DX2-66, SiS 82C471                                       229798


i80486DX2-66, Symphony Haydn II                              229768


i80486DX2-66, SiS 82C471                                            228643


U5-S33(40), SiS 82C471                                                 200441


U5-S33F(40), UMC 8498F                                              200441


U5-S33(40), Expert 4045                                                194861


i80486DX-50, UMC 82C480                                          176357


i80486DX2-50, Headland
HT342/HT321                       176357


i80486SX-50, SiS 82C471                                              176357


Am80486DX-50, UMC 82C491F                                   173004


i80486DX-50                                                                   173004


i80486DX2-50, OPTi 495SLC                                        171053


Cx486S-40(50), UMC 82C491F                                     171053


U5-S33, SiS 82C471                                                       167279


U5-S33, Expert 4045                                                      162645


IBM486SLC2-66, OPTi 495XLC                                    161922


i80486SX-33(40), SiS 82C471                                        140867


i80486SX-33(40), OPTi 82C495SLC                              140867


Am80486DX-40, OPTi 82C495SLC                               140432


i80486SX-33(40) &E5, Forex
521                                  140000


i80486SX-33(40), Forex 521                                           139571


Am80486DX-40, SiS 82C461                                         138931


Cx486DX-40                                                                   135821


Ti486DLC/E-40BGA, PC Chips,
M321                          126389


Cx486DLC-40                                                                 126389


Tx486DLC-40, OPTi 495SLC                                         126039


Cx486DLC-40GP, SARC RC4018A4                             123641


IBM 486SLC2-50, WD7600                                            122642


Cx486SLC-40, SARC RC2016A4,
M396F                     120053


i80486SX-33, SiS 82C471                                              117571


i80486DX-33, HP Vectra 486/33VL                               116967


i80486DX-33, OPTi 82C498,
Simens-Nixdorf PCD-4H 116967


i80486SX-20(33), Symphony                                         116967


i80486DX-33, Intel Champion                                        116667


i80486DX-33, Toshiba T9901C,
LapTop                       116667


i80486DX-33, UMC 82C481                                          114035


i80486SX-25, IBM PS/1                                                  
88694


i80486SX-25, SiS                                                             
87838


i80486SX-25, HiNT CS8005                                           
87500


i80486SX-25, HP Vectra
486SX/25VL                             86502


Am80386DX-40, ALI M1429/M1431                              
81835


Am80386DX-40, CD-COM, M326                                  
81835


Am80386DX-40 WC, SARC                                           
81835


Am80386DX-40, UMC 82C491F                                    
81688


Am80386DX-40, OPTi 82C391                                       
81531


Am80386DX-40, UNICHIP U4800VXL                         
81182


Am80386DX-40, PC Chips 5,6                                       
80817


Am80386DX-40, UMC 80C481                                      
80647


Am80386DX-40, OPTi 495XLC                                      
80531


Am80386DX-40, Forex
FRX46C402,411                        80247


Am80386SX-40, P9 MXIC                                              
73387


i80386DX-33                                                                   
68114


Am80386SX-40, M396F                                                  
67407


Am80386SX-40, Acer M1217                                         
63459


Am80386SX-40, ALI M1217                                           
62329


Am80386SX-40, PC Chips 2                                           
61905


i80386SX-33, Acer M1217                                              
51066


i80386SX-33                                                                    
49296


i80386DX-25                                                                   
48925


i80386SX-33, HP Vectra
386SX/33N                               48611


Am80386SX-33, Acer M1217                                         
47744


80286-25                                                                          
45867


80286-20                                                                          
38625


Harris 80286-20, UMC 82C208L                                    
37387


80286-16, HT12                                                               
29111


i80286-12.5                                                                      
24125


i80286-12                                                                         
22392


i80286-10, IBM PS/2                                                       
15545


i80286-10, IBM PS/2 60                                                  
15242


i8088-9.54, Commodore PC-20                                         
5395


i8088-7.16, Commodore PC-20                                         
4011


i8088-4.77, EC-1841                                                         
2968


i8088-4.77, Original XT                                                     
2697


i8088-4.77, Commodore PC-20                                         
2658

 




6. Сравнительный анализ.


В середины октября
1995 года в г. Сан-Хосе (Калифорния) сос­тоялся очередной Микропроцессорный
Форум. В прошлом году на нем де­монстрировались прототипы процессоров IBM Power
PC 620, MIPS R10000, SUN UltraSPARC, HP PA-8000 и DEC Alpha 21164.


Из прошлогодних
процессоров – дебиторов до рынка дошел только процессор Alpha 21164/300. Его
производительность по тесту SPECint92 составила 341 единицу. Пребывая с такой
потрясающей производи­тельностью в лидерах гонки на быстродействие процессоров,
в ноябре Alpha пропустила вперед компанию Intel с процессором Pentium Pro.
Страсти накалились нешуточные и вот на нынешнем форуме Digital сооб­щила, что в
декабре приступит к выпуску нового варианта этого про­цессора - Alpha 21164A с
тактовой частой 333 МГц, выполненного по технологии 0.35 мкм. Проектируемая
производительность 500 по SPECint92.


Hewlett – Packard
анонсировала 32-разрядный процессор архитек­туры РА следующего поколения
РА-7300LC с встроенными функциями мультимедиа. Hачало его выпуска по 0.5 мкм
технологии возможно во второй половине следующего года. Этот первый процессор
PA-RISC, ос­нащенный внутренними 64 Кбайт КЭШами первого уровня для команд и
для данных, предпочтительно будет иметь 200 SPECint92 и 275 SPECfp92.


Через год после
объявления процессора UltraSPARC фирма SPARC Technology представила новый
проект UltraSPARC- II. Hовый процессор будет иметь 5.4 млн. транзисторов,
изготавливаться по технологии


0.35 микрон, работать на частоте 250-300
МГц. Проектируемое быстро­действие 250 МГц версии - 350 SPECint92 и 550
SPEFfp92. Кроме базо­вой системы команд, процессор будет оснащен набором из 30
новых ко­манд Visual Instruction Set, которые предназначены для быстрой обра­ботки
видеофайлов в формате MPEG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.


Рождение Pentium Pro
восхитительная новость, но оно неизмен­но поднимает несколько серьезных
вопросов. Hа самом ли деле это пол­ностью новое поколение процессора Pentium?
Побила ли Intel своих конкурентов окончательно? Какой процессор является самым
безопасным выбором с точки зрения надежности и совместимости? Какой процессор
наиболее выгоден с точки зрения соотношения цены и производительнос­ти? Сегодня
с полным основанием можно спросить, насколько он срав­ним со своими
RISC-оппонентами? Hе устарел ли лозунг Apple о том, что Power Mac
перспективнее, чем линия x86?


Hа все вопросы можно
ответить в принципе утвердительно. Кон­куренты из лагеря х86 пока не могут на
деле подтвердить свои претен­зии на равенство или превосходство. Hичего живого
или приличного (Cyrix) на руках пока нет. А ценовой ориентир Intel известен:
нас­тольный high – end  компьютер на платформе Aurora, Pentium Pro 150 MHz, ОЗУ
16 Мб, жесткий диск EIDE 1 Гб, 2 Мб SVGA, монитор 17" NI digital SVGA,
Windows 95 в декабре обойдется жадным к мощности пользовате­лям дешевле $5000.
Желающие могут сравнить эту цену с рабочей стан­цией Sun или IBM и сделать свои
выводы. Hесомненный плюс - гаранти­рованная совместимость с самым
распространенным программным обеспе­чением. Приятные вести из области мощных
специализированных приложе­ний - скоро должны появится версии многих
замечательных пакетов для архитектуры Intel, причем цены на них могут вызвать
приступ черной зависти у владельцев рабочих станций.


Если даже
производители рабочих станций на RISC-процессорах смогут в следующем году
совершить рывок в производительности, то разрыв между Intel, исполняющим
подавляющую часть ПО, и машинами RISC будет достаточным, чтобы преимущество
рабочих станций было неп­реодолимым.


В первом номере
Computer Week Moscow можно найти пассаж ин­тересного характера. Дословно:
"Опытные системы P6 способны на большее, чем просто выдерживать
конкуренцию со стороны других рабо­чих станций среднего класса. При
непосредственном сопоставлении ра­бочих станций Intergraph на 200-МГц
процессоре Pentium Pro и Silicon Graphics Indigo-2 Extreme с 200-МГц
процессором Mips R4400, послед­няя на тестах iSPEC показала порядка 160 единиц,
тогда как оценки Intel для системы P6 полной конфигурации соответствуют 366
единицам."


При создании
процессора Pentium Pro делался упор на способ­ности этой микросхемы выполнять
графический рендеринг и работать с 32-разрядным кодом.


Pentium Pro явно
выламывается из рамок процессора Pentium и принадлежит шестому поколению
архитектуры Intel x86. Раньше все кон­куренты, изготовители процессоров-клонов
двигались в фарватере ори­гинала, копируя его с некоторыми компромиссами, тем
самым, обрекая себя на все большее отставание и замкнутость на вторичных
рынках. Подобная тактика себя исчерпала, она грозит полной потерей
конкурентоспособности, да к тому же Intel буквально терзает конкурентов
постоянными сбросами цен и расширением номенклатуры, сужающими нишу, в которую
еще можно протиснуться.


Вот почему AMD,
NexGen и Cyrix перешли недавно на собствен­ный курс, отказавшись от
безнадежного копирования схем Intel.


Hо принципиальной
прорасти между конкурентами нет. В некото­рых случаях Pentium Pro более сложен,
чем Nx586, K5 и M1, в других менее. В целом же схема P6 сравнима с прочими
процессорами; наибо­лее близок к ней дизайн К5, как считают эксперты.


Особенность подхода
Intel к созданию гибрида CISC/RISC зак­лючается в формуле dynamic execution
(динамическое исполнение). При­мерно такие же базовые принципы вы обнаружите,
если станете разби­раться подробно с архитектурой последних RISC-процессоров
IBM/Motorola PowerPC 604 и Power PC 620, Sum UltraSparc, Mips R10000, Digital
Alpha 21164 и HP PA-8000.


Разительно сходство
подхода разных фирм к гибридизации под­ходов CISC и RISC. Внешне Pentim Pro
выглядит традиционным CISC-про­цессором, совместимым со всем наработанным
программно-аппаратным фондом. Знакомый "фасад" прикрывает от
пользователя RISC-подобное ядро. Между "фасадом" и "задними
комнатами" работает умнейший деко­дер, разбивающий сложные и длинные
команды х86 на более простые опе­рации, похожие на команды RISC - компания
Intel называет их u-ops или micro - ops. Эти micro - ops поступают в ядро
процессора, кото­рое их буквально перелопачивает. Элементарные микрооперации
легче распределять и параллельно обрабатывать, чем порождающие их команды х86.
Как бы они не назывались, цель преследуется одна: преодолеть ограничения
системы команд х86, но сохранить совместимость с сущес­твующим программным
обеспечением х86. Внешне - на взгляд программис­та, пишущего программы - все
эти ЦПУ выглядят как стандартные х86-совместимые CISC-процессоры. А внутри они
работают как современ­нейшие модели RISC-чипов.


Hо сегодня Pentium
Pro "живее" и быстрее не только любого из "живых"
процессоров архитектуры х86, включая Nx586 и Cyrix6x86, но и любого из
выпускаемых RISC-процессоров.


Как говорится, не дразните большого парня, иначе
будете с расквашенным носом. Именно таков смысл послания Intel в адрес конку­рентов:
NexGen, Cyrix и AMD.


 




7. Pentium II.


7.1
Pentium II


Выпущенный с середины 1997 года, Pentium II ввел ряд
больших изменений в мир процессоров PC.


Во-первых, чип и системный кэш второго уровня
соединялись по выделенной шине, способной работать на частоте шины
процессор-система.


Во вторых, процессор, вторичный кэш и тепло отвод
были смонтированы на небольшой плате, вставлявшейся в разъем на системной
плате, что больше напоминало карту расширения, чем традиционную схему
процессор/гнездо. Intel окрестил это Single Edge Contact cartridge (SEC) -
односторонне контактный картридж. В этом картридже находятся шесть отдельных
компонент - процессор, четыре индустриально стандартных burst-static-cache RAM
и один tag RAM. Дизайн SEC картриджа наделял важными преимуществами.
PGA-компоновка Pentium Pro требовала 387 контактов, в то время как SEC-картридж
- только 242. Уменьшение на треть числа контактов произошло благодаря наличию в
картридже дискретных элементов, таких как замыкающие резисторы и конденсаторы.
Эти элементы обеспечивают расщепление сигналов, что значит намного меньшее
число требуемых разъемов питания. Разъем SEC-картриджа использует так
называемый Slot 1 и воспринимается как принимающий эстафету у уходящего Socket
7.


Третье изменение - в большем синтезе, так как
Pentium II объединяет Dual Independent Bus (DIB) от Pentium Pro c технологией
MMX от Pentium MMX, формируя новый вид - гибрид Pentium Pro/MMX. Таким образом,
внешне очень отличный от предыдущих интеловских процессоров, Pentium II
внутренне являет собой смесь новых технологий и улучшений старых чипов.


И наконец, в отличие от Pentium Pro, работающего на
3.3v, Pentium II питается от 2.8v, позволяя Intel пускать его на больших
частотах без чрезмерного увеличения требование к мощности. В то время, как
200MHz Pentium Pro с 512kb кэша потребляет 37.9 ватт, 266MHz Pentium II с 512kb
кэша сжигает 37.0 ватт.


Подобно Pentium Pro, Pentium II применяет
интеловскую Технологию Динамического Исполнения. Когда программная инструкция
считывается в процессор и декодируется, она попадает в исполняемый пул.
Технология Динамического Исполнения принимает три основных подхода к
оптимизации способа обращения процессора с кодом. Множественные Предсказания
Ветвлений проверяют программный поток вдоль нескольких ветвей и предсказывают,
где в памяти находится следующая инструкция.


Когда процессор читает, он также проверяет следующие
инструкции в потоке, ускоряя в результате рабочее течение. Анализ Потока Данных
оптимизирует последовательность, в которой инструкции будут выполняться,
проверяя декодированные инструкции и определяя, готовы ли они для обработки или
зависят от других инструкций. Спекулятивное Выполнение увеличивает скорость
таких инструкций просмотром вперед от текущей инструкции и обработкой
дальнейших инструкций, которые вероятно могут понадобится. Эти результаты
хранятся как спекулятивные до тех пор, пока процессор не определит, какие ему
нужны, а какие - нет. С этой точки инструкция возвращается в нормальную очередь
и добавляется к потоку.


У Технологии Динамического Исполнения есть два
основных преимущества: Инструкции обрабатываются быстрее и эффективнее, чем
обычно, и, в отличие от CPU с применением RISC архитектуры, программы не надо
перекомпилировать для извлечения выгод процессора. Процессор все делает на
лету.


Значительной новой особенностью является удаление
вторичного кэша из собственно процессора на отдельную кремниевую пластину в
картридже. Процессор читает и пишет данные в кэше используя специализированную
высокоскоростную шину. Называемая задней (backside) шиной, она отделена от
системной шины процессор-память (сейчас называемой передней (frontside) шиной).
Процессор может использовать обе шины одновременно, но архитектура двойной
независимой шины имеет другие преимущества.


Хотя шина между процессором и кэшем второго уровня
работает медленнее, чем на обычном Pentium Pro (на половине скорости
процессора), она чрезвычайно масштабируема. Чем быстрее процессор, тем быстрее
кэш, независимо от 66MHz передней шины. Вдобавок, передняя шина может быть
увеличена с 66 до 100MHz без влияния на шину кэша второго уровня. Также
очевидно, что наличие памяти на одном кристалле с процессором негативно
сказывается на проценте выхода годных 512kb Pentium Pro, сохраняя высокими
цены.
Pentium II опирается на GTL+ (gunning-transceiver-logic) логику хост-шины,
допускающую естественную поддержку двух процессоров. Во время выхода это
обеспечивало стоимостно эффективное минималистское двухпроцессорное решение,
допускаемое симметричной мультипроцессорностью (SMP). Двухпроцессорное
ограничение налагалось не самим Pentium II, а поддержкой чипсета. Изначальное
ограничение чипсета двухпроцессорной конфигурацией позволяло Intel и
поставщикам рабочих станций предлагать двухпроцессорные системы как временное и
экономичное решение, что по другому и не было возможно. Это ограничение было снято
с середины 1998 года с выходом чипсета 450NX, поддерживающего от одного до
четырех процессоров. Чипсет 440FX, содержащий чипы PMC и DBX, не допускал
чередования (interleaving) памяти, но поддерживал EDO DRAM, позволяя улучшать
производительность памяти уменьшением ожидания.


Когда Intel проектировал Pentium II, он также взялся
за слабую 16-битную производительность его предшественника. Pentium Pro
роскошно работает с полностью 32-битным обеспечением, таким как Windows NT, но
опускается ниже стандартного Pentium'а, обрабатывая 16-битный код. Это влечет
худшую чем Pentium производительность под Windows 95, большие части которой
пока 16-битны. Intel решил эту проблему использованием пентиумного кэша с
дескрипторами сегментов в Pentium II.


Как и Pentium Pro, Pentium II
чрезвычайно быстр в арифметике плавающей точки. В сочетании с Accelerated
Graphics Port (AGP) это делает Pentium II мощным решением для
высокопроизводительной 3D графики.


7.2 Deschutes


333MHz воплощение Pentium II
под кодовым названием Deschutes (по реке, текущей в Орегоне), было анонсировано
в начале 1998 года с планируемыми в течение года 400MHz и выше. Имя Deschutes в
действительности относится к двум разным линиям CPU.


Версия для Slot 1 - ничего
более, чем слегка эволюционировавший Pentium II. Архитектура и физический
дизайн идентичны, за исключением того, что Deschutes Slot 1 частью сделан с
использованием 0.25-микронной технологии, введенной осенью 1997 года с
ноутбучным процессором Tillamook, по сравнению с 233-300MHz версиями, выполненными
по 0.35-микронному процессу. Применение 0.25-микрон означает, что транзисторы
на матрице физически ближе между собой и CPU потребляет меньше энергии, а
следовательно рассеивает меньше тепла на данной частоте, позволяя ядру тикать
на больших частотах.


Все иное у Slot 1 Deschutes идентично обычному
Pentium II. Смонтированный на основание и заключенный в SEC картридж, он
поддерживает набор инструкций MMX и общается с 512kb вторичного кэша на
половинной частоте ядра. Он имеет тот же конечный коннектор, и работает на тех
же системных платах с теми же чипсетами. Как таковой он работает с 440FX или
440LX на внешней частоте 66MHz.


С весны 1998 года большой шаг
в производительности пришел со следующим воплощением Deschutes, когда вышел
новый чипсет 440BX, допускающий 100MHz передачу по системной шине, уменьшая
закупоривание данных и поддерживая частоты от 350 до 400MHz.


Другой процессор, зовущийся Deschutes, относится к
Slot 2, выпущен с середины 1998 года как Pentium II Xeon. Intel разбил Slot 1 и
Slot 2 Deschutes на взаимодополняющие товарные линии, где Slot 1 предназначен
для массового производства, а Slot 2 нацелен на high-end серверы и туда, где
цена вторична по отношению к производительности.


7.3 Мобильный Pentium II


Естественное
продвижение маломощного (в смысле энерго потребления/рассеивания) семейства
Pentium II Deschutes на рынок портативных PC осуществилось с выпуском линейки
мобильных Pentium II в апреле 1998 года. Новый процессор и его компаньон
мобильный 440BX чипсет, изначально были доступны в 233 и 266MHz вариантах,
скомпонованные в существующий мобильный модуль (MMO) или новый мини-картридж
формат. Intel ожидает к концу 1998 года более половины из снаряженных его
мобильными процессорами PC будут уже Pentium II, а срок мобильных Pentium II Tillamook
окончится к середине 1999 года.


7.4 Celeron


В попытке лучшего удовлетворения сектора дешевых PC,
до настоящего времени вотчины производителей клонов, AMD и Cyrix, продолжающих
развивать унаследованную архитектуру Socket 7, Intel выпустил свой ряд
процессоров Celeron в апреле 1998 года.


Основанный на той же P6
архитектуре, что и Pentium II, и используя тот же 0.25-микронный процесс,
Celeron-системы предлагают полный комплект последних технологий, включая
поддержку AGP графики, ATA-33 жестких дисков, SDRAM и ACPI. Celeron будет
работать на любом интеловском Pentium II чипсете, поддерживающим 66MHz
системной шины, включая 440LX, 440BX и новый 440EX, специально спроектированный
для рынка 'базовых' PC. В отличие от Pentium II с его SEC картриджем, Celeron
не имеет защитного пластикого покрытия вокруг карт процессора, что Intel
называет Single Edge Processor Package (SEPP). Он полностью совместим со Slot1,
что позволяет использовать существующие платы, но механизм крепления для карты
CPU не адаптирован для форм фактора SEPP.


Первые 266 и 300MHz Celeron'ы без кэша второго уровня
встретили мало энтузиазма на рынке, не неся или неся мало преимуществ над
системами-клонами Socket 7. В августе 1998 года Intel пополнил ряд Celeron
семейством процессором, названных Mendocino. Снабженный 128kb вторичного кэа на
матрице, работающего на полной частоте процессора, и соединяясь через внешнюю
66MHz шину, новый Celeron стал намного более живым, чем его вялый
предшественник. Отчасти путано, две доступные версии получили названия Celeron
333 и 300a. Первый является основной версией, совместимый с существующей
интеловской архитектурой, в то время как второй патентует Pin 370 socket,
отличный от Socket 7 и Socket 1, нацеленный на дешевые low-end машины.
7.5  PentiumXeon


C
начала июля 1998 года по всему миру проходила серия мероприятий, посвящённых
представлению самого мощного процессора архитектуры х86 корпорации Intel.
Задолго до этого из информации, размещённой на Web-сайтах Intel стало известно
его название и назначение. Особо подчёркивалось, что слово Xeon нежно
произносить как «Зеон», но российское представительство приняло решение
подчинить это название нормам русского (и греческого) языка. Так что в России
мы будем иметь дело с «Ксеоном»,- ведь есть же у нас Ван Клиберн и Мехико.


  
Новый процессор, к слову, стал подарком компании-производителя самой себе по
случаю тридцатилетия.


 
Первое, что бросается в глаза, - необычно крупный размер процессорного
картриджа в который «пакуется» Xeon. Он предназначен для установки в
разъём  новой конструкции Slot 2. По словам разработчиков, это связанно с
увеличением ёмкости кэш-памяти второго уровня. В настоящий момент процессоры
Xeon с единой тактовой частотой поставляются в двух вариантах: с 512 Кбайт и 1
Мбайт КЭШа L2. Но уже в текущем году планируется довести ёмкость кэш-памяти
второго уровня до 2 Мбайт и повысить тактовую частоту до 450 МГц. Напомню, что
старый Pentium II комплектовался лишь 512 Кбайт.


  
Но ещё больший интерес вызывает тот факт, что конструкторы смогли «заставить»
L2-кэш работать на тактовой частоте процессорного ядра. Напомню, что та же
концепция была реализована в Pentium Pro, но при этом разработчики
«столкнулись» на стадии производства (процент выхода двух качественных
кристаллов оказался ниже предполагаемого), и процессор оказался довольно
дорогим. Возможно, именно поэтому Pentium II изначально создавался с
«разделением» кристаллов (основного и КЭШа L2), за что пришлось расплачиваться
«половиной» тактовой частоты кэш-памяти второго уровня.


  
Высокая частота работы КЭШа спровоцировала увеличение теплоотдачи процессорного
блока, поэтому потребовалось использование массивной поглощающей тепло
пластины, что, в свою очередь, привело к увеличению веса и габаритов модуля.


  
В каждом модуле Slot 2 три специальных области данных: доступная только для
чтения, область для чтения/записи и  динамическая информация о 
температуре внутри процессорного модуля. В области первого типа помещена
информация о версии процессора, данные о пошаговой отладке и указана предельно
допустимая температура. Во второю область памяти пользователи могут вводить
свою информацию.


Доступ
к динамическим данным об изменении температуры даёт возможность управляющим
программам оповещать администратора  об


опасных
системных событиях.


  
Увеличение ёмкости КЭШа второго уровня повышает пропускную способность системы
благодаря мгновенному доступу процессоров к часто используемым данным и
инструкциям, хранящимся в быстрой кэш-памяти. По заявлению Intel, увеличение
ёмкости КЭШа с 512 Кбайт до 1 Мбайт приводит иногда к 20% росту общей
производительности системы.


Для
объяснения этого явления уместно провести аналогию с холодильниками,
используемую Intel: хранение запаса продуктов в


холодильнике
избавляет поваров ресторана от необходимости ездить по магазинам, закупая
провизию. Чем больше холодильник, тем лучше,


особенно
в час пик, когда количество клиентов в ресторане резко возрастает. Так вот, в
случае с сервером «холодильник» - это кэш-память второго уровня, а «магазин»
(где доступны те же продукты) - в принципе более медленная системная память.


Большой
кэш L2 значительно повышает общую производительность многопроцессорных
конфигураций в системах, работающих с крупными массивами несопоставимых данных.
По информации Intel, проведённые корпорацией тесты ZD ServerBench показали
почти


пропорциональный
рост производительности системы по мере установки дополнительных процессоров с
мегабайтным КЭШем.


  
Усовершенствованная архитектура Xeon, допускающая 36-разрядную адресацию
физической памяти, теоретически позволяет процессору получать доступ к
системной памяти ёмкостью до 64 Гбайт. Новый механизм постраничного обмена Page
Size Extension - 36 останется практически незаметной для глаз пользователя и
разработчиков приложений. В настоящее время PSE-36 поддерживают операционные
системы Windows NT, SCO UnixWare
и Sun Solaris. Для остальных операционных систем потребуется
обновить драйвер блока управления памятью.


  
Intel 450NX PCIset стал первым микросхемным  набором, оптимизированным для
Pentium II Xeon. Он выпускается в двух вариантах, Basic и Full, соответственно
для серверных hi-end и систем среднего уровня. Они имеют одинаковую структуру
ядра, но отличаются производительностью и ценой.


  
Basic PCIset поддерживает до двух разъёмов 32-разрядной PCI, один -
64-разрядной и до 4 Гбайт системной памяти типа EDO. Его более


совершенный
«родственник» Full PCIset поддерживает до четырёх слотов типа EDO. Эти чипсеты
объединяет функционирование на


100-мегагерцовой
частоте системной шины и возможность поддержки многопроцессорных (до четырёх
Xeon) конфигураций. 64-разрядная


шина
PCI способна существенным образом повысить общую производительность системы с
учётом оптоволоконной технологии обмена данными с дисковыми массивами,
использования высокопроизводительных сетевых магистралей на основе АТМ, Gigabit
Ethernet и других. Повышается, по сути, синхронизация мощности процессора и
производительности подсистемы ввода-вывода.


  
Xeon, как я уже отмечал, предназначен не только для серверов, но и для рабочих
и графических станций, для которых одним из важнейших


параметров
является производительность видеоподсистемы. Для них разработан чипсет Intel
440GX AGPset на базе известного микросхемного набора 440BX. 440GX управляет
работой порта AGP в режиме 2х. Режим удвоенной производительности реализуется
благодаря так называемой технологии двойной накачки - данные передаются как по
переднему, так и по заднему фронтам тактовых импульсов (у обычной AGP - только
по переднему), при этом полоса пропускания достигает значения 533 Мбайт/с.
Физические параметры интерфейса AGP остаются прежними. 


  
Ещё одой особенностью набора чипсета  440GX стала возможность обращения к
памяти ёмкостью до 2 Гбайт, что в два раза больше, чем у


его
приемника.


  
Несмотря на тот факт, что в настоящий момент понятие многопроцессорности
ассоциируется у Intel лишь с четырьмя устройствами на одной плате, ведутся
работы по созданию симметричных мультипроцессорных систем, поддерживающих до
восьми «Ксеонов». Разработки восьмиканального чипсета для Xeon ведутся фирмой
Corollary, дочерней компанией Intel. И, само собой, возможны кластерные
решения, скажем, на основе архитектуры распределённой памяти (NUMA). В обоих
случаях, как правило, не требуется «переписывать» прикладные программы (правда,
операционная система требует некоторой оптимизации). В процессорной шине
чипсета Intel 450NX PCIset предусмотрен так называемый разъём кластерного
соединения, что упрощает построение кластерного соединения на основе
стандартных четырёхпроцессорных узлов.


  
Ещё одним перспективным направлением является кластер с передачей сообщений.
Суть её состоит в отсутствии разделения ресурсов. Отдельно стоящие узлы
кластера обмениваются данными, например, тактовыми импульсами, сигнализирующими
о нормальном состоянии системы. И хотя LAN-соединение остаётся работоспособным,
существует необходимость в сети нового типа - так называемой SAN (System
 area Network).


  
В завершении хотел бы отметить, что некоторые ведущие западные производители
(IBM, NCR, Dell) уже начали поставки систем на базе


Xeon,
а на презентации процессора в России компании Kraftway и «Вист» также
представили свои новые серверные решения.


Ориентировочные цены на Pentium Xeon составят 1124
долларов (L2 512 Кбайт) и 2836 долларов (L2 1 Мбайт) при поставках от тысячи штук.

Список литературы:


Д-р Джон Гудмен
"Управление памятью для всех",


Диалектика, Киев, 1996


В.Л. Григорьев
"Микропроцессор i486. Архитектура и программирование", Гранал,
Москва, 1993.


Информационно - рекламная газета "КМ -
информ"


газета "Компьютер World/Киев"


газета "Компьютер Week/Moscow"


Ж.К. Голенкова и др.
"Руководство по архитектуре IBM PC AT", Консул, Минск, 1993


Руководство программиста по
процессору Intel i386,


Техническая документация
уровня 2, (C) Intel Corp.


Руководство программиста по процессору Intel i486,


Техническая документация
уровня 2, (C) Intel Corp.


Материалы эхоконференции
SU.HARDW.PC.CPU компьютерной сети FidoNet

Сохранить в соц. сетях:
Обсуждение:
comments powered by Disqus

Название реферата: Процессоры

Слов:18454
Символов:167720
Размер:327.58 Кб.