Архітектура комп'ютерів

Автор работы: Пользователь скрыл имя, 30 Января 2013 в 20:33, курс лекций

Описание

Микропроцессор (МП) — центральное устройство ПК, предназначенное для управления работой всех блоков машины и для выполнения арифметических и логических операций над информацией.

Работа состоит из  1 файл

Konspekt_lekts-Arkhitektura.doc

— 7.91 Мб (Скачать документ)

Лекция 4

Микропроцессоры Pentium Pro

В сентябре 1995 года были выпущены МП шестого поколения 80686 (Р6), торговая марка Pentium Pro. Микропроцессор состоит из двух кристаллов: собственно МП и кэш-памяти. Но он не полностью совместим с просто Pentium и, в частности, требует специальную системную плату. Pentium Pro прекрасно работает с 32-битовыми приложениями, а в 16-битовых иногда даже несколько проигрывает просто Pentium, Новые схемотехнические решения обеспечивают для ПК более высокую прон шодительность. Часть этих новшеств может быть объединена понятием «динамическое исполнение» (dynamic execution), что, в первую очередь, означает наличие многоступенчатой суперконвейерной структуры (superpipelining), предсказания ветвлений программы при условных передачах управ-

ления (multiple branch prediction) и  исполнение команд по предполагаемому  пути ветвления (speculative execution).

В программах решения  многих задач, особенно экономических, содержится большое число условных передач управления. Если процессор может заранее предсказывать направление перехода (ветвления), то производительность его работы значительно повысится за счет оптимизации загрузки вычислительных конвейеров. Тем не менее следует сказать, что если путь ветвления предсказан неверно, процессор должен сбросить полученные результаты, очистить конвейеры и загрузить нужные команды заново, что требует довольно большого числа тактов. В процессоре Pentium Pro вероятность правильного предсказания 90 % против 80 % у МП Pentium.

Кэш-память емкостью 256-512 Кбайт — обязательный атрибут  высокопроизводительных систем на базе процессоров Pentium. Однако у них встроенная кэшпамять имеет небольшую емкость (16 Кбайт), а основная ее часть находится  вне процессора на материнской плате. Поэтому обмен данными с ней происходит не на внутренней частоте МП, а на частоте тактового генератора, которая обычно в 2-5 раз ниже, что снижает общее быстродействие компьютера. В МП Pentium Pro есть и кэш-память 1-го уровня (по 8 Кбайт для команд и данных), и кристалл кэш-памяти 2-го уровня емкостью 256 или 512 Кбайт, расположенный тоже на плате самого микропроцессора и работающий на внутренней частоте МП.

 

Микропроцессоры Pentium MMX и Pentium II

В 1997 году появились модернизированные  для работы в мультимедийной технологии микропроцессоры Pentium и Pentium Pro, получившие торговые марки, соответственно, Pentium MMX (MMX — MultiMedia eXtention) и Pentium II. МП Pentium MMX содержит дополнительные 57 команд, ориентированные на обработку аудио- и видеоинформации, увеличенную вдвое (до 32 Кбайт) кэшпамять, дополнительные восемь 64-битовых регистров, новый блок предсказания ветвлений, заимствованный у МП Pentium Pro, и т. д. Вследствие этого у него на 1 миллион транзисторных элементов больше, чем у МП Pentium.

Для эффективного использования  этих микропроцессоров во все старые программы (в том числе и в  операционные системы Windows 95, Windows NT) необходимо включить согласующие программные  фрагменты; правда и без них МП Pentium MMX несколько производительнее просто МП Pentium. При выполнении обычных приложений Pentium MMX на 10-15 % быстрее Pentium, а при работе мультимедийных приложений с использованием новых 57 команд он уже эффективнее на 30 % (для сравнения: МП Pentium Pro опережает МП Pentium при выполнении обычных приложений примерно на 20 %). Программы, написанные с учетом специфики Pentium MMX, не будут работать на ПК с обычным МП Pentium. Для МП Pentium MMX требуется системная плата с разъемом Socket 7, с новым BIOS, поддерживающим ММХ, и с двумя напряжениями питания (3,5 и 2,8 В).

МП Pentium II имеет иную конструкцию, нежели чем все остальные МП, в  частности, он выполнен в виде небольшой  платы-картриджа (корпус SECC), на которой  размещены сам процессор (содержащий 7,5 млн транзисторов против 5,5 млн  в МП Pentium Pro) и четыре микросхемы кэш-памяти 2-го уровня, общим объемом 512 Кбайт. Кэш-память 1-го уровня, находящаяся в микросхеме самого процессора, имеет емкость 32 Кбайта, против 16 Кбайт, имевшихся в МП Pentium Pro, но кэш-память 2-го уровня работает не на внутренней частоте МП, а на вдвое меньшей частоте.

Важным отличием Pentium II является архитектура двойной  независимой шины (первые варианты введения такой шины были уже у  МП Pentium Pro). Процессор обменивается данными с кэшем L2 по специализированной высокоскоростной шине (иногда называемой backside — задней), отделенной от системной шины (frontside — передней). Системная шина работает на частоте материнской платы, и это существенно снижает эффективное быстродействие компьютера. Наличие же backside-шины ускоряет обмен с кэш-памятью.

МП Pentium II поддерживает двухпроцессорную конфигурацию ПК. В МП Pentium Pro и Pentium II появилась качественно новая  перспектива: начали внедряться так  называемые SIMD-инструкции (Single Instruction Multiply Data — сравните со структурами многопроцессорных систем), в которых одно и то же действие совершается над многими данными (эта технология получит развитие в следующих моделях МП). МП производится на основе технологии 0,35 мкм и использует напряжение питания 2,8 В. Для него, естественно, требуется иная системная плата, чем для всех других Pentium. Микропроцессоры Pentium II имеют много модификаций: Klamath, Deschutes, Katmai, Tanga; МП средней группы Celeron — Covington, Mendocino, Dixon.

Для более дешевых  компьютеров был предложен облегченный вариант процессора, названный Celeron. Первые процессоры Celeron имели частоты 266 и 300 МГц. Вторичный кэш исключили, что заметно отразилось на производительности ПК (системные платы с разъемом Slot 1 вторичного кэша не имеют), и ПК на их основе оказались малоэффективными. Тогда были выпущены процессоры Celeron А, которые имеют небольшой (128 Кбайт) вторичный кэш, установленный на плате МП и работающий уже на полной частоте МП. Эти процессоры, известные также под названием Mendocino, стали очень популярными.

Кроме широко известных  особенностей вторичного кэша (либо его  нет, либо 128 Кбайт), процессор Celeron имеет  следующие отличия от Pentium II:

□   разрядность  шины адреса сокращена с 36 до 32 бит (адресуемая память — 4 Гбайт);

□  несколько ослаблены процедуры контроля достоверности преобразования информации;

□   Celeron предназначен только для однопроцессорных конфигураций.

Процессоры Celeron А являются самыми популярными из недорогих  компьютеров и в настоящее  время. Большинство МП Pentium II, в том числе и Celeron A, поддерживают частоту шины системной платы 100, 133 МГц и более (предыдущие модели — только 66 МГц).

 

Микропроцессоры Pentium III

Появившиеся в 1999 году процессоры Pentium III (Coppermine) являются дальнейшим развитием Pentium II. Их главным отличием является основанное на новом блоке 128-разрядных  регистров расширение набора SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (Streaming SIMD Extensions). По возможностям мультипроцессорных конфигураций эти процессоры аналогичны своим предшественникам Pentium II.

Кэш 2-го уровня у МП Pentium III имеет размер 256 Кбайт, работает на полной частоте МП и обслуживается быстродействующей backside-шиной, что во много раз ускоряет как работу с кэшем, так и производительность ПК в целом. МП Pentium III предназначены для работы с материнскими платами, имеющими чипсеты (набор микросхем, связывающих процессор с остальной системой) Intel: 440BX, 440ZX, 440GX, 810, 815, 820, 840 и более новые; поддерживают частоту шины материнской платы 100, 133, 150 МГц и выше. «Простые» Pentium III устанавливаются в Slot 1, Pentium III Xeon — в Slot 2. Процессоры Pentium III Xeon (и последующие модели Tanner, Cascades) являются продолжением линии МП Pentium Pro и отличаются увеличенным кэшем 2-го уровня (512, 1024 и 2048 Кбайт), работающим на полной частоте МП.

 

Микропроцессоры Pentium 4

Модификация МП Pentium — Pentium 4 — предназначена для высокопроизводительных компьютеров, в первую очередь серверов, рабочих станций класса high-end и мультимедийных игровых ПК. Рассмотрим основные особенности Pentium 4.

Добавлены 144 новые потоковые  инструкции, расширяющие набор SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (Streaming SIMD Extensions). Модуль вычислений с плавающей запятой и потоковый модуль оптимизированы для работы с аудио- и видеопотоками, в том числе ЗD-технологиями.

Имеется кэш 2-го уровня размером 256 Кбайт; он работает на полной частоте МП, использует встроенную программу коррекции ошибок и обслуживается быстродействующей с разрядностью 256 бит (32 байт) шиной, работающей на частоте МП. Это для Pentium 4 с частотой 1500 МГц, например, обеспечивает скорость обмена с кэшем 48 Гбайт/с.

Есть возможность работы с системной шиной с эквивалентной  частотой 400 МГц (Quard-Pumped Bus пo 100 МГц), что  обеспечивает скорость обмена 3,2 Гбайт/с.

Вновь улучшена система  «динамического исполнения» (dynamic execution), что, в первую очередь, связано с наличием 20-ступенной (у МП Pentium III конвейер имел 10 ступеней) суперконвейерной структуры (superpipelining), лучшего предсказания ветвлений программы при условных передачах управления (branch prediction) и параллельного «по предположению» (опережающего, спекулятивного) исполнения команд по нескольким предполагаемым путям ветвления (speculative execution). Поясним это. Динамическое исполнение позволяет процессору предсказывать порядок выполнения инструкций при помощи технологии

множественного предсказания ветвлений, которая прогнозирует прохождение  программы по нескольким ветвям. Это  оказывается возможным, поскольку  в процессе исполнения инструкции процессор  просматривает программу на несколько  шагов вперед. Технология анализа потока данных позволяет проанализировать программу и составить ожидаемую последовательность исполнения инструкций, независимо от порядка их следования в тексте программы. И наконец, опережающее выполнение повышает скорость работы программы за счет выполнения нескольких инструкций одновременно, по мере их поступления в ожидаемой последовательности — то есть по предположению (интеллектуально). Поскольку выполнение инструкций происходит на основе предсказания ветвлений, результаты сохраняются как «интеллектуальные» с последующим удалением тех, которые вызваны промахами в предсказании. На конечном этапе порядок инструкций и результатов их выполнения восстанавливается до первоначального.

Используется новая  микроархитектура, базирующаяся на двух параллельных 32-битовых конвейерах и поддерживающая технологию поточной обработки Hyper Pipelined. Это позволило сделать эффективным длинный конвейер. Суть в том, что при длинном конвейере в задачах с частыми условными переходами его эффективность снижается. Два параллельных конвейера снижение эффективности уменьшают. Теперь реальна ситуация, когда в каждый момент времени одна инструкция загружается, другая декодируется, для третьей (или нескольких) формируется пакет данных, четвертая инструкция (или несколько) исполняется, для пятой записывается результат. И если при строго последовательном исполнении инструкций даже самые короткие операции исполнялись за 5 тактов, то при такой поточной обработке многие инструкции могут быть выполнены за такт.

Новая технология ускоренных вычислений (Rapid Execution Engine) использует два быстрых, работающих на удвоенной частоте, процессора АЛУ, выполняющие короткие арифметические и логические операции за 0,5 такта, и третье, медленное АЛУ, исполняющее длинные операции (умножение, деление и т. д.).

Процессор имеет площадь  кристалла 217 мм2, потребляет 52 Вт при частоте 1500 МГц, содержит 42 млн транзисторов. На базе Pentium 4 можно создать высокоэффективную ММХ-систему, но для этого необходимо наличие:

□   программного обеспечения, ориентированного на использование дополнительных команд этого процессора;

□   системной платы  с чипсетами, поддерживающими данные микропроцессоры. В 2002-2004 годах корпорация Intel представила:

□   семейство МП Pentium III Tualatin на основе технологии 0,13 мкм  с улучшенными по сравнению с Coppermine характеристиками (тактовые частоты до 1266 МГц, кэш-память L2 емкостью до 512 Кбайт, работающая на частоте микропроцессора, с поддержкой частоты системной шины (FSB) до 133 МГц). Выпускаются МП трех видов: для портативных и настольных компьютеров и для серверов;

□   МП Celeron с тактовыми  частотами 2,3 и 2,4 ГГц, изготовленными по технологии 0,13 мкм и поддерживающими  тактовую частоту шины 400 МГц;

О семейство нового поколения  МП Pentium 4E — ядро Prescott под процессорный разъем LGA775: Pentium 4E 520 2,8 ГГц, Pentium 4E 530 3 ГГц, Pentium 4E 540 3,2 ГГц, Pentium 4E 550 3,4 ГГц, Pentium 4E 560 3,6 ГГц.

Все МП имеют кэш 2-го уровня 1024 Кбайт.

□   две модели Р4ЕЕ (Extreme Edition) 3,2 и 3,4 ГГц, кэш 3-го уровня 2 Мбайт  и кэш 2-го уровня 512 Кбайт;

□   системный чипсет для этих МП  — i875;

□   микропроцессоры Pentium M для портативных компьютеров  — новое поколение МП с системным  чипсетом i855 и средствами беспроводного  доступа к локальным сетям  по протоколу IEEE 802.11.

Компания Intel обещала выпустить:

□   в 2005 году — МП по технологии 0,065 мкм, довести тактовую частоту МП до 20 ГГц;

□   в 2005-2006 годах  — две версии микропроцессора Smithfield с двумя ядрами по технологии 0,09 мкм на конструктиве LGA775.

Все новые процессоры Pentium 4 имеют микроархитектуру Intel Net Burst, поддерживающую ряд инновационных возможностей:

□   технологию НТ;

□   технологию гиперконвейерной обработки данных;

□  частоту системной  шины 800, 533 или 400 МГц;

□  кэш-память первого  уровня с отслеживанием выполнения команд;

□   расширенные  функции выполнения команд;

□   расширенные  функции выполнения операций с плавающей  запятой и мультимедийных операций;

□   набор потоковых SIMD-расширений SSE2 или SSE3.

 

Технология НТ

Технология Hyper Treading (tread — поток) реализует многопотоковое исполнение программ: на одном физическом процессоре можно одновременно исполнять два задания или два потока команд одной программы (операционные системы «видят» два логических процессора вместо одного). Иначе говоря, эта технология на базе одного МП формирует два или более логических процессора, работающих параллельно и, в известной степени, независимо. Hyper Treading обеспечивает повышение производительности (до 30 %) в многозадачных средах и при исполнении программ, которые допускают многопотоковое исполнение.

Информация о работе Архітектура комп'ютерів