Пентиум 5. Температурный режим и энергопотребление. Технические характеристики различных ядер

Итак, сегодня компания Intel выпустила, по всей видимости, последний процессор семейства Pentium 4, теперь всему миру остается ждать появления Intel Pentium 5 Prescott. Насколько нам известно, сегодняшний Intel Pentium 4 3.20 GHz будет последним процессором линейки собранным по 130 нм техпроцессу.
Intel, как известно, будет выпускать процессоры Prescott по 90 нм технологии, а со следующего года поменяет и собственно процессорный разъем. Нынешние Pentium 4, с технологией Netbust, тем не менее, будут производиться еще около года, Netbust останется и в Pentium 5.


4. AMD

AMD - мировой поставщик интегральных микросхем для рынка персональных и сетевых компьютеров и коммуникаций, чьи производственные мощности расположены в Соединенных Штатах, Европе, Японии и Азии. AMD производит микропроцессоры, устройства флэш-памяти и вспомогательные микросхемы для коммуникационных и сетевых приложений. Компания AMD, основанная в 1969 году со штаб-квартирой в г. Саннивейл (шт. Калифорния), в 2000 году имела оборот 4,6 млрд. долл. (NYSE: AMD).

Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность.

Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel - Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD - вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены - этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения - Athlon.

История

Intel Pentium 60, первая модель Pentium

В процессорах Pentium второго поколения используется умножение тактовой частоты, он работает быстрее системной шины. Для указания, во сколько раз тактовая частота ядра процессора больше частоты системной шины, используется множитель. Во всех процессорах, основанных на ядре P54C, множитель равен 1,5.

P54CS

Первые процессоры, основанные на данном ядре, были выпущены 27 марта 1995 года . По сути, это ядро представляет собой ядро P54C, изготовленное с использованием 350-нанометровой биполярной BiCMOS-технологии, что позволило уменьшить размер кристалла ядра до 91 мм² (процессоры Pentium 120 и 133), однако вскоре, в результате оптимизации ядра, его размер удалось уменьшить до 83 мм² при том же количестве транзисторов. При этом Pentium 200 потреблял ток в 4,6 А, а его максимальная рассеиваемая энергия (тепловыделение) составляло 15,5 Вт.

P55C

Процессор Pentium MMX. Вид сверху

8 января 1997 года были выпущены процессоры Pentium, основанные на ядре P5 третьего поколения (P55C). Центром разработок и исследований Intel в Хайфе (Израиль) в ядро P55C был добавлен новый набор инструкций, названный MMX (MultiMedia eXtension), существенно увеличивающий (от 10 до 60 %, в зависимости от оптимизации) производительность компьютера в мультимедиа-приложениях. В результате, эти процессоры именуются Pentium w/MMX technology (обычно сокращается до Pentium MMX). Новый процессор включает в себя устройство MMX с конвейерной обработкой команд, кеш L1 увеличен до 32 Кб (16 Кб для данных и 16 Кб для инструкций). Состоит новый процессор из 4,5 млн транзисторов и производится по усовершенствованной 280-нанометровой CMOS-технологии с использованием кремниевых полупроводников, работает на напряжении 2,8 В. Максимальный потребляемый ток равен 6,5 А, тепловыделение равно 17 Вт (для Pentium 233 MMX). Площадь кристалла у процессоров Pentium MMX равна 141 мм². Процессоры выпускались в 296-контактном корпусе типа CPGA или PPGA для Socket 7.

Pentium OverDrive

Было выпущено несколько поколений Pentium OverDrive.

  • В 1995 году вышел первый Pentium OverDrive (на ядре P24T). Он был предназначен для установки в гнёзда типа Socket 2 или Socket 3 и работал с напряжением питания 5 В, то есть служил для модернизации систем, использующих процессор 486 без замены материнской платы. При этом данный процессор обладал всеми функциями процессора Pentium первого поколения (на ядре P5). Было выпущено две модели, работающие на частотах 63 и 83 МГц, старшая потребляла ток в 2,8 А и обладала рассеиваемой мощностью 14 Вт. Из-за высокой стоимости данный процессор ушёл, не успев появиться. И хотя через некоторое время (4 марта 1996 года) на смену этим процессорам пришли Pentium ODP5V с частотами 120 и 133 МГц, основанные на ядре P5T (по сути, представляет собой ядро P54CS), они также не стали популярны.
  • 4 марта 1996 года выходит следующая версия Pentium OverDrive - Pentium ODP3V - на ядре P54CT. Данное ядро основано на ядре P54CS. Процессор выпускался в 320-контактном корпусе CPGA для Socket 5 или Socket 7.
  • 3 марта 1997 года выходят две модели Pentium ODPMT (с частотами 150 и 166 МГц), построенные на ядре P54CTB (аналог P55C). Позже, 4 августа 1997 года, выходят ещё две модели на том же ядре (с частотами 180 и 200 МГц). Они выпускались в 320-контактных корпусах CPGA и были предназначены для Socket 5 или Socket 7 (Pentium ODPMT-200 MMX - только для Socket 7).

Tillamook

Процессоры, основанные на данном ядре, предназначались для портативных компьютеров, использовались в т.н. "мобильном модуле" MMC-1 Mobile Module Connector с 280 пинами работали вместе с чипсетом Intel 430 TX и имея при этом 512 КБ кэш-памяти на системной плате. Ядро Tillamook (названо в честь города в штате Орегон , США), представляет собой ядро P55C с пониженным напряжением питания - модель с частотой 300 МГц работала с напряжением 2,0 В, потребляя при этом ток в 4,5 А и обладала тепловыделением в 8,4 Вт. Старшие модели (с частотой 233, 266 и 300 МГц) выпускались с использованием 250-нм техпроцесса и имели кристалл площадью 90 мм², также существовали версии со 166 МГц частотой ядра Модели 200 и 233 выпускались с августа 1997 г., модель 266 с января 1998, а старшая в линейке модель была представлена в январе 1999 г.

Другие процессоры, использующие марку Pentium

Процессоры Intel Pentium пользовались огромной популярностью, и Intel решила не отказываться от марки Pentium, называя так и последующие процессоры, хотя они сильно отличались от первых Pentium’ов и не относились к пятому поколению. Таковыми являются:

  • Pentium G

Технические характеристики различных ядер

P5 P54C P54CS P55C
Дата анонса первой модели 23 марта 1993 7 марта 1994 27 марта 1995 8 января 1997
Тактовые частоты, МГц 60, 66 75, 90, 100 120, 133, 150, 166, 200 166, 200, 233
Частота системной шины (FSB), МГц 60, 66 50, 60, 66 60, 66 66
Кеш , Кбайт 8 (для данных)+8 (для инструкций) 16+16
Кеш , Кбайт внешний до 1 Мбайт
Напряжение питания, В 5 3,3 2,8/3,3
Количество транзисторов , млн 3,1 3,2 3,3 4,5
Площадь кристалла, мм² 294 148 90 141
Максимальное тепловыделение, Вт 16 10,1 15,5 16
Техпроцесс, нм 800 600 350 280
Разъём Socket 4 Socket 5 , Socket 7 Socket 5, Socket 7 (150-200 - только Socket 7) Socket 7
Корпус 273-контактный PGA 296-контактный CPGA 296-контактный CPGA/PPGA
Адресуемая память 4 Гбайт
Разрядность

Уже послужило предвестником близости анонса семейства Pentium 4 5x1, которое предложило бы поддержку EM64T всем владельцам материнских плат с разъёмом LGA 775 по разумным ценам. Чуть позднее представители Intel признались, что в действительности процессоры семейства Pentium 4 3.xF полностью сниматься с производства не будут - их просто переименуют, снабдят новой упаковкой, и выпустят на рынок под лейблом "Pentium 4 5x1". Разумное решение, позволяющее положить конец некоторой путанице в ассортименте процессоров Intel.

Чуть позже ряд сайтов распространил заявление источников, близких к Intel, указывающее на возможность существования процессоров серии Pentium 4 5x0 до тех пор, пока не истощатся складские запасы. Постепенно эти процессоры будут заменяться на модели серии Pentium 4 5x1 с поддержкой EM64T. Другими словами, пышных церемоний, приуроченных к выходу процессоров Prescott с поддержкой EM64T на потребительский рынок, мы не увидим. Замена произойдёт в рабочем порядке.

Наконец, на этой неделе сайт Intel пополнился двумя документами, раскрывающими правду о сроках миграции Pentium 4 5xx на степпинг с поддержкой EM64T. Следует сразу отметить, что как таковой смены степпинга не произойдёт. Хотя Intel сообщает, что поддержку EM64T получат только процессоры в коробочном исполнении на степпинге E0 , в списках модернизируемых моделей большинство процессоров основано на степпинге D0.

Вот список маркировок замещаемых и новых процессоров:

  • Pentium 4 570J (3.8 ГГц, SL82U , степпинг E0) -> Pentium 4 571 (3.8 ГГц, SL8J7 , степпинг E0?);
  • Pentium 4 560 (3.6 ГГц, SL7J9 , степпинг D0) -> Pentium 4 561 (3.6 ГГц, SL8J6 , степпинг E0?);
  • Pentium 4 550 (3.4 ГГц, SL7J8 , степпинг D0) -> Pentium 4 551 (3.4 ГГц, SL8J5 , степпинг E0?);
  • Pentium 4 540 (3.2 ГГц, SL7J7 , степпинг D0) -> Pentium 4 541 (3.2 ГГц, SL8J2 , степпинг E0?);
  • Pentium 4 530 (3.0 ГГц, SL7J6 , степпинг D0) -> Pentium 4 531 (3.0 ГГц, SL8HZ , степпинг E0?);
  • Pentium 4 520 (2.8 ГГц, SL7J5 , степпинг D0) -> Pentium 4 521 (2.8 ГГц, SL8HX , степпинг E0?);
  • Pentium 4 505 (2.66 ГГц, SL7YU , степпинг D0) -> Pentium 4 506 (2.66 ГГц, SL8J8 , степпинг E0?).

Заметим, что в этом перечне нет маркировок процессоров серии Pentium 4 3.xF. Это может означать, что процессоры просто не будут менять степпинг. Для желающих процессоры Pentium 4 3.xF будут поставляться до 25 ноября этого года, однако сменить название на Pentium 4 5x1 они могут ещё раньше. Это может означать, что всё семейство Pentium 4 5xx, включая версии с поддержкой EM64T, будет упразднено осенью 2005 года. В принципе, о подобных намерениях Intel многие источники уже заявляли, так что удивляться не стоит.

Для конечного потребителя важнее другое - процессоры Pentium 4 5x1 могут быть основаны и на степпинге D0, не обеспечивающем поддержку технологий XD, C1E и TM2. Конечно, не самая страшная потеря, но для разгона степпинг E0 бы предпочтительнее. Судя по всему, все перечисленные в правой части списка процессоры серии Pentium 4 5x1 будут основаны на степпинге E0. Принадлежность к этому семейству будет автоматически гарантировать принадлежность к степпингу E0, за редким исключением "переодетых" Pentium 4 3.xF, которые в будущем всё равно уступят место представителям степпинга E0.

Во втором полугодии все процессоры серии Pentium 4 5x1 будут переведены на степпинг E0. Оверклокерам при выборе процессора такое качество очень пригодится. Непосредственно процессоры Pentium 4 5x0 в чистом виде существовать перестанут. Intel постарается быстро снять с производства процессоры Prescott с 1 Мб кэша второго уровня, так как приоритетным направлением развития станет расширение присутствия на рынке семейства Pentium 4 6xx. Для этого процессоры Pentium 4 5xx в третьем квартале будут подвергнуты сокращению, а в 2006 году семейство Pentium 4 6xx перейдёт на более холодное и рентабельное 0.065 мкм ядро Presler.

Кроме того, в августе цены на процессоры Pentium 4 6xx должны быть сильно снижены, что позволить минимизировать разницу в стоимости между Pentium 4 6xx и Pentium 4 5x1. Кстати, некоторые источники считают, что масштабное снижение цен на продукцию Intel произойдёт уже 30 июня. Подешевеют ли в этот день процессоры, не уточняется.

Самый последний процессор в списке, получающий после обновления функциональности имя "Pentium 4 506", ранее нигде не упоминался. Точнее говоря, мы хорошо знали его предшественника по имени "Pentium 4 505", который работал на частоте 2.66 ГГц, имел исполнение LGA 775 и оснащался 1 Мб кэша второго уровня. Кроме того, частота шины 533 МГц и сопутствующий ей высокий множитель позволяли процессору неплохо разгоняться . Сей факт даже помог растопить скептическое сердце нашего Doors4ever , который стал лучше относиться к материнским платам на чипсете i915P:).

Поскольку процессор Pentium 4 505 (2.66 ГГц) на рынке существовал совершенно легально, и со временем даже облачился в коробку , а также перешёл на степпинг E0 , то и его поддержкой EM64T одарить Intel тоже решила. В конце концов, для OEM-решений такой недорогой процессор с поддержкой 64-битных расширений всегда пригодится. К сожалению, о судьбе процессоров Pentium 4 510 (2.8A) и Pentium 4 515 (2.93 ГГц) в этом плане ничего не сообщается.

Более того, если все процессоры серии Pentium 4 5x1 с 800 МГц шиной должны поступить в магазины только после 10 июня, то Pentium 4 506 (2.66 ГГц) может появиться уже 27 мая этого года.

Стоит также отметить, что Intel решила облегчить жизнь охотнику за процессорами степпинга E0 ещё одной эффективной мерой. Отныне номер модели процессора будет наноситься прямо на крышку теплораспределителя. Например, для модели с частотой 3.8 ГГц схема изменений будет выглядеть следующим образом:

Хотя для процессора с частотой 3.8 ГГц вопрос принадлежности к степпингу E0 никогда не возникал (он может быть основан только на этом степпинге), для прочих моделей наличие "processor number" вида 5x1 на крышке процессора может стать тем отличительным признаком, по которому покупатель сможет вычислить экземпляр на степпинге E0. Даже без необходимости зазубривать маркировки:). Впрочем, часть процессоров этой серии может сохранить приверженность степпингу D0, но их доля будет очень мала.

В отношении семейства Celeron D 3xx о подобных мерах модернизации пока ничего официально не сообщается. Надеемся, что поддержку EM64T данные процессоры обретут в течение этого квартала, благо мы только подбираемся к его середине.

За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.

Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).

  • . Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
  • Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
  • Системная шина. В Pentium 4 используется совершенно новая 128-битная с двумя 64-битными линиями. Частота новой шины() составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
  • Арифметико-логическое устройство ( или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
  • первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
  • Математический (). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 . К примеру, в процессорах используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
  • SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

В целом, архитектура была нацелена для работы на высоких частотах, где в полную силу смог бы заработать длинный конвейер.

Willamette

Впервые это ядро «засветилось» в роадмэпе () Intel еще в 1998 году. Предполагалось, что оно должно прийти на смену и покорить частоту 1 ГГц. Но процессоры на этом ядре были анонсированы только в 2000 году как Pentium 4. Выпущенные года, процессоры устанавливались в разъём Socket 423 и выпускались в корпусе тип FC-PGA2. Процессоры для Socket 423 не пользовались популярностью, так как Intel сразу заявила, что этот разъем является переходным, кроме того системы на базе Pentium 4 стоили очень дорого (сами процессоры в момент анонса стоили $644 и $819 за Pentium 4 1,4 и 1,5 ГГц соответственно). Так как процессор изготавливался с использованием 180 нм техпроцесса, то на кристалле удалось разместить лишь 256 Кбайт кэша L2. Большинство экспертов расценило 1,4 и 1,5 ГГц версии промежуточными - процессор Athlon набирал всё большую популярность, и превосходил по быстродействию Pentium III, а дальнейшее усовершенствование архитектуры Pentium III тогда было ещё не возможно. Терять свою долю рынка Intel не была намерена, поэтому она и выпустила эти процессоры («сырая» технология производства не позволила тогда выпустить более быстрые модели). Несмотря на непопулярность 1,4 и 1,5 ГГц версий, Intel года анонсирует 1,3 ГГц версию Pentium 4, которая стоила $409. В различных тестовых испытаниях эти процессоры проигрывали как Pentium III, так и Athlon`ам (а в некоторых случаях и `ам), работавшим на более низких частотах. Однако уже в апреле 2001 года выходит Pentium 4 с частотой 1,7 ГГц, а в августе этого года выходит 2 ГГц версия, а так же «новые-старые» процессоры для Socket 478, который просуществовал более чем 2 года, в этом же месяце выходит новый чипсет от Intel (i845). Новый чипсет теперь поддерживал память стандарта PC133 SDRAM, что позволило значительно снизить цены на системы на базе Intel Pentium 4, однако использование данного типа памяти несколько уменьшало быстродействие (иногда весьма существенно) системы. Intel для увеличения продаж активно продвигала данный процессор - его рекламу можно было увидеть как по телевизору, так и в газетах/журналах. Продажи Pentium 4 увеличивались, процессор начинал пользоваться всё большей популярностью. Вскоре многие производители системной логики представили свои чипсеты для Pentium 4 с поддержкой памяти , а в начале года Intel выпускает свои чипсеты с поддержкой данного типа памяти. Процессор начинает замещать собой Pentium III, а по производительности он фактически сравнялся с Athlon`ом. Intel, державшая пальму первенстве в течение 16 лет, а затем довольно быстро потерявшая её, сейчас вновь начинает отвоёвывать своё. А начавшиеся проблемы с отсутствием производственных мощностей у AMD и выпуск Pentium 4 на ядре Northwood закрепили лидирующие позиции Intel, правда, ненадолго.

Процессоры Pentium 4 на ядре Willamette
Тактовая частота ядра (ГГц) Дата анонса процессора для Socket 423 Дата анонса процессора для Socket 478 Начальная стоимость процессора ($)
1,3 3 января 2001 409 - ?
1,4 20 ноября 2000 644 27 сентября 2001
1,5 819 27 августа 2001
1,6 2 июля 2001 294
1,7 23 апреля 2001 352
1,8 2 июля 2001 562
1,9 27 августа 2001 375 375
2,0 562 562

Northwood

Первые процессоры на данном ядре анонсированы года. Ядро мало чем отличается от своего предшественника, разве что использованием более совершенного тех процесса - 130 нм, что позволило разместить на кристалле 512Кб кэша L2 и снизить тепловыделение процессора. Переход на новый техпроцесс позволил ещё больше наращивать тактовую частоту (до 3,4ГГц). Чтобы отличать процессоры на ядре Northwood от аналогичных моделей на ядре Willamette, было решено в конце названия новых процессоров приписывать букву «A» (например Pentium 4 2,0A построен на ядре Northwood).

Prescott

Mobile Pentium 4

Первые версии Pentium 4 для ноутбуков и лэптопов были анонсированы года, были построены на ядре Northwood и носили имя Mobile Pentium 4-M. От настольных версий эти процессоры отличались заниженным напряжением питания (1,2-1,3 В) и поддержкой технологии . Частота системной шины у всех процессоров составляла 400 МГц. Были выпущены модели с частотами 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0; 2,2; 2,4; 2,5; 2,6, TDP у последней модели составляет 35 Вт.

Prescott 2M

Первые слухи о новом ядре Prescott 2 появились в начале 2005 года. Предполагалось, что оно будет иметь 2 Мбайт кэша L2 и частоту FSB равную 266 МГц (эффективная частота 1066 МГц). Процессоры на основе этого ядра были анонсированы . От ядра Prescott это ядро отличается только наличием 2 Мбайт кэш-памяти L2. Новые процессоры получили и новую маркировку: 6x0. 21 февраля 2005 года были анонсированы модели Pentium 4 630, 640, 650, 660 с частотами 3,0; 3,2; 3,4; 3,6 ГГц, позднее была представлена модель 670, работающая на частоте 3,8 ГГц.

Cedar Mill

Анонс процессоров, построенных на новом ядре, запланирован на вторую половину января . Ядро Cedar Mill представляет собой одноядерную модификацию ядра известного под кодовым именем . Cedar Mill изготовлен с использованием новейшей 65 нм технологии. По сути, ядро представляет собой ядро Prescott 2M, даже не изменилась серия процессора, процессоры без поддержки технологии виртуализации Vanderpool имеют маркировку вида 6x1, с поддержкой Vanderpool имеют маркировку вида 6x3. Процессоры первоначально будут иметь частоту от 3,0 ГГц до 3,8 ГГц. Более подробно о причине выхода Cedar Mill рекомендуется читать здесь .

Ядро Cedar Mill является последним в линейке Pentium 4. Следующие поколения процессоров, в частности Conroe, будут продвигаться под новым брэндом, название которого, пока, не анонсировано.

Tejas, Jayhawk и другие

Intel возлагала на архитектуру NetBurst большие надежды. В 2001-2003 в роадмэпах Intel встречались такие ядра, как Tejas, который должен был использовать шину 1066 МГц и работать на частотах от 4,4 до 9,2 ГГц и должен был бы быть поступить в продажу во второй половине 2004 года и называться Pentium 6. Nehalem, как предполагалось, этот процессор должен был использовать системную шину 1200 МГц и работать на частотах свыше 10 ГГц, и должен был поступить в продажу в 2005 году. Jayhawk, процессор серии Xeon, который должен был иметь кэш L1 для данных объемом 24 Кб и для 16 тысяч микроопераций. Однако все эти процессоры в 2004 году были отменены.

Intel предполагала с помощью процессоров основанных на архитектуре NetBurst достичь частоты в 10ГГц, но, не дойдя и до 4 ГГц, эта архитектура столкнулась с неразрешимыми до сих пор (и похоже уже никогда) тепловыми проблемами. Данная проблема подтолкнула Intel к разработке новой архитектуры и к закрытию всех проектов по разработке ядер на архитектуре NetBurst.

Взглянув назад, Pentium 4 оставляет двойственное впечатление. С одной стороны это был одни из самых популярных процессоров, его продвижение в , и, как следствие, огромная популярность в народе, позволили Intel надолго занять большую часть рынка. С другой стороны Pentium 4 имел не самую удачную архитектуру. Он так ни разу и не закрепил своё лидирующее положение в плане производительности, по уровню TDP (тепловыделение) он практически всегда проигрывал конкурентным процессорам AMD Athlon, впрочем также, как и по стоимости. А архитектура Pentium III, которую когда-то Intel посчитала менее перспективной, чем NetBurst вновь появилась в процессорах .

Технические характеристики различных ядер

Данные относящиеся ко всем моделям

  • Разрядность : 32
  • Разрядность внешней шины: 128

Willamette

  • Дата анонса первой модели: 20 ноября 2000 года
  • Тактовые частоты (ГГц): 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0
  • Эффективная частота системной шины (FSB) (МГц): 400
  • Размер кэша L2(Кбайт): 256
  • Напряжение питания: 1,7 В или 1,75 В
  • Количество транзисторов (млн.): 42
  • Площадь кристалла (кв. мм): 217
  • Максимальное TDP (расчетное тепловыделение): 75,3 Вт
  • Техпроцесс (нм): 180
  • Разъём: Socket 423, позже Socket 478
  • Корпус: 423-контактный FC-PGA2 или 478-контактный mPGA
  • Поддерживаемые технологии: IA32, SSE2

Northwood

  • Дата анонса первой модели: 7 августа 2001 года
    • Процессоры с частотой FSB равной 400МГц: 1,6; 1,8; 2,0; 2,2; 2,4; 2,5; 2,6; 2,8
    • Процессоры с частотой FSB равной 533МГц: 2,26; 2,4; 2,53; 2,67; 2,8; 3,06
    • Процессоры с частотой FSB равной 800МГц: 2,4; 2,6; 2,8; 3,0; 3,2; 3,4
  • Эффективная частота системной шины (FSB) (МГц): 400, 533, 800
  • Размер кэша L1: 8Кбайт (для данных)+12 тысяч операций
  • Размер кэша L2(Кбайт): 512
  • Напряжение питания: 1,475-1,55 (в зависимости от модели)
  • Количество транзисторов (млн.): 55
  • Площадь кристалла (кв. мм): 146, позже 131
  • Максимальное TDP (расчетное тепловыделение): 89 Вт
  • Техпроцесс (нм): 130
  • Разъём: Socket 478
  • Корпус: 478-контактный mPGA
  • Поддерживаемые технологии: IA32, MMX, SSE, SSE2, HT (не все модели)

Начиная с 1995 г. Intelприступила к выпуску серийногоCISC-процессораP6 шестого поколенияi 686 под торговой маркойPentiumProс напряжением питания около 3 В. Он содержит 5 500 тысяч транзисторов на кристалле и изготовлен по 0,35 мкм технологии в корпусе с 387 выводами. В создании этого процессора разработчики воспользовались всеми техническими решениями, ранее применяемыми в суперЭВМ. К таким решениям относятся включение в структуру процессора устройств динамического определения порядка выполнения команд и нескольких многоступенчатых конвейеров. В отличии от двух 5-ступенчатых конвейеровPentium,P6 имеет три 10-ступенчатых. Увеличение числа конвейеров и ступеней обработки команд в них позволило увеличить внутреннюю тактовую частоту синхронизации, которая стала равной 133, 166, 180, 200 МГц и более. ВPentiumProдля повышения производительности вычислений за счет увеличения внутренней тактовой частоты внедрены следующие структурные дополнения в семейство х86:

Применено динамическое исполнение команд, при котором команды, не зависящие от вычислений ранних операций в программе, выполняются в измененном сдвоенном порядке с передачей результатов в закрепленном в программе порядке;

Использован тыльный кэш-2 с двумя раздельными системными шинами обмена: скоростной короткой для обмена между МП и кэш-2; традиционной процессорной с частотой синхронизации 66,6 МГц;

Внешний кэш-2 емкостью 256 или 512 Кб размещен в корпусе МП;

Внедрены дополнительные средства контроля ECCпри обмене в системной шине, кэш-2, ОЗУ и возможность контроля дублированием вычислений вторым МП в режимеFRC;

Системная шина с программируемым контроллером и интерфейсом APICобеспечивает мультипроцессорную обработку до 4 МП, объединенных в единую систему.

Увеличение частоты синхронизации позволяет повысить быстродействие обработки команд, что, в свою очередь, требует повышения скорости обмена с внешним ОЗУ. Чтобы исключить задержки обмена с ОЗУ, в кристалле процессора смонтирована буферная память второго уровня (кэш-2) емкостью 256 Кб. Блок кэш-2 связан внутри процессора через интерфейс памяти собственной синхронной внутренней 64-разрядной шиной данных, работающей на тактовой частоте процессора.

С целью эффективного вычисления последовательности команд в PentiumProиспользуется буфер предсказания ветвлений ВТВ0, ВТВ1 на 512 входов. Использование этих блоков позволило разработчикам добиться наибольшей загрузки двух блоков целочисленной арифметики (АЛУ), сопроцессора (FPU), блоков записи и загрузки, увеличив производительность по сравнению сPentiumна 35 – 45 %. Эта производительность оказалась всего лишь в 1,5 раза меньше, чем у самого быстрогоRISC-процессораDECAlpha21164. Схема МПPentiumProпоказана на рис. 2.13. ПроцессорPentiumProвыполняет вычисления в конвейере в следующей последовательности. Операционная система загружает из ОЗУ через системную шину в кэш-2 массивы данных и набор команд для выполнения программ, которые образуют очередь с приоритетами и привилегиями. Первая программа из очереди одновременно загружается в кэш-1 команд, а операнды, с которыми она работает, передаются в кэш-1 данных. Адреса команд и данных располагаются в блоке тэгов обоих кэш-1, и в случае промаха при обращении к кэш-1 недостающие команды или данные постоянно доизвлекаются чаще всего из кэш-2 и реже, при отсутствии в нем, из основного ОЗУ. На первой ступени дешифрирования (DC) три команды динамически распределяются на параллельную обработку во вторую ступень дешифрацииID1 (распределение на параллельную обработку в целочисленные АЛУ иFPU). В результате после второй ступени дешифрации в каждом такте могут появляться одновременно до шести микроопераций, подлежащих выполнению в операционном блоке (Port0 - 4) ядра процессора.

Эти микрооперации закрепляются за регистрами в блоке переименования регистров и выделения ресурсов RAT. Блок переименования регистровRATпозволяет закрепить для выполнения операций более восьми РОН, используемых для программирования. При наличии нескольких конвейеров это даёт возможность одновременно выполнять несколько команд, ссылающихся на одни и те же регистры в разных конвейерах по мере их освобождения.

После RATнабор микроопераций направляется в блок резервированияRSи буфер переупорядочивания чтенияROBRd, который осуществляет вычисление адресов операндов и загрузку ими переименованных регистров РОН в двух целочисленных АЛУ.

После выполнения микроопераций ROBRdудаляет их из блока резервированияRS. БлокRSявляется начальной ступенью произвольной обработки в ядре МП. В нем микрооперации могут ожидать операнды или устройства для выполнения операции. Если операнды доступны и устройства свободны, микрооперация направляется на исполнение через один из портовPort0 - 4 минуя такты ожидания. Результаты выполнения микроопераций передаются в переупорядочивающий буфер записиROBwbи файл регистровRRF, способный принимать за один такт три операнда. В этом блоке результаты окончания операций ожидают освобождения ШД для записи в кэш и ОЗУ. Для чего им восстанавливается порядок, соответствующий порядку результатов при выполнении закодированной программы.

Для PentiumProIntelразработала два чипсетаPCI: 82450GX(для серверов) и 82450FХ (для рабочих станций) и специальное программное обеспечение, обеспечивающее параллельную обработку команд в конвейере с 32 - разрядными числами. ХотяPentiumProпрограммно совместим с предыдущими моделями микропроцессоровx86, эффективное его использование в персональных компьютерах сдерживалось дороговизной ЭВМ и недостаточным количеством необходимого программного обеспечения.

5.2. Процессор Pentium II

Процессор PentiumII, ранее носивший названиеKlamath, характеризуется дальнейшим увеличением быстродействия процессоровPentium, совместимых с архитектуройx86. Объединив технологиюMMXи архитектуру ядра МПPentiumPro, фирмаIntelс мая 1997 года начинает производить процессорPentiumIIпо 0.35-мкм КМОП-технологии с четырьмя слоями металлизации. Центральное ядро содержит 7.5 млн транзисторов и располагается на площади 203 мм 2 .

Кристалл PentiumIIразмещается в пластмассовом корпусеPLGA, имеющем матрицу из 528 миниатюрных контактных площадок. Этот корпус устанавливается на одной процессорной мини-плате, уменьшающей отбраковку МП при производстве, вместе с кэш второго уровня и микросхемой памяти для хранения тэговTagRAM. Он закрыт в картридже общей крышкой, которая и охлаждается специальным вентилятором. Картридж с односторонним расположением контактов (S.E.C.С.) устанавливается в специально разработанный фирмойIntelразъёмSlot1 на системной плате. Картридж может быть легко модифицирован с появлением новых промышленных кристаллов МП, кэш-2, памяти тэгов и контроллера кэша. Используя размер стока транзистора 0.28 мкм,Intelудалось повысить предельное быстродействие и достигнуть тактовой частоты от 233 до 450 МГц. На частоте 266 МГцPentiumIIпотребляет до 38 Вт электроэнергии.

Внешняя тактовая частота процессора остается 66,6 МГц, что не позволяет более эффективное использование SDRAM, предназначенной для работы на частотах 83 и 100 МГц. С использованием двухпроцессорного режимаSMPи интерфейсаAPICвозможна работа МП как в режиме параллельной обработки информации, так и в режиме контроля одного процессора другим в системеFRC.

В процессорах PentiumProиPentiumIIдля расширения адресного пространства используется шина запроса памятиREQ(3,0). В режиме обмена с памятью, дополняя ША до 36 бит, она позволяет работать МП с памятью до 64 Гб.

Архитектура ядра PentiumIIмало отличается от архитектурыPentiumPro. Традиционная система команд х86 реализуется с использованием методов, заимствованных уRISC-процессоров. При этом каждая операция преобразуется в последовательность простых микрокоманд. Эти простейшие микрокоманды выполняются с использованием принципов множественного предсказания переходов, исполнения команд по предположению и с изменением последовательности способа переименования регистров, что позволяет организовать параллельную конвейерную обработку нескольких команд.

Однако архитектуры PentiumIIиPentiumProимеют два существенных отличия.PentiumIIспециально создан для скоростной обработки мультимедиа-приложений, сочетает использование до 40 Мб видеопамяти с выполнением высококачественных ускоренных графических процессов, включающих до 512 Мб ОЗУSDRAM, и обменом через новую шинуAGPс профессиональным графическим ускорителем и поддержкой разрешения 1600х1280 при 16.7 млн цветов. МП поддерживает мультимедийное расширение набора команд (MMX). Для исполнения команд ММХ ядромPentiumProвPentiumIIвведены порты:

Кроме того, PentiumIIимеет средства переименования сегментных регистров. Использование этих средств ускоряет работу процессора под управлением 16-разрядных программ. При выполнении вPentiumProранее разработанных 16-разрядных программ изменение содержимого сегментных регистров происходит часто. При этом обновление содержимого сегментного регистра требует очистки конвейера от команд, то есть необходимо выполнить все команды, использующие текущее значение сегментного регистра, до его обновления. С учетом времени, необходимого на передачу результатов для записи, полученная задержка составит почти 30 тактов.

PentiumIIв этом режиме выполняет запись в регистры по предположению, что позволяет командам, использующим старое значение сегмента, сосуществовать с командами, использующими новое значение сегмента. Ускорение работы 16-разрядных приложений может составить до 50% на той же частоте по сравнению с процессоромPentiumPro.

PentiumIIможет обрабатывать 57MMX-команд, при этом используется 8 адресуемых 64-разрядных регистров ММХ. Наличие команд поддержки режимаMMXпозволяет ускорить обработку мультимедиа-приложений при соответствующем программном обеспечении.

Для компенсации относительно медленной работы кэш второго уровня размер внутреннего кэш был увеличен вдвое: с 16 Кб до 32 Кб (16 Кб для хранения команд и 16 Кб – для данных), где кэш-1 данных разбит на 8 чередующихся банков. Увеличение объема внутреннего кэша позволяет снизить частоту обращений к внешней памяти. Для установки PentiumIIразработаны материнские платы с набором ИС 440LX, конструктивно несовместимые с ранее выпускавшимися процессорами.

В январе 1998 г. Intel представила, кроме МП Pentium II 233, 266 и 300 МГц, четвертый по счету процессор семейства Pentium II, имеющий тактовую частоту 333 МГц на кристалле, содержащем 7.5 млн транзисторов (каждый транзистор в 400 раз меньше диаметра человеческого волоса). Он выпущен с применением передовой тогда 0,25 мкм производственной технологии Intel. ПроцессорPentium II 333 МГц имеет наивысшую производительность по сравнению с предыдущими моделями при выполнении целочисленных операций и при работе с мультимедиа (для обработки звука, видео, оцифрованных изображений и поддержки видеоконференций).

Процессор Pentium II 333 МГц имеет все те же характеристики, что и ранее выпущенные версии процессора Pentium II, в том числе: архитектуру двойной независимой шины (DIB), режим динамического исполнения, набор мультимедийных команд технологии Intel MMX и шину кэш-памяти второго уровня (L2) 512 Kб, работающую на частоте, в два раза меньшей тактовой частоты процессора. Для процессора Pentium II 333 МГц частота шины кэш-памяти L2 составляет 166.5 МГц.

При работе со стандартными офисными приложениями процессор Pentium II 333 МГц превосходит процессор Pentium II 300 МГц по производительности на 10 % . Более ощутимо преимущество процессора Pentium II 333 МГц при его сравнении с процессором Pentium MMX, имеющим тактовую частоту 233 МГц. Притом что разница тактовых частот этих процессоров составляет 42 %, Pentium II 333 МГц превосходит его по производительности на 50 – 80 %.

Характеристики процессора Pentium II представлены в табл. 2.4, из которой видно, что в дальнейшем было выпущено еще несколько его модификаций вплоть до Pentium II 450 МГц.

Вторичный кэш в PentiumIIмедленнее, чем вPentiumPro. Он построен по четырёхканальной множественно-ассоциативной синхронной структуре без блокирования на элементах статической памятиSRAMи работает в пакетном режиме. Частота тыльного кэш второго уровня в два раза ниже, чем внутренняя частота процессора. Емкость кэш второго уровня составляет 512 Кб, однако в других вариантах процессораPentiumIIможет устанавливаться кэш меньшей емкости (256 Кб).

5.3. Процессор Pentium III

Процессор Pentium II, как описано в п. 2.5.(«ПроцессорPentiumII»), изготовлен на основе ядраKlamathпо технологии 0,35 мкм с частотой внешней шины 66 МГц. Затем на основеKlamathфирмойIntelбыло разработано ядроDeschutesдля 0,25 мкм технологии и изготовлен PentiumIIс частотой шины 100 МГц и PentiumIIXeon(Зеон), отличающиеся более высоким быстродействием и емкостью кэш-2, и дешевыйCeleron(в начале без кэш-2 с частотой внешней шины 66 МГц). Позже на базеDeschutesбыло разработано ядро с интегрированным в тот же корпус быстрым кэш-2Mendocino, на базе которого выпускались всеCeleron«А» (с внутренним кэш-2 емкостью 128 Кб). ЗатемIntelразработала МПDixonс емкостью 256 Кб встроенного кэш-2. ЭтоCeleronс увеличенным кэш-2 вдвое. Но так как он работает как PentiumII, то имеет другое название. В начале 1999 г. на основе ядраKatmaiизготовленыPentiumIIIиPentiumIIIXeon(Tanner). В конце 1999 г. на базе ядраCoppermineпо 0,18 мкм технологии изготовленPentiumIIIиPentiumIIIXeon(Cascades), имеющие какMendocinoбыстрый интегрированный кэш-2. С 2001 г.Pentium III выпускается по 0,13 мкм (металлизацияCu) технологии на базе ядраTualatinс частотой шины 1400 МГц и дешевыйCeleron(1.2 и 1.3 ГГц).

Так, ядро Coppermineимеет кэш-2 емкостью 256 Кб, который работает синхронно с МП. Организация внутреннего кэш-2 изменена. Он представляет собой 8-канальный ассоциативный буфер с 256-разрядной шиной ядра. Обмен МП с кэш-2 требует новых протоколов, то есть обновленнойBIOS. В процессореPentiumIIIоптимизирована схема внутренней буферизации (4 буфера с обратной записью; 6 буферов заполнения; 8 входов очереди шины). Оптимизация привела к сокращению времени ожидания данных из кэш-2 и увеличению производительности МП на той же частоте на 10 – 20 %. Повышение тактовой частоты до 1000 МГц достигнуто за счет уменьшения технологических норм, добавления 6 слоя алюминиевой металлизации и улучшения внутренней разводки цепей МП. Согласующие резисторы и конденсаторы, которые ранее устанавливались на плате процессорного модуля дляSlot1, перенесены в кристалл СБИС. Напряжение питания ядра понижено до 1.1 – 1.65 В.

Таким образом, начиная с 1999 г. фирма Intelосуществляет серийный выпуск процессора PentiumIIIразных модификаций по 0.25 и 0.13 мкм технологии с внутренней частотой синхронизации от 450 до 1400 МГц. PentiumIIIв зависимости от модификации ядра изготавливается на кристалле, содержащем от 9.5 до 42 млн транзисторов. Он ориентирован на применение в настольных (PentiumIII450/500/533ЕВ/…/1400), портативных (MobillPentiumIII400/500/600) ПК, а также для работы в серверах (PentiumIIIXeon600B/667B//1000B). С индексом ”В” процессоры используются в материнских платах с частотой системной процессорной шины FSB 133 МГц. Процессоры Pentium III с индексом ”Е” имеют напряжение питания 1.6 В и изготовлены по 0.18 мкм технологии с внутренним кэш-2 емкостью 256 Кб, размещённым в кристалле процессора. В связи с этим Pentium III Е выпускается как в виде картриджа S.E.C.C.2 с разъёмом Slot 1, так и в виде одной СБИС в новом корпусе FCPGA с разъёмом Socket 370. С появлением Celeron, а затем Pentium III и Xeon осуществлялся переход спецификации процессорной шины и стандарта разъёма МП Slot 1 на Socket 370, а затем на Socket FCPGA. Для Xeon был разработан свой стандарт разъёма Slot 2.

Mobill Pentium III питается от источника с пониженным напряжением 1.35 В и тактового генератора с частотой 100 МГц. Он оснащен встроенным в МП кэш-2 емкостью 256 Кб и блоком SSE.

У Pentium III 0.25 мкм технологии кэш-2 емкостью 512 Кб размещается на процессорной плате. Обычный Pentium III поддерживает двухпроцессорную конфигурацию, а Хеоn до 4 МП. Хеоn может взаимодействовать с внешним тыльным кэш-2 емкостью до 2 Мб, работающим на частоте процессора, что позволяет намного увеличить его быстродействие вычислений по сравнению с обычным Pentium III .

Новый картридж процессора Pentium III, заключенный в корпус с односторонним расположением контактов SECC2, упрощает конструкцию системных плат, предназначенных для работы с этим процессором, облегчает массовое их производство, безопасность при использовании и обеспечивает единый форм-фактор процессоров будущего. SECC2 – некое промежуточное звено между стандартным SECC и его полным отсутствием. В нём радиатор, обдуваемый вентилятором, соприкасается не с железной пластиной, прижатой к ядру, а непосредственно с микросхемой, обеспечивая лучший отвод тепла от кристалла, помещенного в новый органический сплав на основе меди OLGA.

Pentium III имеет следующие особенности:

1.Обеспечивает одновременно технологии потоковых SIMD-расширений SSE для Internet, динамического исполнения команд и технологию MMX.

2.Имеет архитектуру независимой двойной шины DIB, что увеличивает пропускную способность и производительность его по сравнению с процессорами с единственной шиной данных.

3.Содержит функцию серийного номера процессора для расширения степени управляемости ЭВМ.

4.Имеет неблокируемую кэш-1 первого уровня емкостью 32 Kб (16 Кб/16 Кб) и унифицированную неблокируемую кэш-2 второго уровня емкостью 512 Кб, что обеспечивает ускоренный доступ к часто используемым данным.

5.Поддерживает кэширование памяти с объемом адресного пространства 4 Гб.

6.Позволяет создавать масштабируемые системы с двумя процессорами и физической памятью объемом до 64 Гб.

7.Поддерживает тестирование и мониторинг производительности.

8.Совместим по кодам с существующим программным обеспечением и процессорами предшествующих поколений на базе архитектуры Intel.

Потоковые SIMD-расширения SSE для Internet (MMX2) представляют собой 70 новых команд, сгруппированных в следующие категории:

1.Команды копирования данных movaps ,…, movss . Команды этой группы выполняют операции параллельного копирования упакованных элементов данных (PS), а также скалярного (SS) копирования только младшего элемента операнда. Действия производятся над операндами, расположенными в XMM‑регистрах или в памяти.

2.Арифметические команды SIMD выполняют сложение (addps ,addss ), вычитание, умножение (mulps ,mulss ), деление (divps ,divss ) и другие операцииданных одинарной точности с плавающей точкой. Входной (второй) операнд этих команд может располагаться либо в SIMD‑регистре, либо в памяти. Выходной (первый) операнд должен находиться в SIMD-регистре. Арифметические команды поддерживают как параллельные, так и скалярные операции.

3.Команды сравнения cmpps , cmpss и другие попарно сравнивают все четыре соответствующих FP‑элемента двух операндов (для скалярного (SS) варианта команд – только младшие элементы), устанавливают соответствующие флаги в регистре EFLAGS и проверяют выполнение арифметического условия, специфичного для каждой команды. Если для сравниваемой пары условие выполняется, то в соответствующие 32 разряда выходного операнда записывается маска из всех единиц. В противном случае – маска из нулей. Получаемая в результате двоичная маска обычно используется при логических операциях с объектами.

4.Команды преобразования типов данных выполняют преобразования данных из 32-разрядного целочисленного представления со знаком в FP-представление и обратно. Эти команды производят преобразование упакованных и скалярных данных между 128‑битными SIMD регистрами с плавающей точкой и также с 64-битными целыми MMX регистрами или 32-битными целыми регистрами IA-32.

5.Логические команды andps, andnps, orps иxorps часто используются для вычисления абсолютной величины (модуля) чисел; изменения знакового разряда (инверсии знака); действий с маской из нулей и единиц.

6.Дополнительные целочисленные SIMD-команды, команды перестановки, управления состоянием, управления кэшированием.

В Pentium III введён еще один блок, подобный MMX, только оперирующий с вещественными числами. Основной тип данных SSE это 128-разрядное значение, содержащее 4 последовательно расположенных (“упакованных”) 32-разрядных числа одинарной точности с плавающей точкой SPFP, как показано на рис. 2.14.

Рис. 2.14. Упакованное простое число с плавающей точкой

Каждое 32-разрядное число с плавающей точкой (см. рис. 1.2.) имеет 1 знаковый бит, 8 битов порядка и 23 бита мантиссы, что соответствует стандарту IEEE-754 на формат представления чисел одинарной точности с плавающей запятой. SIMD-инструкции оперируют в новом модуле SSE со специальными 128-битными регистрами XMM0-XMM7 и улучшают работу с приложениями трехмерной графики, потокового аудио, видео и распознавания речи. Каждый из этих регистров хранит 4 вещественных числа одинарной точности (ОТ). Потоковое расширение SIMD архитектуры Intel поддерживает 2 типа операций над упакованными данными с плавающей точкой – параллельные и скалярные.

Параллельные операции (ОР), как правило, действуют одновременно на все четыре 32-разрядных элемента данных в каждом из 128-разрядных операндов, как показано на рис. 2.15. В именах команд, выполняющих параллельные операции, присутствует суффикс ps . Например, командаaddps складывает 4 пары элементов данных и записывает полученные 4 суммы в соответствующие элементы первого операнда.

Скалярные операции действуют на младшие (занимающие разряды (31,0)) элементы данных двух операндов, как это показано на рис. 2.16. Остальные 3 элемента данных в выходном операнде не изменяются (исключение составляет команда скалярного копирования movss ). В имени команд, выполняющих скалярные операции, присутствует суффиксss (например, командаaddss ).

Рис. 2.15. Упакованные (параллельные) операции

Большинство команд двухадресные и оперируют с двумя операндами. Данные, содержащиеся в первом операнде, могут использоваться командой, а после ее выполнения, как правило, замещаются результатами. Данные второго операнда в команде после ее выполнения не изменяются. Для всех команд адрес операнда в памяти должен быть выровнен по 16-байтной границе, кроме невыровненных команд сохранения и загрузки.

Рис. 2.16. Скалярные операции

Таким образом, выполняя операцию над двумя регистрами, блок SSE фактически оперирует с четырьмя парами чисел. Благодаря этому процессор может выполнять до 4 одинаковых операций одновременно. Однако для выполнения четырех параллельных операций программист должен использовать специальные команды, а также позаботиться о помещении и извлечении данных из 128-битных регистров. Поэтому для использования всех вычислительных мощностей Pentium III необходима целенаправленная оптимизация.

Внедрение потоковых SIMD-расширений позволяет существенно увеличить скорость и качество работы в реальном времени приложений, использующих:

Трехмерную графику и 3D-моделирование, расчет освещенности с использованием вычислений с плавающей запятой;

Обработку сигналов и моделирование процессов с широким диапазоном изменения параметров (вычисления с плавающей запятой);

Генерацию трехмерных изображений в программах реального времени, не использующих целочисленный код;

Алгоритмы кодирования и декодирования видеосигнала, обрабатывающие данные блоками;

Численные алгоритмы фильтрации, работающие с потоками данных.

Использование потоковых SIMD-расширений позволяет получить более высокое разрешение и качество изображений на дисплее, более высокое качество звука, видео и возможности параллельного кодирования и декодирования в формате сжатия цифровых кодов на оптический диск MPEG2, а также снизить загрузки процессора при распознавании речи и увеличить точность и быстродействие вычислений.

Как указывалось выше, технология динамического исполнения команд в архитектуре Р6 обеспечивает предсказание ветвлений и прогнозирует исполнение программы по нескольким ветвям, позволяет осуществить анализ потока данных, оптимизацию и реорганизацию последовательности исполнения команд на основе используемых в них данных. Допускает спекулятивное исполнение команд на основе оптимизированной последовательности, которая увеличивает загрузку РОН и блоков процессора, что ведет к повышению общей производительности PentiumIII. Кроме того, технология MMX обеспечивается вPentiumIIIнабором 57 команд общего назначения для целочисленных операций, легко применимых к широкому спектру мультимедийных и коммуникационных приложений. Здесь также используются SIMD-инструкции, которые исполняются в восьми 64-разрядных регистрах MMX0-ММХ7.

Серийный номер процессора – это электронный номер, позволяющий идентифицировать конкретную систему в больших компьютерных сетях.

Тестирование и мониторинг производительности в Pentium III содержит следующие функции:

Встроенный механизм самотестирования BIST обеспечивает постоянный контроль зависаний и сбоев в микрокоде и больших логических матрицах, а также тестирование кэш команд и кэш данных, буферов TLB и сегментов памяти ROM;

Механизм стандартного порта доступа к тестированию и периферийному сканированию IEEE 1149.1 дает возможность осуществлять проверку каналов связи между процессором Pentium III и системой через стандартный интерфейс;

Встроенные счетные устройства следят за показателями производительности и ведут подсчет событий.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: