Процессоры

За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.

Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).

  • . Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
  • Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
  • Системная шина. В Pentium 4 используется совершенно новая 128-битная с двумя 64-битными линиями. Частота новой шины() составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
  • Арифметико-логическое устройство ( или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
  • первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
  • Математический (). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 . К примеру, в процессорах используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
  • SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

В целом, архитектура была нацелена для работы на высоких частотах, где в полную силу смог бы заработать длинный конвейер.

Willamette

Впервые это ядро «засветилось» в роадмэпе () Intel еще в 1998 году. Предполагалось, что оно должно прийти на смену и покорить частоту 1 ГГц. Но процессоры на этом ядре были анонсированы только в 2000 году как Pentium 4. Выпущенные года, процессоры устанавливались в разъём Socket 423 и выпускались в корпусе тип FC-PGA2. Процессоры для Socket 423 не пользовались популярностью, так как Intel сразу заявила, что этот разъем является переходным, кроме того системы на базе Pentium 4 стоили очень дорого (сами процессоры в момент анонса стоили $644 и $819 за Pentium 4 1,4 и 1,5 ГГц соответственно). Так как процессор изготавливался с использованием 180 нм техпроцесса, то на кристалле удалось разместить лишь 256 Кбайт кэша L2. Большинство экспертов расценило 1,4 и 1,5 ГГц версии промежуточными - процессор Athlon набирал всё большую популярность, и превосходил по быстродействию Pentium III, а дальнейшее усовершенствование архитектуры Pentium III тогда было ещё не возможно. Терять свою долю рынка Intel не была намерена, поэтому она и выпустила эти процессоры («сырая» технология производства не позволила тогда выпустить более быстрые модели). Несмотря на непопулярность 1,4 и 1,5 ГГц версий, Intel года анонсирует 1,3 ГГц версию Pentium 4, которая стоила $409. В различных тестовых испытаниях эти процессоры проигрывали как Pentium III, так и Athlon`ам (а в некоторых случаях и `ам), работавшим на более низких частотах. Однако уже в апреле 2001 года выходит Pentium 4 с частотой 1,7 ГГц, а в августе этого года выходит 2 ГГц версия, а так же «новые-старые» процессоры для Socket 478, который просуществовал более чем 2 года, в этом же месяце выходит новый чипсет от Intel (i845). Новый чипсет теперь поддерживал память стандарта PC133 SDRAM, что позволило значительно снизить цены на системы на базе Intel Pentium 4, однако использование данного типа памяти несколько уменьшало быстродействие (иногда весьма существенно) системы. Intel для увеличения продаж активно продвигала данный процессор - его рекламу можно было увидеть как по телевизору, так и в газетах/журналах. Продажи Pentium 4 увеличивались, процессор начинал пользоваться всё большей популярностью. Вскоре многие производители системной логики представили свои чипсеты для Pentium 4 с поддержкой памяти , а в начале года Intel выпускает свои чипсеты с поддержкой данного типа памяти. Процессор начинает замещать собой Pentium III, а по производительности он фактически сравнялся с Athlon`ом. Intel, державшая пальму первенстве в течение 16 лет, а затем довольно быстро потерявшая её, сейчас вновь начинает отвоёвывать своё. А начавшиеся проблемы с отсутствием производственных мощностей у AMD и выпуск Pentium 4 на ядре Northwood закрепили лидирующие позиции Intel, правда, ненадолго.

Процессоры Pentium 4 на ядре Willamette
Тактовая частота ядра (ГГц) Дата анонса процессора для Socket 423 Дата анонса процессора для Socket 478 Начальная стоимость процессора ($)
1,3 3 января 2001 409 - ?
1,4 20 ноября 2000 644 27 сентября 2001
1,5 819 27 августа 2001
1,6 2 июля 2001 294
1,7 23 апреля 2001 352
1,8 2 июля 2001 562
1,9 27 августа 2001 375 375
2,0 562 562

Northwood

Первые процессоры на данном ядре анонсированы года. Ядро мало чем отличается от своего предшественника, разве что использованием более совершенного тех процесса - 130 нм, что позволило разместить на кристалле 512Кб кэша L2 и снизить тепловыделение процессора. Переход на новый техпроцесс позволил ещё больше наращивать тактовую частоту (до 3,4ГГц). Чтобы отличать процессоры на ядре Northwood от аналогичных моделей на ядре Willamette, было решено в конце названия новых процессоров приписывать букву «A» (например Pentium 4 2,0A построен на ядре Northwood).

Prescott

Mobile Pentium 4

Первые версии Pentium 4 для ноутбуков и лэптопов были анонсированы года, были построены на ядре Northwood и носили имя Mobile Pentium 4-M. От настольных версий эти процессоры отличались заниженным напряжением питания (1,2-1,3 В) и поддержкой технологии . Частота системной шины у всех процессоров составляла 400 МГц. Были выпущены модели с частотами 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0; 2,2; 2,4; 2,5; 2,6, TDP у последней модели составляет 35 Вт.

Prescott 2M

Первые слухи о новом ядре Prescott 2 появились в начале 2005 года. Предполагалось, что оно будет иметь 2 Мбайт кэша L2 и частоту FSB равную 266 МГц (эффективная частота 1066 МГц). Процессоры на основе этого ядра были анонсированы . От ядра Prescott это ядро отличается только наличием 2 Мбайт кэш-памяти L2. Новые процессоры получили и новую маркировку: 6x0. 21 февраля 2005 года были анонсированы модели Pentium 4 630, 640, 650, 660 с частотами 3,0; 3,2; 3,4; 3,6 ГГц, позднее была представлена модель 670, работающая на частоте 3,8 ГГц.

Cedar Mill

Анонс процессоров, построенных на новом ядре, запланирован на вторую половину января . Ядро Cedar Mill представляет собой одноядерную модификацию ядра известного под кодовым именем . Cedar Mill изготовлен с использованием новейшей 65 нм технологии. По сути, ядро представляет собой ядро Prescott 2M, даже не изменилась серия процессора, процессоры без поддержки технологии виртуализации Vanderpool имеют маркировку вида 6x1, с поддержкой Vanderpool имеют маркировку вида 6x3. Процессоры первоначально будут иметь частоту от 3,0 ГГц до 3,8 ГГц. Более подробно о причине выхода Cedar Mill рекомендуется читать здесь .

Ядро Cedar Mill является последним в линейке Pentium 4. Следующие поколения процессоров, в частности Conroe, будут продвигаться под новым брэндом, название которого, пока, не анонсировано.

Tejas, Jayhawk и другие

Intel возлагала на архитектуру NetBurst большие надежды. В 2001-2003 в роадмэпах Intel встречались такие ядра, как Tejas, который должен был использовать шину 1066 МГц и работать на частотах от 4,4 до 9,2 ГГц и должен был бы быть поступить в продажу во второй половине 2004 года и называться Pentium 6. Nehalem, как предполагалось, этот процессор должен был использовать системную шину 1200 МГц и работать на частотах свыше 10 ГГц, и должен был поступить в продажу в 2005 году. Jayhawk, процессор серии Xeon, который должен был иметь кэш L1 для данных объемом 24 Кб и для 16 тысяч микроопераций. Однако все эти процессоры в 2004 году были отменены.

Intel предполагала с помощью процессоров основанных на архитектуре NetBurst достичь частоты в 10ГГц, но, не дойдя и до 4 ГГц, эта архитектура столкнулась с неразрешимыми до сих пор (и похоже уже никогда) тепловыми проблемами. Данная проблема подтолкнула Intel к разработке новой архитектуры и к закрытию всех проектов по разработке ядер на архитектуре NetBurst.

Взглянув назад, Pentium 4 оставляет двойственное впечатление. С одной стороны это был одни из самых популярных процессоров, его продвижение в , и, как следствие, огромная популярность в народе, позволили Intel надолго занять большую часть рынка. С другой стороны Pentium 4 имел не самую удачную архитектуру. Он так ни разу и не закрепил своё лидирующее положение в плане производительности, по уровню TDP (тепловыделение) он практически всегда проигрывал конкурентным процессорам AMD Athlon, впрочем также, как и по стоимости. А архитектура Pentium III, которую когда-то Intel посчитала менее перспективной, чем NetBurst вновь появилась в процессорах .

Технические характеристики различных ядер

Данные относящиеся ко всем моделям

  • Разрядность : 32
  • Разрядность внешней шины: 128

Willamette

  • Дата анонса первой модели: 20 ноября 2000 года
  • Тактовые частоты (ГГц): 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0
  • Эффективная частота системной шины (FSB) (МГц): 400
  • Размер кэша L2(Кбайт): 256
  • Напряжение питания: 1,7 В или 1,75 В
  • Количество транзисторов (млн.): 42
  • Площадь кристалла (кв. мм): 217
  • Максимальное TDP (расчетное тепловыделение): 75,3 Вт
  • Техпроцесс (нм): 180
  • Разъём: Socket 423, позже Socket 478
  • Корпус: 423-контактный FC-PGA2 или 478-контактный mPGA
  • Поддерживаемые технологии: IA32, SSE2

Northwood

  • Дата анонса первой модели: 7 августа 2001 года
    • Процессоры с частотой FSB равной 400МГц: 1,6; 1,8; 2,0; 2,2; 2,4; 2,5; 2,6; 2,8
    • Процессоры с частотой FSB равной 533МГц: 2,26; 2,4; 2,53; 2,67; 2,8; 3,06
    • Процессоры с частотой FSB равной 800МГц: 2,4; 2,6; 2,8; 3,0; 3,2; 3,4
  • Эффективная частота системной шины (FSB) (МГц): 400, 533, 800
  • Размер кэша L1: 8Кбайт (для данных)+12 тысяч операций
  • Размер кэша L2(Кбайт): 512
  • Напряжение питания: 1,475-1,55 (в зависимости от модели)
  • Количество транзисторов (млн.): 55
  • Площадь кристалла (кв. мм): 146, позже 131
  • Максимальное TDP (расчетное тепловыделение): 89 Вт
  • Техпроцесс (нм): 130
  • Разъём: Socket 478
  • Корпус: 478-контактный mPGA
  • Поддерживаемые технологии: IA32, MMX, SSE, SSE2, HT (не все модели)

Введение

Перед началом сезона летних отпусков оба ведущих производителя процессоров, AMD и Intel, выпустили последние модели процессоров в своих современных линейках CPU, нацеленных на использование в высокопроизводительных PC. Сначала сделала последний шаг перед предстоящим качественным скачком AMD и примерно с месяц назад представила Athlon XP 3200+ , который, как предполагается, станет самым быстрым представителем семейства Athlon XP. Дальнейшие же планы AMD в этом секторе рынка связываются уже с процессором следующего поколения с x86-64 архитектурой, Athlon 64, который должен появится в сентябре этого года. Intel же выждал небольшую паузу и представил последний из Penlium 4 на 0.13-микронном ядре Northwood только сегодня. В итоге, заключительной моделью в этом семействе стал Pentium 4 с частотой 3.2 ГГц. Пауза перед выходом следующего процессора для настольных PC, основанного на новом ядре Prescott, продлится до четвертого квартала, когда Intel вновь поднимет планку быстродействия своих процессоров для настольных компьютеров благодаря росту тактовой частоты и усовершенствованной архитектуре.

Следует отметить, что за время противостояния архитектур Athlon и Pentium 4, показала себя более масштабируемой архитектура от Intel. За период существования Pentium 4, выпускаемых по различным технологическим процессам, их частота выросла уже более чем вдвое и без проблем достигла величины 3.2 ГГц при использовании обычного 0.13-микронного технологического процесса. AMD же, задержавшаяся со своими Athlon XP на отметке 2.2 ГГц, не может похвастать на настоящий момент столь же высокими частотами своих процессоров. И хотя на одинаковых частотах Athlon XP значительно превосходит по быстродействию Pentium 4, постоянно увеличивающийся разрыв в тактовых частотах сделал свое дело: Athlon XP 3200+ с частотой 2.2 ГГц назвать полноценным конкурентом Penium 4 3.2 ГГц можно лишь со значительными оговорками.

На графике ниже мы решили показать, как росли частоты процессоров семейств Pentium 4 и Athlon за последние три года:

Как видим, частота 2.2 ГГц является для AMD непреодолимым барьером, покорен который будет в лучшем случае только лишь во второй половине следующего года, когда AMD переведет свои производственные мощности на использование 90-нанометровой технологии. До этих же пор даже процессоры следующего поколения Athlon 64 будут продолжать иметь столь невысокие частоты. Смогут ли они при этом составить достойную конкуренцию Prescott – сказать трудно. Однако, похоже, AMD ждут тяжелые проблемы. Prescott, обладающий увеличенным кешем первого и второго уровня, усовершенствованной технологией Hyper-Threading и растущими частотами может стать гораздо более привлекательным предложением, нежели Athlon 64.

Что касается процессоров Pentium 4, то их масштабируемости можно только позавидовать. Частоты Pentium 4 плавно увеличиваются с самого момента выхода этих процессоров. Небольшая пауза, наблюдающаяся летом-осенью этого года, объясняется необходимостью внедрения нового технологического процесса, но она не должна повлиять на расстановку сил на процессорном рынке. Включив технологию Hyper-Threading и переведя свои процессоры на использование 800-мегагерцовой шины, Intel добился ощутимого превосходства старших моделей своих CPU над процессорами конкурента и теперь может ни о чем не беспокоиться, по крайней мере, до начала массового распространения Athlon 64.

Также на графике выше мы показали и ближайшие планы компаний AMD и Intel по выпуску новых CPU. Похоже, AMD в ближайшее время не должна питать никаких иллюзий по поводу своего положения на рынке. Борьба с Intel на равных для нее заканчивается, компания возвращается в привычную для себя роль догоняющего. Впрочем, долгосрочные прогнозы строить пока рано, посмотрим, что даст для AMD выход Athlon 64. Однако, судя по сдержанной реакции разработчиков программного обеспечения на технологию AMD64, никакой революции с выходом следующего поколения процессоров от AMD не произойдет.

Intel Pentium 4 3.2 ГГц

Новый процессор Pentium 4 3.2 ГГц, который Intel анонсировал сегодня, 23 июня, с технологической точки зрения ничего особенного собой не представляет. Это все тот же Northwood, работающий на частоте шины 800 МГц и поддерживающий технологию Hyper-Threading. То есть, по сути, процессор полностью идентичен (за исключением тактовой частоты) Pentium 4 3.0 , который был анонсирован Intel в апреле.

Процессор Pentium 4 3.2 ГГц, как и предшественники, использует ядро степпинга D1

Единственный факт, который следует отметить в связи с выходом очередного процессора Pentium 4 на ядре Northwood – это вновь возросшее тепловыделение. Теперь типичное тепловыделение Pentium 4 3.2 ГГц составляет порядка 85 Вт, а максимальное - ощутимо превышает величину 100 Вт. Именно поэтому использование грамотно спроектированных корпусов является одним из необходимых требований при эксплуатации систем на базе Pentium 4 3.2 ГГц. Одного вентилятора в корпусе теперь явно недостаточно, кроме того, необходимо следить и за тем, чтобы воздух в районе размещения процессора хорошо вентилировался. Intel также говорит и о том, что температура воздуха, окружающего процессорный радиатор, не должна превышать 42 градуса.

Ну и еще раз напомним, что представленный Pentium 4 3.2 ГГц – последний CPU от Intel для высокопроизводительных настольных систем, основанный на 0.13-микронной технологии. Следующий процессор для таких систем будет использовать уже новое ядро Prescott, изготавливаемое по 90-нанометровой технологии. Соответственно, тепловыделение будущих процессоров для настольных PC будет меньше. Следовательно, Pentium 4 3.2 ГГц так и останется рекордсменом по тепловыделению.

Официальная цена на Pentium 4 3.2 ГГц составляет $637, а это значит, что данный процессор является самым дорогим CPU для настольных компьютеров на сегодняшний день. Более того, Intel рекомендует использовать новинку с недешевыми материнскими платами на базе набора логики i875P. Однако, как мы знаем, данным требованием можно пренебречь: многие более дешевые системные платы на базе i865PE обеспечивают аналогичный уровень производительности благодаря активизации производителями технологии PAT и в наборе логики i865PE.

Как мы тестировали

Целью данного тестирования являлось выяснение того уровня производительности, который может обеспечить новый Pentium 4 3.2 ГГц по сравнению с предшественниками и старшими моделями конкурирующей линейки Athlon XP. Таким образом, в тестировании помимо Pentium 4 3.2 ГГц приняли участие Petnium 4 3.0 ГГц, Athlon XP 3200+ и Athlon XP 3000+. В качестве платформы для тестов Pentium 4 мы выбрали материнскую плату на чипсете i875P (Canterwood) с двухканальной DDR400 памятью, а тесты Athlon XP проводились при использовании материнской платы на базе наиболее производительного чипсета NVIDIA nForce 400 Ultra.

Состав тестовых систем приведен ниже:

Примечания:

  • Память во всех случаях эксплуатировалась в синхронном режиме с FSB в двухканальной конфигурации. Использовались наиболее агрессивные тайминги 2-2-2-5.
  • Тестирование выполнялось в операционной системе Windows XP SP1 с установленным пакетом DirectX 9.0a.

Производительность в офисных приложениях и приложениях для создания контента

В первую очередь по сложившейся традиции мы измерили скорость процессоров в офисных приложениях и приложениях, работающих с цифровых контентом. Для этого мы воспользовались тестовыми пакетами семейства Winstone.

В Business Winstone 2002, включающем в себя типовые офисные бизнес-приложения, на высоте оказываются процессоры семейства Athlon XP, производительность которых ощутимо превосходит скорость процессоров конкурирующего семейства. Данная ситуация достаточно привычна для этого теста и обуславливается как особенностями архитектуры Athlon XP, так и большим объемом кеш-памяти у ядра Barton, суммарная емкость которой благодаря эксклюзивности L2 достигает 640 Кбайт.

В комплексном тесте Multimedia Content Creation Winstone 2003, измеряющем скорость работы тестовых платформ в приложениях для работы с цифровым контентом, картина несколько иная. Процессоры Pentium 4, имеющие NetBurst архитектуру и обладающие высокоскоростной шиной с пропускной способностью 6.4 Гбайта в секунду оставляют старшие модели Athlon XP далеко позади.

Производительность при обработке потоковых данных

Большинство приложений, работающих с потоками данных, как известно, работает быстрее на процессорах Pentium 4. Здесь раскрываются все преимущества NetBurst архитектуры. Поэтому, результат, полученный нами в WinRAR 3.2, не должен никого удивлять. Старшие Pentium 4 значительно обгоняют по скорости сжатия информации топовые Athlon XP.

Аналогичная ситуация наблюдается и при кодировании звуковых файлов в формат mp3 кодеком LAME 3.93. Кстати, данный кодек поддерживает многопоточность, поэтому высокие результаты Pentium 4 здесь можно отнести и на счет поддержки этими CPU технологии Hyper-Threading. В итоге, Pentium 4 3.2 обгоняет старший Athlon XP с рейтингом 3200+ почти на 20%.

В данное тестирование мы включили результаты, полученные при измерении скорости кодирования AVI ролика в формат MPEG-2 одним из лучших кодеров, Canopus Procoder 1.5. Как это не удивительно, Athlon XP в данном случае показывает слегка более высокую производительность. Впрочем, отнести это, скорее всего, следует на счет высокопроизводительного блока операций с плавающей точкой, присутствующего в Athlon XP. SSE2 инструкции процессоров Pentium 4 в данном случае, как мы видим, не могут являться столь же сильной альтернативой. Правда, следует отметить, что разрыв в скорости старших моделей Athlon XP и Pentium 4 совсем небольшой.

Кодирование видео в формат MPEG-4 – еще один пример задачи, где процессоры Pentium 4 с технологией Hyper-Threading и 800-мегагерцовой шиной демонстрирует свои сильные стороны. Превосходство Pentium 4 3.2 над Athlon XP 3200+ в этом тесте составляет почти 20%.

Аналогичная ситуация наблюдается и при кодировании видео при помощи Windows Media Encoder 9: это приложение имеет оптимизацию под набор команд SSE2 и отлично приспособлено для NetBurst архитектуры. Поэтому, совершенно неудивительно, что вновь верхнюю часть диаграммы оккупировали процессоры от Intel.

Производительность в игровых приложениях

После выхода пропатченной версии 3Dmark03 результаты Pentium 4 относительно Athlon XP в этом тесте стали несколько выше. Однако расклад сил это не изменило: Pentium 4 лидировали в этом бенчмарке и ранее.

Pentium 4 подтверждает свое лидерство и в общем зачете в 3Dmark03. Правда, отрыв здесь небольшой: сказывается тот факт, что 3Dmark03 в первую очередь – это тест видеоподсистемы.

После перехода Pentium 4 на использование 800-мегагерцовой шины, Pentium 4 стали обгонять Athlon XP и в более старой версии 3Dmark2001. Причем, отрыв Pentium 4 3.2 ГГц от Athlon XP 3200+ уже достаточно существенен и составляет 6%.

В Quake3 Pentium 4 традиционно обгоняет Athlon XP, поэтому результат удивления не вызывает.

Аналогичная картина наблюдается и в игре Return to Castle Wolfenstein. Это совершенно логично, поскольку данная игра использует тот же движок Quake3.

Одно из немногих приложений, где старшей модели Athlon XP удается удержать лидерство, это – Unreal Tournament 2003. Хочется отметить, что все современные игры не имеют поддержки технологии Hyper-Threading, поэтому в играх потенциал новых Pentium 4 пока раскрывается не полностью.

А вот в Serious Sam 2 Athlon XP 3200+ больше лидером не является. С выходом нового процессора от Intel пальма первенства в этой игре переходит именно к Pentium 4 3.2 ГГц.

Новая игра Splinter Cell, хотя и основана на том же движке, что и Unreal Tournament 2003, быстрее работает на процессорах от Intel.

В целом, остается признать, что быстрейшим процессором для современных 3D игр на данный момент является Pentium 4 3.2 ГГц, обходящий Athlon XP 3200+ в большинстве игровых тестов. Ситуация меняется стремительно. Еще совсем недавно старшие Athlon XP в игровых тестах нисколько не уступали процессорам от Intel.

Производительность при 3D-рендеринге

Поскольку 3ds max 5.1, который мы использовали в данном тестировании, хорошо оптимизирован под многопоточность, Pentium 4, умеющий исполнять два потока одновременно благодаря технологии Hyper-Threading, с большим отрывом оказывается лидером. Даже старший Athlon XP 3200+ не может составить ему никакой конкуренции.

Абсолютно тоже самое можно сказать и про скорость рендеринга в Lightwave 7.5. Впрочем, в некоторых сценах, например при рендеринге Sunset, старшие модели Athlon XP смотрятся не так уж и плохо, однако такие случаи единичны.

Спорить с Pentium 4, выполняющем два потока одновременно, в задачах рендеринга для Athlon XP сложновато. К сожалению, AMD не имеет планов по внедрению технологий, подобных Hyper-Threading даже в будущих процессорах семейства Athlon 64.

Абсолютно аналогичная ситуация наблюдается и в POV-Ray 3.5.

Производительность при научных расчетах

Для тестирования скорости новых CPU от AMD при научных расчетах был использован пакет ScienceMark 2.0. Подробности об этом тесте можно получить на сайте http://www.sciencemark.org . Этот бенчмарк поддерживает многопоточность, а также все наборы SIMD-инструкций, включая MMX, 3DNow!, SSE и SSE2.

То, что в задачах математического моделирования или криптографии процессоры семейства Athlon XP показывают себя с наилучшей стороны, известно давно. Здесь мы видим еще одно подтверждение этого факта. Хотя, надо сказать, свое былое преимущество Athlon XP начинает терять. Например, в тесте Molecular Dinamics на первое место выходит уже новый Pentium 4 3.2 ГГц.

Кроме теста ScienceMark в этом разделе мы решили протестировать и скорость работы новых процессоров в клиенте российского проекта распределенных вычислений MD@home, посвященному расчету динамических свойств олигопептидов (фрагментов белков). Расчет свойств олигопептидов, возможно, сможет помочь изучению фундаментальных свойств белков, тем самым, внеся вклад в развитие науки.

Как видим, задачи молекулярной динамики новые Pentium 4 решают быстрее Athlon XP. Столь высокого результата Pentium 4 достигают благодаря своей технологии Hyper-Threading. Сам клиент MD@home, к сожалению, многопоточность не поддерживает, однако запуск двух клиентских программ в параллели на системах с процессорами с технологией Hyper-Threading позволяет ускорить процесс расчета более чем на 40%.

Выводы

Проведенное тестирование явно показывает, что на очередном этапе конкурентной борьбы Intel удалось одержать победу над AMD. Последний процессор на ядре Northwood обгоняет по своей производительности старшую и последнюю модель Athlon XP в большинстве тестов. За последнее время Intel смог значительно увеличить частоты своих CPU, увеличить частоту их шины, а также внедрить хитрую технологию Hyper-Threading, дающую дополнительный прирост скорости в ряде задач. AMD же, не имея возможности наращивать тактовые частоты своих процессоров ввиду технологических и архитектурных сложностей, не смогла адекватно усилить свои CPU. Не поправило положение даже появление нового ядра Barton: последние модели Pentium 4 оказываются явно сильнее старших Athlon XP. В результате, Pentium 4 3.2 ГГц вполне можно считать наиболее производительным CPU для настольных систем в настоящее время. Такая ситуация продлится по меньшей мере до сентября, когда AMD, наконец, должна будет анонсировать свои новые процессоры семейства Athlon 64.

Необходимо отметить и тот факт, что рейтинговая система, используемая в настоящее время AMD для маркировки своих процессоров, не может больше являться критерием, по которому Athlon XP можно сопоставлять с Pentium 4. Улучшения, которые произошли с Pentium 4, в числе которых следует отметить перевод этих CPU на 800-мегагерцовую шину и внедрение технологии Hyper-Threading, привели к тому, что Pentium 4 с частотой, равной рейтингу соответствующего Athlon XP, оказывается явно быстрее.

В общем, мы с интересом будем ожидать осени, когда и AMD и Intel представят свои новые разработки, Prescott и Athlon 64, которые, возможно, смогут обострить конкурентную борьбу между давними соперниками на процессорном рынке. Сейчас же AMD оказывается оттеснена Intel в сектор недорогих процессоров где, впрочем, эта компания чувствует себя превосходно: Celeron по сравнению с Athlon XP – откровенно слабый соперник.

Как известно, революции в компьютерном
мире случаются все реже. Да и так ли они необходимы там, где, в общем-то, "все
хорошо", где возможности систем и продуктов с лихвой покрывают нужды большинства
современных пользователей. Это в полной мере относится и к процессорам корпорации
Intel, лидера индустрии. У компании есть полная линейка высокопроизводительных
CPU всех уровней (серверные, десктопные, мобильные), тактовые частоты давно уже
перевалили за "заоблачные" 3 GHz, продажи идут просто "на ура".
И наверное, если бы не оживившиеся конкуренты (точнее, конкурент ), то все
было бы совсем хорошо.

Но "гонка гигагерцев" не прекращается. Оставим в стороне рассмотрение вопросов вроде "Кому это нужно? " и "Насколько это востребовано? " — примем лишь как факт: чтобы удержаться на плаву, производители CPU просто вынуждены тратить силы на выпуск все более быстродействующих (или как минимум более высокочастотных ) продуктов.

Начало февраля Intel отметила представлением целой обоймы новых процессоров. Компания
выпустила сразу семь новых CPU, в числе которых:

  • Pentium 4 3,40 GHz ("старое" ядро Northwood);
  • Pentium 4 Extreme Edition 3,40 GHz;
  • целых четыре представителя новой линейки с ядром Prescott (кстати, ударение
    на первом слоге) — 3,40E, 3,20E, 3,0E и 2,80E GHz, изготовленные по 90-нанометровой
    технологии и оснащенные кэшем второго уровня объемом 1 MB.

Все эти CPU рассчитаны на шину 800 MHz и поддерживают технологию Hyper-Threading. Кроме того, Intel выпустила Pentium 4 на ядре Prescott с частотой 2,8A GHz, также изготовленный по 90-нанометровому процессу, но рассчитанный на частоту FSB 533 MHz и не поддерживающий Hyper-Threading . По информации Intel, предназначен этот процессор специально для OEM-производителей ПК в ответ на их пожелания. От себя добавим — и на радость оверклокерам, которые наверняка оценят его возможности разгона.

С выпуском новых CPU семейство Pentium 4 значительно пополнилось и сейчас выглядит так, как показано в табл. 1. Естественно, пока Intel вовсе не собирается сворачивать производство Pentium 4 на ядре Northwood с FSB 533 и 800 MHz. Кроме того, в линейке остаются и несколько моделей, рассчитанных на шину 400 MHz (пять процессоров от 2A до 2,60 GHz).

Разрабатывая 90-нанометровые технологии, которые должны обеспечить нормальное
функционирование процессоров класса Prescott, инженеры Intel вынуждены
были преодолевать серьезные препятствия. Природа этих преград состояла
не в недостаточном разрешении производственного оборудования, а в проблемах
физического характера, связанных с невозможностью изготовления столь малых
транзисторов по традиционным технологиям.

Первой проявилась утечка заряда с затвора транзистора через истончившийся
слой диэлектрика между затвором и каналом. При разрешении 90 нм он "выродился"
в барьер из четырех атомов SiO2 толщиной 1,2 нм. Появилась необходимость
в новых изолирующих материалах с более высоким значением константы диэлектрической
проницаемости (high-K dielectric). За счет большей проницаемости они позволяют
наращивать толстый (до 3 нм) изолирующий слой, не создавая при этом препятствий
для электрического поля затвора. Таковыми стали оксиды гафния и циркония.
К сожалению, они оказались несовместимы с применяемыми ныне поликристаллическими
затворами, да и фононные колебания, возникающие в диэлектрике, вызывают
снижение подвижности электронов в канале.

На границе с затвором наблюдается иное явление, выражающееся в значительном
повышении порогового уровня напряжения, необходимого для изменения состояния
проводимости канала транзистора. Решение было найдено в виде металлического
затвора. В прошлом году специалисты корпорации подобрали, наконец, два
подходящих металла, которые позволили сконструировать новые миниатюрные
NМOS- и PMOS-транзисторы. Какие именно металлы они использовали — до
сих пор держится в секрете.

Чтобы увеличить быстродействие транзисторов (оно определяется скоростью
перехода в открытое/закрытое состояние), Intel прибегла к формированию
канала из единого кристалла напряженного кремния. "Напряжение"
в данном случае означает деформирование кристаллической решетки материала.
Как оказалось, сквозь структурно нарушенный кремний как электроны (+10%
для NМOS), так и дырки (+25% для PMOS) проходят с меньшим сопротивлением.
Улучшение подвижности увеличивает максимальный ток транзистора в открытом
состоянии.

Для NМOS- и PMOS-транзисторов напряженное состояние достигается различными
методиками. В первом случае все очень просто: обычно транзистор сверху
"укрыт" слоем нитрида кремния, который выполняет функцию предохраняющей
маски, а для создания напряжения в канале толщину слоя нитрида увеличивают
вдвое. Это ведет к созданию дополнительной нагрузки на области истока
и стока и, соответственно, растягивает, деформирует канал.

PMOS-транзисторы "напрягают" по другой схеме. Сначала зоны
истока и стока вытравливают, а потом наращивают в них слой SiGe. Атомы
германия превышают по размерам атомы кремния и поэтому германиевые прослойки
всегда использовались для создания напряжения в кремнии. Однако особенность
технологии Intel заключается в том, что в данном случае сжатие кремниевого
канала происходит в продольном сечении.

Новый технологический процесс также позволил увеличить количество слоев
металлизации с шести до семи (медные соединения). Любопытно, что на производственной
линии "плечом к плечу" трудятся как литографические аппараты
нового поколения с длиной волны 193 нм, так и их предшественники с длиной
волны 248 нм. Вообще процент повторно использованной техники достиг 75,
что позволило снизить стоимость модернизации фабрик.

Особенности Prescott

В дискуссиях, предшествовавших выпуску процессора на ядре Prescott, он в шутку именовался не иначе как "Pentium 5". Собственно, именно таким был типичный ответ компьютерного профи на вопрос "Что такое Prescott?". Конечно, Intel не стала менять торговую марку, да и достаточных оснований для этого не было. Вспомним практику выпуска программного обеспечения — там смена номера версии происходит только при кардинальной переработке продукта, тогда как менее значительные изменения обозначаются дробными номерами версий. В процессорной индустрии дробные номера пока не приняты, и то, что Prescott продолжил линейку Pentium 4, как раз и является отражением того факта, что перемены носят не настолько радикальный характер.

Процессоры на ядре Prescott хоть и содержат немало новшеств и модификаций по сравнению
с Northwood, однако основаны на той же архитектуре NetBurst, имеют ту же корпусировку,
что и предыдущие Pentium 4, устанавливаются в тот же разъем Socket 478 и, в принципе,
должны работать на большинстве материнских плат, поддерживающих 800 MHz FSB и
обеспечивающих должные напряжения питания (естественно, потребуется обновление
BIOS).

Детальное изучение практических вопросов, касающихся Prescott, мы оставим для отдельного материала. А пока попробуем рассмотреть, какие изменения появились в Prescott, и понять, насколько этот процессор отличается от своего предшественника и чего можно в результате ожидать.

Основные новшества, реализованные в ядре Prescott, следующие:

  • Перевод производства кристаллов на техпроцесс 90 нм.
  • Возросшая длина конвейера (с 20 до 31 стадии).
  • Вдвое увеличенные кэши L1 (кэш данных — с 8 до 16 KB) и L2 (с 512 KB до
    1 MB).
  • Изменения в архитектуре:
    -модифицированный блок предсказания переходов;
    -усовершенствованная логика работы L1-кэша (улучшенная предварительная выборка
    данных);
    -появление новых блоков в процессоре;
    -увеличенный объем некоторых буферов.
  • Усовершенствованная технология Hyper-Threading.
  • Появление поддержки нового набора SIMD-инструкций SSE3 (13 новых команд).

Главные различия трех процессорных ядер, использовавшихся в Pentium 4, сведены в табл. 2. Число транзисторов в Prescott увеличилось более чем вдвое — на 70 млн. Из них, по грубым оценкам, порядка 30 млн. можно отнести на счет удвоившегося L2-кэша (дополнительные 512 KB, по 6 транзисторов на одну ячейку). Причем остается еще вполне солидное число, и даже по одному этому значению можно косвенно судить о масштабах произошедших в ядре изменений. Заметим, что, несмотря на такой рост числа элементов, площадь ядра не только не увеличилась, но даже уменьшилась по сравнению с Northwood.

С 90-нанометровым технологическим процессом все, в общем-то, понятно (конечно, на упрощенном, "пользовательском" уровне). Меньший размер транзисторов позволит снизить напряжение питания процессора и уменьшить рассеиваемую им мощность, а следовательно, и нагрев. Это откроет дорогу для дальнейшего увеличения тактовых частот, которое хотя и будет сопровождаться ростом тепловыделения, но "начало отсчета" для этого роста будет уже другим, несколько ниже. Отметим, что с учетом большего числа транзисторов в Prescott по сравнению с Northwood правильнее было бы говорить не об уменьшении, а о сохранении или же меньшем увеличении рассеиваемой мощности.

Удлиненный конвейер . Как видно из табл. 2, по длине конвейера Prescott (31 стадия) более чем наполовину превосходит Northwood. Что за этим кроется, вполне понятно: это не первый случай, когда Intel увеличивает длину конвейера, нацеливаясь на повышение тактовых частот — известно, что чем длиннее конвейер, тем лучше "разгоняется" процессорное ядро. В принципе, сложно сказать однозначно, так ли необходимо такое "удлинение" на текущем этапе, на частотах в районе 3,5 GHz — энтузиасты-оверклокеры разгоняли Pentium 4 (Northwood) и до более высоких значений. Но рано или поздно рост числа стадий оказался бы неизбежен — так почему бы не совместить это событие с выпуском нового ядра?

Увеличенные объемы кэшей и буферов . В принципе, этот пункт напрямую связан с предыдущим. Чтобы обеспечить работой длинный конвейер на высоких частотах, желательно иметь большего объема "подручный склад" в виде кэша для уменьшения количества простоев, при которых процессор ожидает загрузки требуемых данных из памяти. Кроме того, хорошо известно, что при прочих равных из двух процессоров с разной длиной конвейера производительнее окажется тот, у которого этот параметр меньше. При ошибках предсказания перехода процессор вынужден "сбрасывать" свой конвейер и загружать его работой по-новому. И чем большее число стадий в нем содержится, тем болезненнее оказываются подобные промахи. Полностью их исключить, конечно же, нельзя, и на одинаковых частотах Northwood и Prescott последний оказался бы менее производительным… не будь у него большего L2-кэша, во многом компенсирующего отставание. Естественно, здесь все зависит от специфики конкретных приложений, что мы и попытаемся проверить в практической части.

Как говорилось выше, в Prescott увеличен не только общий L2-кэш, но и L1-кэш данных, объем которого вырос с 8 до 16 KB. Также изменились его организация и часть логики работы — к примеру, введен механизм принудительного продвижения (force forwarding ), уменьшающий задержки в случаях, когда зависимая операция загрузки данных из кэша не может спекулятивно выполняться до завершения предшествующей операции помещения этих данных в кэш.

Кроме объемов кэшей, увеличению подверглась и емкость двух планировщиков, отвечающих за хранение микроопераций (uops ), которые используются в инструкциях x87/SSE/SSE2/SSE3. Это, в частности, позволило более эффективно находить параллелизм в мультимедиаалгоритмах и выполнять их с лучшей производительностью.

Собственно, некоторых новшеств в архитектуре Pentium 4, реализованных в Prescott, мы уже успели коснуться, поскольку они "разбросаны" по ядру процессора и затрагивают многие его блоки. Следующим важным изменением является…


Модифицированный блок предсказания переходов . Как известно, точность
работы этого блока является критически важной для обеспечения высокой производительности
современного процессора. "Просматривая" программный код, следующий за
выполняемым в настоящий момент, процессор может заранее выполнять части
данного кода — это хорошо известное спекулятивное выполнение . Если же
в программе встречается ветвление в результате условного перехода (если-то-иначе ),
то возникает вопрос о том, какую из двух веток "лучше" выполнять заранее.
Алгоритмы в Northwood действовали относительно просто: переходы назад предполагались
совершающимися, вперед — нет. Это большей частью работало для циклов,
но не для других видов переходов. В Prescott используется понятие длины
перехода : исследования показали, что если дальность перехода превышает
определенный предел, то переход с большой долей вероятности совершаться не будет
(соответственно, спекулятивно выполнять эту часть кода не нужно). Также в Prescott
введен более тщательный анализ самих условий перехода, на основании которого принимаются
решения о вероятности выполнения перехода. Кроме статических алгоритмов предсказания,
изменениям подверглись и динамические алгоритмы (кстати, новые идеи были частично
заимствованы из мобильного Pentium M).

Появление новых блоков в процессоре . Два новых блока в Prescott — это блок побитовых сдвигов и циклических сдвигов (shifter/rotator) и выделенный блок целочисленного умножения . Первый позволяет осуществлять наиболее типичные операции сдвига на одном из двух быстрых ALU, работающих на удвоенной частоте ядра CPU (в предыдущих модификациях Pentium 4 эти операции выполнялись как целочисленные и занимали несколько тактов). Для осуществления целочисленного умножения ранее задействовались ресурсы FPU, что достаточно долго — нужно было передать данные в FPU, выполнить там сравнительно медленное умножение и передать результат обратно. В Prescott для ускорения этих операций добавлен новый блок, отвечающий за такие операции умножения.

Улучшенный Hyper-Threading . Конечно, все перечисленные выше новшества введены в Prescott неспроста. По словам специалистов Intel, большинство модификаций в логике работы кэшей, очереди команд и пр. так или иначе связаны с быстродействием процессора при использовании Hyper-Threading, т. е. при одновременной работе нескольких программных потоков. В то же время на производительность "однопоточных" (single-threaded) приложений эти нововведения оказывают лишь незначительное влияние. Также в Prescott увеличился набор инструкций, которым "позволено" исполняться на процессоре параллельно (например, операция с таблицей страниц и операция с памятью, разбивающая строку кэша). Опять-таки, для однопоточных приложений невозможность совмещения подобных операций практически не сказывалась на производительности, тогда как при выполнении двух потоков такое ограничение зачастую становилось "узким местом". Другой пример — если в Northwood происходило "непопадание в кэш" (cache miss) и возникала необходимость чтения данных из оперативной памяти, следующие операции просмотра кэша откладывались до окончания этого действия. В результате одно приложение, часто "промахивающееся" мимо кэша, могло существенно затормозить работу остальных потоков. В Prescott этот конфликт легко преодолевается, операции могут выполняться параллельно. Также в Prescott была переделана логика арбитража и разделения ресурсов между потоками с целью увеличения общей производительности.

Инструкции SSE3. Как мы помним, последний раз расширение набора SIMD-инструкций
Intel провела, выпустив первый Pentium 4 (Willamette) и реализовав в нем SSE2.
Очередное расширение, получившее название SSE3 и содержащее 13 новых инструкций,
осуществлено в Prescott. Все они, за исключением трех, используют SSE-регистры
и предназначены для повышения производительности в следующих областях:

  • быстрое преобразование вещественного числа в целое (fisttp );
  • сложные арифметические вычисления (addsubps, addsubpd, movsldup, movshdup,
    movddup
    );
  • кодирование видео (lddqu );
  • обработка графики (haddps, hsubps, haddpd, hsubpd );
  • синхронизация потоков (monitor, mwait ).

Естественно, детальное рассмотрение всех новых инструкций выходит за рамки материала, эта информация приведена в соответствующем руководстве для программистов. Инструкции первых четырех категорий служат как для ускорения выполнения самих операций, так и для того, чтобы сделать их более "экономными" в смысле использования ресурсов процессора (и, следовательно, оптимизации работы Hyper-Threading и механизма спекулятивного выполнения). Программный код при этом также значительно сокращается и, что немаловажно, упрощается. Например, инструкция ускоренного преобразования вещественного числа в целое fisttp заменяет семь (!) команд традиционного кода. Даже по сравнению с инструкциями SSE2 (которые сами по себе также ускоряют выполнение кода и сокращают его объем) команды SSE3 во многих случаях дают немалую экономию. Две инструкции последней группы — monitor и mwait — позволяют приложению (точнее потоку ) сообщать процессору, что в данный момент оно не выполняет полезной работы и находится в режиме ожидания (например, записи в определенную ячейку памяти, возникновения прерывания или исключительной ситуации). Процессор при этом может переводиться в режим пониженного энергопотребления или же, при использовании Hyper-Threading, отдавать все ресурсы другому потоку. В общем, с SSE3 для программистов открываются новые возможности по оптимизации кода. Проблема здесь, как всегда в таких случаях, одна: пока новый набор инструкций не стал общепринятым стандартом, разработчикам ПО придется поддерживать две ветки кода (с SSE3 и без оной), чтобы приложения работали на всех процессорах…

Камо грядеши?..

В общем, объем новшеств, реализованных в ядре Prescott, вполне можно назвать
значительным. И хотя до "настоящего Pentium 5" он недотягивает, но к
"четырем с половиной" вполне может приблизиться. Переход от ядра Northwood
к Prescott — в принципе, эволюционный процесс, хорошо укладывающийся в общую
стратегию Intel. Постепенные изменения в архитектуре Pentium 4 хорошо видны на
схеме: архитектура модифицируется и пополняется новыми особенностями — идет последовательная
оптимизация процессора под определенный набор ПО.

Чего же можно ожидать от Prescott? Пожалуй, прежде всего (хотя это может показаться и несколько странным) — новых частот. Intel сама признает, что на равных частотах производительность Prescott и Northwood будет мало отличаться. Положительное влияние большого L2-кэша и прочих новшеств Prescott во многом "компенсируется" его значительно более длинным конвейером, который болезненно реагирует на ошибки предсказания переходов. И даже с учетом того, что блок этого самого предсказателя переходов был усовершенствован, все равно идеальным он быть не может. Главное преимущество Prescott в другом: новое ядро позволит дальше наращивать частоту — до значений, недостижимых ранее с Northwood. По планам Intel ядро Prescott рассчитано на два года, пока его не сменит следующее ядро, изготовленное по технологии 65 нм (0,065 мкм).

Поэтому выпущенный сейчас процессор на новом ядре Prescott не претендует прямо со старта на лавры чемпиона производительности и во всей красе должен проявить себя в будущем. Еще одним подтверждением тому является и позиционирование процессора: Pentium 4 на ядре Prescott рассчитан на mainstream-системы, в то время как топовым CPU был и остается Pentium 4 Extreme Edition. Кстати, хотя планка частот у процессоров Intel номинально поднялась до 3,4 GHz с выходом Prescott, но появление первых OEM-систем на базе Pentium 4 3,4 GHz на новом ядре произойдет несколько позднее в этом квартале (а ведь коммерческие поставки Prescott начаты еще в IV квартале 2003 г.).

Еще одна область, где может проявить себя Prescott (и наверняка проявит), — это работа ПО, оптимизированного под SSE3. Процесс оптимизации уже начался, и на сегодня существует как минимум пять приложений с поддержкой нового набора инструкций: MainConcept (MPEG-2/4), xMPEG, Ligos (MPEG-2/4), Real (RV9), On2 (VP5/VP6). В течение 2004 г. поддержка SSE3 должна появиться в таких пакетах, как Adobe Premiere, Pinnacle MPEG Encoder, Sony DVD Source Creator, Ulead MediaStudio и VideoStudio, всевозможные аудио- и видеокодеки и т. д. Вспоминая процесс оптимизации под SSE/SSE2, можно понять, что результаты SSE3 мы увидим, но отнюдь не сразу — опять-таки, это в определенном смысле "задел на будущее".

Ну а что же "по ту сторону линии фронта"? Главный конкурент Intel по-прежнему идет своим путем, все дальше отдаляясь от "генеральной линии". AMD продолжает наращивать "голую производительность", пока что обходясь значительно более низкими частотами. Контроллер памяти, в Athlon 64 перекочевавший из северного моста в процессор, подлил масла в огонь, обеспечив невиданную ранее скорость доступа к ОЗУ. А недавно был выпущен процессор с рейтингом 3400+ (нет, о полном соответствии продукту конкурентов по частоте никто не говорит…).

Однако Intel и AMD сейчас находятся примерно в равных ситуациях — их топовые процессоры ожидают выхода соответствующего оптимизированного ПО, чтобы проявить себя на полную мощность. Intel все больше "уходит в мультимедиа": для офисного ПО производительности Pentium 4 хватает с лихвой, и чтобы Prescott реализовал свой потенциал, нужны оптимизированные мультимедиаприложения (и/или высокие тактовые частоты, в возможности достижения которых можно не сомневаться). Стоит отметить тот факт, что переработка кодеков под SSE3 — пожалуй, не самая сложная операция, а эффект от этого сразу почувствуют все приложения, использующие такие кодеки (причем переработка самих приложений при этом совсем необязательна).

С другой стороны, в середине 2004 г. выйдет 64-разрядная версия Windows для платформы AMD64, на которой как раз и должны проявиться возможности Athlon 64. Конечно, здесь встанет обычный вопрос о наборе приложений под новую ОС, без которых система остается практически бесполезной. Но вспомним, что уже как минимум существуют те же кодеки, откомпилированные под 64-битные Athlon. Так что есть вероятность того, что в недалеком будущем и платформе AMD будет где себя показать. В общем, создается впечатление, что пока титаны просто накачивают мускулы, строят оборонительные сооружения и готовят тылы перед главным… нет, скорее, очередным сражением…

Архив Платформа

2 февраля официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood. Что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки?

См. остальные части нашего обзора:
Часть 2.
Часть 3. Быстродействие в играх.
Часть 4. Производительность в ряде профессиональных графических приложений.

Второго февраля, наконец, свершилось то, чего вся компьютерная индустрия с нетерпением ожидала по крайней мере последние полгода - Intel «опрескотилась»! Это означает, что официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood по трем важнейшим категориям: прогрессивные множественные изменения в микроархитектуре процессорного ядра, использование более «тонкого» технологического процесса изготовления кристаллов с нормами 90 нанометров, применение усовершенствованных материалов для изготовления кристалла. Всё вместе это обещает открыть новые горизонты дальнейшего наращивания быстродействия процессоров архитектуры Intel NetBurst. Но обещания - обещаниями, а что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки? Это и предстоит нам выяснить.

Давненько корпорация Intel не радовала нас новыми процессорами для настольных ПК. После феерического выхода целого сонма новых продуктов весной этого года - процессоров Pentium 4 на ядре Northwood с частотами от 2,4 до 3,0 ГГц на системной шине 800 МГц и двухканальных DDR400-чипсетов для них серий i875 и i865 (Canterwood и Springdale), см., например, обзоры на www.terralab.ru/system/25198 , www.terralab.ru/system/25235 , а также www.terralab.ru/system/28979 , последовал лишь еще один процессор в июне - Pentium 4 3,2 ГГц (см. www.terralab.ru/system/25250 ). И затем наступило до неприличия длительное затишье, пару раз нарушенное лишь появлением очередных Celeron. По сути дела, корпорация не объявляла новых Pentium 4 для массового рынка более семи (!) месяцев подряд, что в современных условиях является непростительно долгим сроком.

Конечно, в середине осени Intel провозгласила одну новинку - Pentium 4 Extreme Edition 3,2 ГГц с чудовищными для настольных систем размерами кэш-памяти (2 Мбайт третьего уровня), кристалла и количеством транзисторов (см. www.terralab.ru/system/29365 ). Но и цена этого «экстра-геймерского» процессора оказалась не менее чудовищна по понятиям персональных компьютеров - под тысячу долларов США. А если учитывать, что реально в розничных магазинах эти «монстры» появились лишь совсем недавно и их продажи на фоне обычных Pentium 4 до сих пор ничтожно малы, то Extreme Edition вполне можно отнести не к массовому сегменту, а к своеобразному «процессору ради престижа», не делающему никакой погоды на массовом рынке ПК (по самым оптимистическим прогнозам корпорации доля P4EE среди всех «Пентиумов» не будет превышать пяти процентов). В этой связи, нетерпеливое ожидание Prescott, обладающего мегабайтной кэш-памятью второго уровня, еще более усилилось.

Intel готовила индустрию к выходу Prescott задолго до его появления и делала это величественно и громогласно. Первые сведения просочились в прессу пару лет назад, а в феврале прошлого года на Intel Developer Forum в Сан-Хосе корпорация организовала публичное оглашение основных архитектурных особенностей будущего процессора и подробно рассказала о технологиях и материалах, применяемых для его изготовления (см., например, www.terralab.ru/system/23898 ). А спустя полгода продемонстрировала общественности сами процессоры в работе и показала фотографию кристалла Prescott, обнародовав дополнительные подробности - количество транзисторов, размер чипа и пр. (см. www.terralab.ru/system/29227 ).

Первоначально руководители корпорации уклончиво обещали выпустить процессор осенью 2003 года (неофициально ходили слухи то о сентябре, потом о начале декабря)… Но время текло, «уж полночь близилась», а Германа все не было… За это время основной конкурент Intel на рынке процессоров для ПК - корпорация AMD - успела трижды (!) выпустить свои новые процессоры: сперва в конце сентября вышел долгожданный Athlon 64 3200+ (см. www.terralab.ru/system/29375 ), затем в декабре появился первый недорогой настольный Athlon 64 3000+, отличавшийся от 3200+ только уменьшенной вдвое кэш-памятью второго уровня, и, наконец, в начале января появился великолепный Athlon 64 3400+, который мог не только соперничать на равных с самыми мощными настольными процессорами Intel, но даже нередко превосходил их и своего более дорогого собрата Athlon 64 FX-51 (см. www.terralab.ru/system/31549 ). И это при том, что он работал всего с одним каналом обычной памяти DDR400, тогда как все остальные «топ-модели» требовали для реализации своего скоростного потенциала как минимум двухканального DDR400-решения.

Поклонники Intel с надеждой ожидали явно застопорившегося выхода ядра Prescott, надеясь на чудо - увеличенные вдвое кэш-памяти первого и второго уровня вкупе с другими усовершенствованиями ядра (новые инструкции SSE3, улучшенные HyperThreading, механизм предвыборки и предсказание ветвлений) обещали если не прорыв, то, по крайней мере, существенный рост производительности нового ядра по сравнению со старым. Ранние «оценочные» степпинги Prescott «ходили» по лабораториям и OEM-партнерам Intel начиная с осени, однако особых восторгов от тех, кому с ними удалось «пообщаться», слыхивать не доводилось. А пока руководители корпорации уверяли, что процессор «уже готов» и начиная с четвертого квартала 2003 года «уже идут» его коммерческие поставки производителям, из недр Intel доносились слухи о задержках, связанных с необходимостью «дооптимизировать» технологию производства и ядро самих процессоров с целью получения нужного теплового режима старших моделей и приемлемого для массового производства выхода годных кристаллов.

И поскольку дальше затягивать официальное объявление Prescott было уже неприемлемо, процессоры выпустили 2 февраля. Однако удалось ли производителю при этом в полной мере побороть «детские болезни левизны» нового ядра? Судя по тому дефициту старших моделей Prescott (с частотой 3,2 и 3,4 ГГц), который испытывают сейчас даже ведущие тестовые лаборатории - не совсем удалось. Например, модель 3,40Е не видел живьем еще никто из знакомых мне людей (исключая сотрудников Intel J ), а модель 3,20E пробыла у нас в редакции всего три рабочих дня, поскольку ее как жуткий дефицит «рвали на части» другие «поклонники», и в первые дни после выхода я не обнаружил ни одного предложения модели 3,20E в российских магазинах (не уверен, что они были даже в японских). С другой стороны, подобный «ажиотаж» можно попробовать объяснить и другим - процессор настолько великолепен, что его просто «выметают» из-под прилавков толпы поклонников.

Итак, 2 февраля Intel выпустила сразу семь новых Pentium 4. Их перечень и краткие отличительные особенности приведены в таблице 1.

Процессор

Pentium 4
Extreme Edition
3,40 ГГц

Pentium 4
3,40 ГГц

Pentium 4
3,40E ГГц

Pentium 4
3,20E ГГц

Pentium 4
3,00E ГГц

Pentium 4
2,80E ГГц

Pentium 4
2,80A ГГц

Технология производства

Шина FSB, МГц

Технология Hyper-Threading

Кэш-память второго и третьего уровней

512 кбайт, 2 Mбайт L3

512 кбайт L2

Напряжение питания, В

Разъём (Socket)

Оптовая цена, $

* В официальном документе Intel для этого процессора указано ядро Northwood, но мы то с вами знаем, что Northwood с кэш-памятью третьего уровня называется ядром Gallatin, официально применяемом только в серверных процессорах Intel Xeon, хотя степпинг кристалла Pentium 4 Extreme Edition - фактически тот же самый, что у аналогичных Xeon MP, см. www.terralab.ru/system/29365 .

Если Pentium 4 3,40 ГГц (на ядре Northwood) и Pentium 4 Extreme Edition 3,40 ГГц - это по сути те же, что и раньше, процессоры - теперь с чуть более высокой частотой ядра, то наибольший интерес для нас представляет линейка новичков на ядре Prescott. «Прескотты» внешне почти ничем не отличаются от традиционных Pentium 4 - они размещены в том же корпусе для разъема Socket 478 и лишь иное расположение элементов с обратной стороны корпуса (фото 1) напоминает, что перед нами именно они.

Как видим, все новые процессоры используют системную шину 800 МГц и технологию HyperThreading, кроме самого младшего - «гадкого утенка-прескотёнка», «разжалованного» до шины 533 МГц и лишенного HT. Предположительные объяснения появления такой модели: (а) необходимость продать Prescott ранних степпингов, которые не столь высокочастотны и экономичны, как текущие модификации, (б) необходимость иметь «свой Prescott» для низкостоимостных систем на чипсетах, не поддерживающих шину 800 МГц, (в) лазейку для продажи «отходов» производства более высокочастотных моделей (отбраковка старших моделей). Последнее имеет под собой более жесткие обоснования, чем это было ранее для Northwood. Дело в том, что заметно возросшие токи утечки для ядра Prescott и более высокое тепловыделение в рабочем состоянии (более 100 ватт для старших моделей) накладывает более жесткие требования на тестирование ядер для той или иной частоты/модели. Если процессоры на ядре Northwood (и предшественники) имели близкие друг к другу характеристики зависимости рассеиваемой мощности от частоты работы (с неплохой точностью подчинялись известной для структур КМОП формуле мощности от частоты), то для Prescott имеет место (по крайней мере, на данный момент) гораздо больший разброс характеристик кристаллов даже внутри одной партии и кремниевой пластины. В результате, производитель вынужден выпускать каждый конкретный экземпляр кристалла для строго определенной (по частотным и тепловым характеристикам) модели процессора с весьма небольшими допусками (запасом на отклонение в худшую и лучшую сторону). С этим связан и тот факт, что даже младшие модели Prescott будут весьма неохотно разгоняться (первое время?) - даже небольшое повышение частоты будет вызывать у них очень резкое (гораздо больше, чем у Northwood) повышение тока потребления и температуры, что негативно скажется на стабильности и «живучести» процессора. Это, кстати, подтвердил и побывавший в нашей лаборатории экземпляр - Prescott 3,20E с большим трудом удалось разогнать до 3,4 ГГц, причем работал он при этом нестабильно, выделяя гораздо больше тепла, чем на штатной частоте (не в пример аналогичным Northwood и Extreme Edition, которые подобных проблем не имели). Попутно замечу, что с процессорами Prescott стандартный плавкий термоинтерфейс с обратной стороны боксовых кулеров (фото 2) я настоятельно рекомендую заменять хорошей термопастой.

Краткое сравнение кристаллов трех типов процессоров (Extreme Edition, Northwood и Prescott) представлено в таблице 2. Для сравнения там же приведено текущее ядро процессоров AMD Athlon 64.

Таблица 2. Краткое сравнение кристаллов современных высокопроизводительных процессоров для настольных ПК

Процессор

Intel Pentium 4
Prescott

Intel Pentium 4
Northwood

Intel Pentium 4
Extreme Edition

AMD Athlon 64
ClawHammer

Частоты, ГГц

Технология производства

90 нм,
напряженный кремний

Площадь ядра, кв. мм

Число транзисторов, млн.

Длина целочисленного конвейера

Объем кэш-памяти данных первого уровня

Латентность кэш-памяти первого уровня*

Ассоциативность кэш-памяти первого уровня

Объем кэш-памяти инструкций

12 тыс. микроопераций

12 тыс. микроопераций

12 тыс. микроопераций

Скорость доставки инструкций из кэш-памяти

Объем кэш-памяти второго уровня, кбайт

Латентность кэш-памяти второго уровня*

~30 тактов

~18 тактов

~18 тактов

~12 тактов

Ассоциативность кэш-памяти второго уровня

Объем кэш-памяти третьего уровня

Латентность кэш-памяти третьего уровня*

~45 тактов

Расширение набора инструкций

SSE2/SSE/3Dnow!/ x86-64

Технология HyperThreading

улучшенная

стандартная

стандартная

Напряжение питания, В

Допустимая тепловая мощность, TDP, Вт

* измеренная в программе CPU-Z 1.21.

Количество транзисторов у Prescott увеличилось по сравнения с Northwood более, чем вдвое, но площадь кристалла при этом за счет применения нового техпроцесса даже немного уменьшилась. Вместе с тем, оба они заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку расходуется для «вспомогательных» нужд - магистральные буферы, мультиплексторы и пр.), и это подтверждают оценки из сравнения ядер Northwood и Gallatin, то получается, что добавление 512 кбайт кэш-памяти второго уровня потребовало лишь около 30 миллионов транзисторов, а «остальные» 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. И это - огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего-то около 25 миллионов «затворов»!


Для наглядности приведу фотографии кристаллов Prescott и Northwood, на которых обозначены те или иные блоки процессора (фото 3 и 4). Подробный анализ расположения и состава каждого из этих блоков провели еще весной прошлого года специалисты сайта «Chip Architect» (подробности см. в статьях на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html ). В частности выяснилось, что многие блоки ядра Prescott существенно избыточны и/или содержат скрытые возможности, среди которых не только достаточно очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений (последнее - пока лишь предположение).

Что же касается официально объявленных нововведений ядра Prescott, то о них мы уже писали почти год назад (см. http://www.terralab.ru/system/23898 ) и с тех пор мало, что поменялось (см. таблицу 2 и рисунок 5).

В-третьих, добавлено 13 новых инструкций (Prescott New Instructions или PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рисунок 6). По аналогии с предшественницами, эти новые инструкции назвали SSE3, они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки обычных SSE) и полностью совместимы с программным обеспечением, написанным ранее для процессоров Intel. По оценкам корпорации, простая перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5% (и до десятков процентов в отдельных задачах). Среди уже оптимизированных для SSE3 приложений - будущая версия Unreal II, многие видеокодировщики (MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio), Intervideo и другие, использующие кодек DivX 5.1.1.

Несмотря на множество улучшений, в новом ядре применено и несколько вынужденных «ухудшений». Эти «ухудшения» возникли не от хорошей жизни - они фактически являются альтернативным подходом при проектировании и призваны на самом деле улучшить те или иные показатели процессора в расчете на долговременную перспективу и рост частоты ядра процессора. Главным и наиболее критичным для быстродействия процессора изменением стало (как мы и писали еще год назад, см. www.terralab.ru/system/23898 ) увеличение длины основного конвейера - с 20 до 31 такта. Именно это, а не применение новой 90-нанометровой технологии, способно в перспективе позволить поднять тактовую частоту ядра процессора до 5 ГГц и выше.

Вместе с тем, как мы прекрасно помним по переходу с 10-стадийного до 20-стадийный конвейер (от Pentium III на Pentium 4), это может существенно ухудшить быстродействие системы в некоторых задачах, где велик процент неудачных предсказаний переходов. Чтобы снова не наступать на те же грабли, корпорация предприняла ряд шагов по существенному улучшению работы блока предсказания ветвлений и предвыборки данных. Этой же цели (уменьшения потерь производительности за счет удлинения конвейера) служит и вдвое увеличенная кэш-память. Вместе с тем, как показали наши тесты, даже всех этих мер порой оказывается недостаточно для того, чтобы в некоторых неоптимизированных для архитектуры Intel NetBurst приложениях полностью скомпенсировать «вредное» влияние длинного конвейера. С другой стороны, на оптимизированных приложениях при таком подходе прирост производительности окажется ощутимым (вспомним, с каким скрипом Pentium 4 Willamette продвигался на рынок именно из-за отсутствия поначалу оптимизированных для него приложений).

Рисунок 9.

Вторым «ухудшением» стала примерно вдвое возросшая латентность обоих кэшей (см. рисунок 9). Фактически это плата за их возросший объем и «задел» на будущий рост частоты ядра. В некоторых «линейных» задачах это может и не повлиять на быстродействие, но в других может оказаться весьма «болезненным». (Напомним, что длинный конвейер и возросшая латентность кэш-памяти призваны преодолеть трудности с согласованием работы блоков, расположенных в разных частях кристалла и оперирующих с некоторыми задержками друг относительно друга).

Cхемотехника у Prescott существенно изменилась по сравнению с предшественниками, и большинство блоков процессора фактически было спроектировано «с нуля» в тесном сотрудничестве с разработчиками технологии производства кремниевых чипов, чтобы оптимизировать подходы проектирования. Более того, при проектировании топологии кристалла Prescott впервые было применен полностью автоматизированный подход к трассировке и размещению элементов (например, с целью оптимизации задержек и более равномерного распределения тепла по кристаллу), в результате чего элементы блоков не обязательно расположены строго внутри геометрических границ этих блоков, блоки как бы взаимопроникают друг в друга (это видно, например, по размытости фотографии кристалла Prescott), а между блоками и элементами процессора много пустого места, которое удобно для исправления мелких схемотехнических ошибок, дальнейшей оптимизации кристалла и пр.

Рисунок 10.

Первоначально процессоры Prescott будут работать на чипсетах Canterwood и Springdale на системной шине 800 МГц с памятью DDR400 (см. рисунок 10), но позднее для них выйдут чипсеты Alterwood и Grantsdale с поддержкой памяти DDR II, шины PCI Express, южного моста ICH6 и, видимо, системной шины 1066 МГц. Подавляющее большинство уже выпущенных системных плат на чипсетах Intel 875/865, а также последних чипсетах SiS, VIA и ATI будут совместимы с Prescott путем простого обновления BIOS (оно необходимо для правильной инициализации большей кэш-памяти), поскольку эти платы уже разрабатывались с учетом будущих повышенных требований по питанию (старшие Prescott требуют максимальный ток питания 91 ампер). Вместе с тем, разгон «Прескотта» осилит уже далеко не каждая плата - только самые лучшие.

Процессоры на ядре Prescott изготавливаются по новой для Intel 90-нанометровой технологии (это первый 90-нанометровый процессор, вышедший на рынок), причем сразу на 300-миллиметровых подложках. При производстве Prescott применяются ряд новых материалов и технологий микроэлектроники, подробности по которым мы уже не раз описывали (см., например, статьи на www.terralab.ru/system/30717 и www.terralab.ru/system/30845 ). Перечень основных технологических новшеств приведен в таблице 3. Наиболее важной и них является технология «напряженного» (strained, то есть растянутого или сжатого) кремния: деформированная в ту или иную сторону кристаллическая решетка такого кремния обеспечивает большую подвижность электронов или дырок соответственно, а значит, и более высокие частоты работы полевых транзисторов. Для борьбы с утечками транзисторов также были применены специальные меры - технологические и схемотехнические.

Таблица 3. Основные отличия интеловских технологий производства с нормами 130 и 90 нм

130 нанометров

90 нанометров

6 слоёв медных межсоединений

7 слоёв медных межсоединений

Диэлектрик SIOF с низкой диэлектрической проницаемостью

Диэлектрик CDO (легированный кремнием оксид) с низкой диэлектрической проницаемостью

Силицид кобальта как контакт затвора

Силицид никеля как контакт затвора

Ячейка памяти SRAM площадью 2 кв. мкм

Ячейка памяти SRAM площадью 1,15 кв. мкм

248-нанометровая литография

193-нанометровая литография

Обычный кремний

Напряженный кремний

Несмотря на уменьшившуюся площадь ядра, применение новых технологии и новых материалов при производстве Prescott несколько повысило себестоимость кристаллов. Вместе с тем, себестоимость Prescott возросла незначительно, поэтому цена на модели Northwood и Prescott с одинаковой частотой будут одинаковыми. Это позволит избежать неудобных ситуаций на рынке.

Три процессора Pentium 4 с частотой 3,4 ГГц станут, по всей видимости, последними моделями для разъема Socket 478. Это связано с тем, что будущие более высокочастотные Pentium 4, даже изготовленные по более тонкой технологии, будут потреблять существенно большее количество энергии, на которое не рассчитаны существующие нынче и, как правило, приспособленные для Prescott 3,4 ГГц материнские платы. Процессоры 3,6 ГГц и выше потребуют новых спецификаций питания, и чтобы избежать путаницы с системными платами, все они будут выпускаться с разъемом Socket T (известный также как LGA 775). Аббревиатура LGA расшифровывается как Land Grid Array - по аналогии с нынешними Pin Grid Array (PGA) для процессоров или Ball Grid Array (BGA) для чипсетов или микросхем памяти. Конструктив LGA много дешевле, чем PGA или BGA и используется, например, компанией IBM.

У нас в лаборатории побывал экземпляр Pentium 4 3,20E ГГц на ядре Prescott. Безусловно, новая микроархитектура требует весьма пристального подхода для практического изучения, поэтому за те три рабочих дня, что новый процессор был в нашем распоряжении, мы лишь частично смогли постичь его потенциал. В будущем мы планируем еще не раз вернуться к детальному практическому изучению свойств нового ядра от Intel (прежде всего - быстродействия в разнообразных задачах), но уже по первым опытам стало возможным составить первое впечатление от новинки, которое мы и предлагаем вам сейчас.

Подробное описание тестовой конфигурации, участников сравнения и подробный анализ полученных данных вы сможете найти в последующих частях этого обзора на сайте www.terralab.ru , а здесь я подведу лишь предварительные краткие выводы на основе проведенных тестов.

Прежде всего, можно отметить, что у Prescott немного возросла скорость работы с системной памятью по сравнению с Northwood. Причем улучшились не только скорость чтения и полоса пропускания памяти, но и латентность, а также сложные операции (Copy, Scale, Add, Triad). Вместе с тем, на относительно старых приложениях, неоптимизированных под NetBurst, мы наблюдаем существенный проигрыш Prescott своему предшественнику (Northwood) - временами до 15%! Более того, в отдельных задачах Prescott 3,2 ГГц работает даже медленнее, чем Northwood 3,06 ГГц на шине 533 МГц! Вот этого я, признаться, не ожидал. Приложений, в которых Prescott заметно быстрее одночастотного с ним «Нортвуда», как оказалось, пока не так уж много (по крайней мере, в процентном соотношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott немного проигрывает Northwood - этим, например, «грешат» многие современные и недавнего прошлого игры, аудиокодеки, простые математические расчеты. А вот видеокодирование и в некоторые профессиональные трехмерные пакеты моделирования чаще благориятствуют «Прескотту», и его преимущество над Northwood доходит, порой, до 10–15 процентов.

Таким образом, изменения в микроархитектуре NetBurst в процессорах с яром Prescott фактически потребовали новой волны оптимизации приложений. Без такой оптимизации новый процессор часто может работать даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по заметному наращиванию частоты, в то врем как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя на первых порах более выгодным, видимо, будет все же приобретение процессоров на прежнем ядре. Особенно если учесть, что «Прескотты» заметно более горячие в работе, чем аналогичные Northwood и даже Extreme Edition.

Итак, Intel опрескотилась!!!

А хорошо это или плохо - судить вам. Читайте в следующих частях этого обзора:
Часть 2. Простые вычисления, работа кэш-памяти и системной памяти и производительность при работе с видео и аудио.
Часть 3.

Через несколько дней после официального представления AMD своего последнего процессора Athlon64 FX-53, Intel решила объявить о выпуске на рынок 3,4-ГГц версии Prescott, которая позиционируется на конкуренцию с Athlon64, а не с Athlon64 FX-53, несмотря на одинаковый размер кэша.

Хотя стратегия Intel по гонке тактовых частот пока оказывалась вполне успешной, сегодня становится всё труднее находить аргументы в пользу процессора Prescott, который плохо наращивает свою производительность по сравнению с чипами AMD, использующими встроенный контроллер памяти.

Да, Intel нужна быстрая платформа со всеми выпестованными особенностями типа Socket 775, PCI Express и памятью DDR2, но на тактовую частоту процессора уповать уже не приходится. Это урок, который Intel уже пришлось выучить на серверном рынке, поскольку AMD получает всё более широкую поддержку своего семейства Opteron. И Pentium 4 Prescott не слишком хорошо соответствует репутации Intel, ведь его тепловой пакет TDP составляет более сотни ватт - при этом процессор не даёт сколько-нибудь ощутимых преимуществ по сравнению с предшественником Northwood.

Intel, конечно же, не почивает на лаврах - сегодня компания находится в процессе внедрения нового степпинга D0 ядра Prescott, который позволит процессору достичь тактовой частоты вплоть до 4 ГГц - как и упоминается в планах компании. Поскольку не все 3,4-ГГц версии Prescott имеют степпинг D0, мы решили привести таблицу, которая поможет отличить старые и новые процессоры Prescott.

По информации Intel, последний степпинг позволит увеличивать тактовую частоту из-за внесённых оптимизаций потребления энергии. Однако тепловой пакет нового процессора не изменился и остался на уровне 103 Вт максимум. Хотя процессор и кажется улучшенным по сравнению с 3,2-ГГц версией, его тепловыделение всё ещё несколько непропорционально по отношению к тактовой частоте. В любом случае, при покупке следует быть готовым к высокому тепловыделению процессора.

CPU-Z правильно определяет новый процессор Pentium 4: Model 3, Stepping 3 (CPUID 0F34h). Перед нами старый степпинг C0.

Новый процессор нагревается чуть сильнее.

Pentium 4: обзор моделей

Как вы, наверняка, знаете, Pentium 4 Prescott является ядром Pentium 4 третьего поколения. Первое, под кодовым названием Willamette, приобрела немалую популярность из-за увеличения производительности по сравнению с Pentium III Tualatin, в то же время потребляя намного больше энергии.

Второе поколение ядра под названием Northwood изготавливалось по 130-нм техпроцессу - на сегодня его по-прежнему можно называть лучшим ядром Pentium 4, поскольку процессор обеспечивает приличную производительность и неплохие возможности по "разгону". Мы уже смогли заставить несколько процессоров Northwood работать на частоте больше 4 ГГц - причём с обычными кулерами.

Сегодня на рынке присутствует большое число процессоров Pentium 4, базирующихся на ядрах Northwood или Prescott. Тактовые частоты сегодня начинаются на отметке 2,4 ГГц и заканчиваются на 3,4 ГГц, причём на этом отрезке потребитель может выбирать 20 разных моделей. Чтобы вы смогли лучше представлять себе ситуацию с процессорами Pentium 4, мы свели все модели вместе в краткую таблицу:

Процессор FSB Частота ядра Ядро HT
Pentium 4 400 МГц 2,0, 2,2, 2,4, 2,6 ГГц Northwood Нет
Pentium 4 B 533 МГц 2,4 ГГц Northwood Нет
Pentium 4 533 МГц 2,26, 2,53, 2,66, 2,8 ГГц Northwood Нет
Pentium 4 533 МГц 3,06 ГГц Northwood Да
Pentium 4 C 800 МГц 2,4, 2,6, 2,8 ГГц Northwood Да
Pentium 4 800 МГц 3,0, 3,2, 3,4 ГГц Northwood Да
Pentium 4 A 533 МГц 2,8 ГГц Prescott Нет
Pentium 4 E 800 МГц 2,8, 3,0, 3,2, 3,4 ГГц Prescott Да

Чем дальше располагается буква по алфавиту, тем лучше процессор вы получите. Однако это относится только к сравнению двух различных моделей с одинаковой тактовой частотой - типа Pentium 4 на 2,4 ГГц и FSB400 в сравнении с Pentium 4 B на 2,4 ГГц и FSB533. Pentium 4 C работает на FSB800 и поддерживает Hyper-Threading. Единственным исключением является Pentium 4 3,06 ГГц, который работает на FSB533 - и является первым процессором, поддерживающим Hyper-Threading. Буква E обозначает модели Prescott с 1-Мбайт кэшем L2, в то же время версии этого ядра с FSB533 обозначаются буквой A.

Intel вводит номера моделей

Существует много причин, по которым лучше использовать модельные номера, а не тактовые частоты. Во-первых, в номере можно учесть множество технологических деталей, типа FSB, размера кэша, частоты или дополнительных функций - Hyper-Threading и т.д. Во-вторых, исчезнет путаница между разными версиями процессоров с одинаковой тактовой частотой - в результате чего обычный покупатель легко выберет самый быстрый процессор. В-третьих, в индустрии существует множество примеров успешного использования модельных номеров - скажем та же AMD с семейством Opteron 14x, 24x и 84x. Первая цифра номера указывает поддержку числа процессоров: 1 - для одного процессора, 2 - для двухпроцессорных систем и т.д. Цифра x может быть 2, 4, 6 и 8 - что указывает на частоты 1,6, 1,8, 2,0 и 2,2 ГГц.

Наконец, мы должны подумать о процессорах Intel Pentium M, тем более что вскоре появится новая версия с техпроцессом 90-нм (Dothan). Поскольку этот чип будет существенно быстрее Banias из-за увеличенных тактовых частот, Intel будет очень трудно аргументировать покупку 3-ГГц настольного процессора Prescott, который в некоторых приложениях работает медленнее 2,0-ГГц Dothan.

По нашим источникам, тактовые частоты должны полностью исчезнуть из названий процессоров Intel. Поскольку число доступных моделей процессоров вряд ли уменьшится, такой шаг нам кажется вполне логичным. Будущая система именования процессоров будет выглядеть примерно так: процессор Pentium 4 будет дополняться номером 5xx, а линейка Celeron - номером Celeron 3xx.

Мобильные процессоры Настольные процессоры
Производительный сегмент рынка Pentium M 755 (2,0 ГГц)
Pentium M 745 (1,8 ГГц)
Pentium M 735 (1,7 ГГц)
Pentium M 725 (1,6 ГГц)
Pentium M 715 (1,5 ГГц)
Pentium 4 Extreme Edition
Массовый сегмент рынка Pentium 4 Mobile Pentium 4 560 (3,6 ГГц)
Pentium 4 550 (3,4 ГГц)
Pentium 4 540 (3,2 ГГц)
Pentium 4 530 (3,0 ГГц)
Pentium 4 520 (2,8 ГГц)
"Бюджетный" сегмент рынка Celeron M 340 (1,5 ГГц)
Celeron M 330 (1,4 ГГц)
Celeron M 320 (1,3 ГГц)
Celeron D 340 (2,93 ГГц)
Celeron D 330 (2,8 ГГц)
Celeron D 320 (2,66 ГГц)
Celeron D 310 (2,53 ГГц)



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: