Введение
На протяжении нескольких последних месяцев нам удалось наблюдать невиданное доселе явление: Intel последовательно копировала все наиболее удачные инициативы AMD, которые эта компания внедрила с выпуском своих эпохальных процессоров с архитектурой AMD64. Так, сначала Intel обозначила своё намерение снабдить x86 процессоры 64-битным расширением EM64T, поразительно похожим на AMD64 и совместимым с ним программно. Затем, компания объявила о своих планах по реализации в будущих процессорах Pentium 4 на ядре Prescott, выходящих осенью, поддержки бита NX, посредством которого реализуется дополнительная защита операционной системы от вирусов – технологии, имеющейся в процессорах Athlon 64 с момента их выхода. Третьей идеей, которую Intel явно позаимствовал из процессоров конкурента – стала технология Cool'n'Quiet, своё видение которой Intel собирается ввести в употребление в будущих моделях Pentium 4. Однако последовательное подражание технологиям из процессоров конкурента отнюдь не означает, что Intel решила отказаться от роли технологического лидера. Просто, инженеры компании не намерены отворачиваться от любых здравых мыслей, вне зависимости от того, от кого они исходят. Собственно, сегодняшний анонс является прямым подтверждением того, что Intel продолжает считать себя локомотивом отрасли.
Во-первых, сегодня Intel объявляет очередной процессор в семействе Pentium 4 на базе 90 нм ядра Prescott, теперь с частотой 3.6 ГГц. Появление этого процессора, очевидно, является ответом Intel на недавний анонс CPU от AMD, которые в начале июня достигли рейтинга 3800+, приобретя двухканальный контроллер памяти и получив частоту 2.4 ГГц. Насколько достойным является этот ответ, мы увидим ниже, а пока заострять внимание на новом процессоре, тем более что по своей архитектуре он не отличается от предшественников, мы не будем. Гораздо большее значение имеет второй анонс. Помимо нового процессора, Intel выпускает и новую платформу – семейство чипсетов, известное нам ранее под кодовыми именами Alderwood и Grantsdale. Посредством вывода на рынок этих чипсетов, Intel начинает продвигать несколько новых инновационных технологий, важнейшими из которых, безусловно, являются новая память DDR2 SDRAM и новая шина для подключения видеокарт и периферийного оборудования PCI Express. Помимо этого, в новых платформах присутствуют и другие значительные нововведения, например, новый процессорный разъём LGA775, технологии Intel Graphics Media Accelerator 900, Intel Matrix Storage, Intel High Definition Audio, Intel Wireless Connect и пр. В результате, можно даже говорить о том, что сегодня строение платформы Pentium 4 претерпевает самые значительные изменения за всё время существования этого процессора.
Немаловажным является понимание того, зачем нужны столь массовые изменения, казалось бы, в и без того успешной платформе. Вряд ли Intel будет заниматься инновациями ради самих инноваций. Очевидно что, выводя на рынок платформу с новой архитектурой, Intel преследует какие-то утилитарные цели, кроме простого повышения производительности. Тем более что подавляющее большинство внедряемых технологий отнюдь не означает увеличение быстродействия платформы. Смысл же многих новых технологий состоит в проведении в жизнь концепции "цифрового дома и офиса". Благодаря повышению пропускных способностей шин, улучшению мультимедиа-возможностей и расширенной функциональности в части поддержки сетевых соединений, новые платформы становятся более привлекательным решением для использования в основе домашних и офисных компьютеров, берущих на себя роль координации бытовых и офисных устройств или даже их частичной замены. Впрочем, объяснение маркетинговых преимуществ новых технологий от Intel оставим для сотрудников самой этой компании. Мы же в рамках этой статьи сосредоточимся на исследовании новых платформ с технологической точки зрения.
Новые чипсеты
Поскольку мы уже определили для себя, что первичным на сегодня является не повышение тактовой частоты Pentium 4, а появление новых наборов логики, с них и начнём. Основных технологических нововведений, появляющихся с выходом новых платформ Alderwood и Grantsdale не так уж и мало. В их числе:
Поддержка двухканальной памяти типа DDR2 SDRAM, обеспечивающей более высокую пропускную способность, нежели применявшаяся ранее DDR SDRAM;
Поддержка шины PCI Express x16 для подключения внешних графических ускорителей, гарантирующей опять же более высокую пропускную способность, чем используемая до этого шина AGP 8x;
Поддержка шины PCI Express x1 для подключения внешних устройств. Вновь эта шина позволяет обеспечить более высокую скорость передачи данных, чем при использовании обычной 32-битной 33-мегагерцовой шины PCI;
Новое интегрированное ядро Intel Graphics Media Accelerator 900 с увеличенной производительностью и улучшенной архитектурой. Тут дополнительные комментарии излишни: прошлое графическое ядро от Intel не радовало ни скоростью, ни своими возможностями, новое же ядро представляет собой огромный шаг вперёд;
Новый качественный звук Intel High Definition Audio, обеспечивающий гораздо более продвинутые возможности чем традиционный AC97, такие как воспроизведение многопотокового звука, поддержка большего числа каналов и гораздо лучшее качество;
Технология Intel Matrix Storage Technology – расширение функциональности в части поддержки Serial ATA жёстких дисков и значительное увеличение гибкости при работе с RAID массивами;
Intel Wireless Connect Technology – появление в новых чипсетах от Intel поддержки беспроводных сетевых соединений по протоколам 802.11b/g.
Все эти технологии реализованы в обоих семействах новых чипсетов Alderwood и Grantsdale. Различия между этими семействами лежат, по сути, в первую очередь в их позиционировании. В то время как набор логики Alderwood нацеливается на применение в высокопроизводительных компьютерах, где по замыслу Intel он будет применяться либо вместе с новым Pentium 4 с частотой 3.6 ГГц либо с процессорами Pentium 4 Extreme Edition, чипсеты же семейства Grantsdale рассчитаны на массовый рынок. В соответствии с этими отличиями в позиционировании, Alderwood и Grantsdale получили и официальные наименования. Высокопроизводительный Alderwood назван Intel 925X Express, в то время как массовое семейство чипсетов Grantsdale получило название Intel 915 Express. Фактически, отличия в названии чипсетов явно говорят о том, что разница между i925X Express и i915 Express не более существенна, чем между предшественниками i875P и i865PE.
Если несколько углубиться в детали, то следует сказать о том, что i925X Express имеет слегка более производительный контроллер памяти, нежели i915 Express. Однако реализация этого преимущества несколько отличается от режима PAT, который был использован в i875P, благодаря чему Intel утверждает, что в случае с i915 Express производители материнских плат не смогут всяческими трюками поднять его скорость до скорости i925X Express. То есть, ожидать, что производители материнских плат изыщут недокументированные пути повышения скорости плат на базе массового i915 Express, как произошло в случае с i865PE, не приходится. Механизм реализации преимущества контроллера памяти, встроенного в i925X Express кроется в минимизации латентностей при обращении к памяти, которая достигается за счёт оптимизирующей перегруппировки данных, записываемых в память, а также благодаря внедрению команд обслуживания в поток данных. Благодаря перегруппировке данных по каналам и банкам памяти обеспечивается уменьшение времени доступа при извлечении данных из памяти. Внедрение обслуживающих команд позволят более гибко управлять памятью в процессе передачи данных, в то время как большинство чипсетов (и i915 Express в том числе) сначала пересылают только команды управления данными, откладывая передачу обслуживающих команд на последнюю очередь.
Линейка новых чипсетов на сегодняшний день представлена четырьмя наборами логики:
Intel 925X Express – пока единственная модель для высокопроизводительных систем;
Intel 915P Express – базовая модель массового чипсета;
Intel 915G Express – набор логики с встроенным графическим ядром Intel Graphics Media Accelerator 900;
Intel 915GV Express - набор логики с встроенным графическим ядром Intel Graphics Media Accelerator 900, не поддерживающий графический порт PCI Express x16.
Дабы не загромождать изложение лишними словами, приведём таблицу с основными характеристиками новых наборов логики:
В первую очередь следует заметить, что к чипсету Intel 925X Express в скором времени будет добавлен и ещё один набор логики для высокопроизводительных систем – Intel 925XE Express. Отличия этого чипсета будут заключаться в поддержке процессорной шины с частотой 1066 МГц: соответствующие процессоры для этой шины должны быть объявлены в третьем квартале текущего года.
Также, пару слов следует сказать и о различных вариантах южных мостов, которые могут использоваться в составе новых наборов логики. Помимо
ICH6 со стандартными возможностями, перечисленными в таблице, Intel планирует поставлять
ICH6R – южный мост с поддержкой технологии Intel Matrix Storage Technology (то есть Serial ATA RAID),
ICH6W с поддержкой технологии Intel Wireless Connect Technology (WiFi) и
ICH6RW, в котором присутствует и WiFi, и Serial ATA RAID.
Новые наборы логики i925 и i915 со старыми южными мостами от Intel не совместимы. Дело в том, что Intel наконец отказался от использования для соединения северного и южного моста шины Hub Link с мизерной по сегодняшним меркам пропускной способностью 266 Мбайт в секунду. Вместо этой шины в чипсетах семейства i925/i915 применяется новая шина (Direct Media Interface) DMI, пропускная способность которой выросла до 2 Гбайт в секунду (1 Гбайт в секунду в каждом направлении). Эта шина, близкая по своему строению к PCI Express, призвана покрыть нужды в полосе пропускания для всех устройств, подключенных к южному мосту, что видно из представленных выше диаграмм.
С ростом пропускной способности шины, соединяющей северный и южный мост в новых наборах логики, Intel смог отказаться от непосредственного подключения к северному мосту гигабитного сетевого контроллера. Поэтому, выделенная в i875/i865 для сетевых нужд шина CSA (Communication Streaming Architecture) в новых чипсетах i925/i915 отсутствует. Теперь гигабитные сетевые контроллеры рекомендуется подключать к южному мосту посредством шины PCI Express x1.
Отметим, что с активным переводом новых чипсетов на использование шины PCI Express, Intel отрезал дорогу назад в части использования старых графических карт с интерфейсом AGP. Эта шина в новых наборах логики не поддерживается вовсе. Впрочем, ряд производителей материнских плат изыскали возможность реализации AGP на своих продуктах, использующих i915, однако это решение основывается на задействовании шины PCI, что значительно ограничивает пропускную способность такого AGP, отрицательно сказываясь на производительности видеоподсистемы. В то же время, i915 не утратил совместимости с DDR SDRAM, поддерживая этот тип памяти одновременно с новой DDR2 SDRAM. Однако, это не касается высокопроизводительного набора микросхем i925X Express, в котором поддержка DDR SDRAM отсутствует.
Следует также заметить, что в новых чипсетах Intel не декларирует поддержку 400-мегагерцовой Quad Pumped Bus. Это означает, что применять старые процессоры семейства Celeron с ядром Northwood-128 в платах на базе i925/i915 будет невозможно. Intel 925X Express, кстати, ориентируясь на самые быстродействующие процессоры, лишён официальной поддержки и 533-мегагерцовой шины. Ещё один любопытный момент, связанный с поддержкой бюджетных процессоров Celeron D (на базе ядра Prescott-256) заключается в том, что новые платы, основанные на чипсетах группы i915, позволят использовать этот CPU только лишь с DDR SDRAM, так как DDR2 SDRAM поддерживается исключительно при использовании 800 МГц Quad Pumped Bus.
Помимо поддержки DDR2 SDRAM, шины PCI Express x16 для графических карт и шин PCI Express x1, посредством которых выполняется подключение внешних устройств, необходимо отметить и сильно видоизмененный в новых наборах логики контроллер IDE. В отличие от чипсетов-предшественников, южные мосты семейства ICH6 поддерживают четыре, а не два канала Serial ATA-150. Одновременно с этим число каналов Parallel ATA-100 уменьшилось до одного.
Хотя в цель сегодняшнего обзора не входит рассмотрение интегрированного графического ядра нового поколения Intel Graphics Media Accelerator 900, присутствующего в i915G и i915GV, обойти его вниманием было бы несправедливо. Дело в том, что это графическое ядро кардинально отличается от графических ядер, которые Intel использовал в своих интегрированных чипсетах предыдущих поколений. Intel Graphics Media Accelerator 900 является совместимым с DirectX9 и обеспечивает аппаратное ускорение пиксельных шейдеров версии 2.0 и программное ускорение вертексных шейдеров. Кроме того, работая на частоте 333 МГц, Intel Graphics Media Accelerator 900 приобрёл целых четыре пиксельных конвейера, а также получил возможность выделять для нужд графического ядра до 224 Мбайт из оперативной памяти. Столь существенное изменение характеристик даёт возможность надеяться, что на сегодняшний день новые интегрированные наборы логики от Intel будут смотреться весьма достойно даже на фоне ATI RADEON 9100 PRO IGP. В частности, производительность Intel Graphics Media Accelerator 900 можно охарактеризовать тем фактом, что в популярном тесте 3DMark 2001 SE при использовании процессора Pentium 4 3.0E результат этого ядра достигает более 5600 очков, а по данным 3DMark03 Intel Graphics Media Accelerator 900 обгоняет дискретные графические карты младшего ценового диапазона: NVIDIA GeForce FX 5200 и ATI RADEON 9200.
Поговорив о новых чипсетах "в целом", пора переходить к частностям. Ниже мы рассмотрим основные нововведения в i925/i915 более подробно.
Контроллер памяти с поддержкой DDR2 SDRAM
Одним из ключевых нововведений, появившихся в наборах логики i925/i915 стала поддержка нового типа памяти DDR2 SDRAM. Благодаря этому Intel добивается роста пропускной способности подсистемы памяти. Например, пропускная способность двухканальной подсистемы памяти, в которой используется DDR2-533 SDRAM, составляет 8.5 Гбайт в секунду, что на 33% больше, чем может обеспечить применяемая в чипсетах предыдущего поколения DDR400 SDRAM. Правда то, что предыдущие платформы, построенные на базе i875/i865, испытывали недостаток в пропускной способности памяти, сказать нельзя. На сегодняшний день пропускная способность двухканальной DDR2-533 превосходит пропускную способность шины, соединяющей северный мост чипсета с процессором, что говорит как минимум о том, что CPU не сможет задействовать всю пропускную способность новой подсистемы памяти в полной мере. Однако, в случае применения интегрированного графического ядра, также активно работающего с памятью, использование DDR2-533 может оказаться очень уместным. Кроме того, следует принять во внимание, что поддержка в i925/i915 памяти типа DDR2 является "заделом на будущее". Уже в третьем квартале компания Intel порадует нас появлением новых CPU с шиной, работающей на частоте 1066 МГц, и тогда такие процессоры смогут задействовать пропускную способность двухканальной DDR2-533 в полной мере.
Для понимания основных плюсов и минусов использования DDR2 SDRAM по сравнению с традиционной DDR SDRAM, необходимо кратко познакомиться с её архитектурой. Прежде всего, заметим, что по сути DDR2 память не имеет кардинальных отличий от DDR SDRAM. Однако в то время как DDR SDRAM осуществляет две передачи данных по шине за такт, DDR2 SDRAM выполняет четыре таких передачи. При этом, построена DDR2 памяти из таких же ячеек памяти, что и DDR SDRAM, а для удвоения пропускной способности используется техника мультиплексирования.
Само по себе ядро чипов памяти продолжает работать на той же самой частоте, на которой оно работало в DDR и SDR SDRAM. Увеличивается только лишь частота работы буферов ввода вывода, а также расширяется шина, связывающая ядро памяти с буферами. На буфера ввода-вывода возлагается задача мультиплексирования. Данные, поступающие из ячеек памяти по широкой шине, уходят из них по шине обычной ширины, но с частотой вдвое превышающей частоту шины DDR SDRAM. Таким нехитрым способом достигается возможность очередного увеличения пропускной способности памяти без увеличения частоты работы самих ячеек памяти. То есть, фактически, ячейки памяти самой современной на сегодня DDR2-533 работают с той же частотой, что ячейки памяти DDR266 SDRAM или PC133 SDRAM.
Однако столь простой метод увеличения пропускной способности памяти имеет и свои отрицательные стороны. В первую очередь – это рост латентности. Очевидно, что латентность не определяется ни частотой работы буферов ввода-вывода, ни шириной шины, по которой данные поступают из ячеек памяти. Первоочередной фактор, определяющий латентность – это латентность самих ячеек памяти. Таким образом, латентность DDR2-533 сравнима с латентностью DDR266 или PC133 SDRAM и, очевидно, уступает латентности наиболее современной DDR SDRAM, работающей с частотой 400 МГц. За примерами далеко ходить не надо, в таблице ниже мы приводим типичные латентности моделей памяти распространённых стандартов и их пропускные способности:
Как видим, если с точки зрения пропускной способности внедрение DDR2 SDRAM действительно способно дать существенное преимущество по сравнению с обычной DDR SDRAM, то столь же низкой латентностью эта память похвастать явно не в состоянии. Фактически, в обозримом будущем модулей памяти DDR2 с латентностью, сравнимой с латентностью DDR400 SDRAM попросту не предвидится. Современная же и наиболее производительная DDR2-533 память с задержками 4-4-4-12 демострирует в полтора раза худшую латентность, нежели DDR SDRAM, работающая с таймингами 2-3-2-6.
Есть ли тогда вообще смысл в переходе на DDR2 SDRAM? На этот вопрос мы должны ответить утвердительно. Однако этот смысл имеется только лишь для платформы Pentium 4, поскольку производительность данной платформы действительно сильно зависит от пропускной способности памяти. Для Athlon 64 же, например, низкие латентности важны сильнее, чем высокая пропускная способность, поэтому архитектура от AMD не будет выигрывать при переходе на DDR2 память, доступную на данный момент. Именно поэтому, кстати, AMD в обозримом будущем не планирует модифицировать контроллер памяти своих процессоров для поддержки DDR2 SDRAM.
Собственно, отдалённо история с переходом на использование DDR2 SDRAM напоминает попытку Intel перевести свои платформы на применение RDRAM. Однако в данном случае Intel позаботился как об обратной совместимости своих платформ с DDR400 SDRAM, так и о поддержке нового стандарта со стороны индустрии. DDR2 – это открытый стандарт, а затраты на производство DDR2 модулей сравнимы с расходами на производство DDR SDRAM в силу использования аналогичных ячеек памяти. Таким образом, DDR2 SDRAM планомерно займёт своё место в наиболее производительных Pentium 4 платформах, и фиаско Intel со своей очередной инициативой явно не грозит.
Помимо увеличения частоты работы буферов ввода-вывода и использования вдвое большего коэффициента мультиплексирования, есть у DDR2 памяти и другие отличия, которые, впрочем, не имеют такого же ключевого значения. Поэтому, просто приведём их в виде таблицы:
Фактически, среди перечисленных нововведений выделить особо стоит лишь механизм Additive Latency и встроенную в чипы терминацию шины. Благодаря механизму Additive Latency несколько увеличивается эффективность передачи данных: данный алгоритм решает изредка встречающуюся с DDR SDRAM проблему с невозможностью одновременной подачи команд на чтение инициализированного банка памяти и инициализацию следующего банка. Впрочем, на реальной производительности данное нововведение сказывается совсем незначительно.
Что же касается on-die termination, то теперь терминирующие шину резисторы, предназначенные для гашения отраженных от конца шины сигналов, располагаются не на материнской плате, а непосредственно в чипах. С одной стороны это позволяет улучшить саму терминацию, а с другой, несколько удешевить материнские платы благодаря отсутствию необходимости установки большого числа резисторов в окрестности слотов DIMM.
Модули DDR2 DIMM по внешнему виду весьма похожи на модули DDR памяти.
Однако, естественно, о совместимости со старыми разъёмами говорить не приходится. DDR DIMM отличаются от DDR2 DIMM как минимум числом контактов. В то время как модули DDR SDRAM снабжены 184 контактами, число контактов у DDR2 DIMM увеличилось до 240. В то же время необходимо отметить, что физические размеры модулей памяти DDR2 (высота и ширина) полностью соответствуют размерам модулей DDR.
Сверху – модуль DDR SDRAM, снизу – модуль DDR2 SDRAM Чипы DDR2 SDRAM имеют FBGA упаковку – это явно оговаривается на уровне спецификации. Использование корпусировки такого типа позволяет более эффективно организовать теплоотвод, а также минимизировать взаимное электромагнитное влияние чипов друг на друга. Помимо сменившегося типа упаковки чипов (напомним, что большинство чипов DDR SDRAM упаковывалось в TSOP), чипы DDR2 SDRAM имеют меньшее напряжение питания, и, как следствие, примерно на 30% меньшее тепловыделение. В частности, поэтому вполне реальным является создание чипов DDR2 большей ёмкости, чем в случае с DDR SDRAM.
В заключение рассказа о новой DDR2 SDRAM, которая теперь будет поддерживаться современными платформами для процессоров Pentium 4, основанными на чипсетах семейств i925 и i915, несколько слов необходимо сказать и об особенностях двухканального контроллера памяти, применённого в этих наборах логики. Как мы помним, контроллер памяти, встроенный в наборы логики прошлого поколения, i875 и i865, имел достаточно много тонкостей конфигурирования, выражающихся в том, что получение максимальной производительности на платах, основанных на этих чипсетах, дело достаточно хитрое. С выходом же i925 и i915 ситуация сильно упростилась благодаря использованию технологии Flex Memory Technology. Фактически, контроллер памяти новых наборов микросхем, как в случае использования DDR2 SDRAM, так и в случае применения DDR SDRAM, может работать в трёх режимах:
Dual Channel Symmetric (двухканальный симметричный режим). Данный режим включается, когда оба канала контроллера укомплектованы одинаковым количеством (в смысле ёмкости) памяти. Этот режим даёт возможность достичь максимальную производительность, позволяя использовать все преимущества 128-битного двухканального доступа к данным. Важно заметить, что в данном случае никаких ограничений на организацию и количество модулей, присутствующих в каждом канале не накладывается. Именно это и является ключевым моментом Flex Memory Technology, значительно упрощающей конфигурирование подсистемы памяти для оптимизации быстродействия.
Single Channel (одноканальный режим). Этот режим используется в случае, если в слотах памяти, относящихся к одному из каналов, модули памяти не установлены.
Dual Channel Asymmetric (двухканальный ассиметричный режим). Контроллер памяти работает в этом режиме в случае, когда объёмы памяти, подключенной к разным каналам, различаются. Несмотря на то, что в этом режиме система будет стараться по максимуму задействовать преимущества двухканального режима, производительность здесь приближается к производительности одноканального режима.
Графическая шина PCI Express x16
Вряд ли кто-то всерьёз думает, что пропускной способности, обеспечиваемой шиной AGP 8x сегодняшним видеокартам недостаточно. Как показывает опыт, современные графические ускорители хранят все необходимые для своей работы данные в локальной видеопамяти, поэтому скорость шины, по которой ускоритель общается с чипсетом, не так уж и важна. Однако, тем не менее, в своих платформах нового поколения Intel отказался от шины AGP 8x в пользу новой и перспективной PCI Express x16.
Дело в том, что переход к этой шине – это скорее отражение общих тенденций, наблюдаемых в отрасли, нежели шаг, вызванный какими-то практическими проблемами. На протяжении нескольких последних лет мы являемся свидетелями замены в современном PC параллельных шин последовательными. Это позволяет вместе с упрощением организации соединений добиваться роста скорости передачи данных. Переход от AGP 8x к PCI Express x16 как раз и является переходом от параллельной шины к последовательной. Однако данный переход несёт с собой также и массу побочных положительных эффектов, таких как увеличение пропускной способности, организация выделенных каналов для чтения и записи и пр.
Не вдаваясь в подробности, заметим, что шина PCI Express x16 имеет скорость, характеризуемую величиной 2.5 гигатрансферов данных в секунду в каждом направлении. В зависимости от ширины шины (то есть в данном случае в зависимости от числа каналов передачи данных, которых в PCI Express x16 шестнадцать) по шине за каждый трансфер можно передавать от 1 до 32 бит информации в каждую сторону. Если учесть, что при передаче данных по PCI Express используется избыточное кодирование 8/10 (восемь бит исходных данных кодируется 10 битами), а также то, что данные и команды передаются по PCI Express по одним и тем же сигнальным линиям, пропускная способность PCI Express x16 достигает 4 Гбайт в секунду в каждую сторону, то есть 8 Гбайт в секунду суммарно. Таким образом, с внедрением шины PCI Express x16, пропускная способность соединения графики и чипсета возрастает в четыре раза по сравнению с AGP 8x.
Кроме этого, переход к использованию PCI Express x16 привносит и ряд других преимуществ. В первую очередь необходимо отметить существование независимых каналов для передачи потоков данных в том и другом направлении. PCI Express x16 гарантирует пропускную способность 4 Гбайта в секунду при передаче данных как в любом направлении, так и одновременно в обоих. Шина же AGP 8x выделенных каналов не имела, поэтому передачи информации совершались одиночно, либо в одну, либо в другую сторону.
Слот PCI Express x16, который теперь будет встречаться на материнских платах, основанных на чипсетах i925 и i915, по своему физическому размеру похож на AGP 8x.
Установка AGP 8x карт в него невозможна как механически, так и логически в силу использования совершенно различных протоколов передачи данных. Именно поэтому, для использования с материнскими платами на базе i925X Express и i915 Express необходимы новые графические карты с интерфейсом PCI Express x16.
Основные производители графических чипов, ATI и NVIDIA подготовились к переходу на новую шину. В ближайшее время на рынке появятся продукты, основанные на решениях от обеих компаний, предназначенные для новой графической шины. Впрочем, реализация поддержки шины PCI Express x16 в будущих графических картах будет носить "переходный" характер. То есть, говорить о том, что ATI и NVIDIA полностью перепроектировали свои решения для новой графической шины, пока не приходится.
Хотя, подход ATI и NVIDIA в этом отношении всё же оказался кардинально разным. Суть решения от NVIDIA сводится к тому, что, фактически, к существующим графическим чипам, имеющим интерфейс AGP 8x, добавляется некий дополнительный мост, обеспечивающий конвертацию пакетов данных, передающихся по PCI Express x16, в пакеты данных формата AGP 8x. Для этой цели используется внешний чип HSI (High Speed Interconnect), который добавляется к любому из уже предлагаемых компанией решений.
ATI же подошла к проблеме с другой стороны и заменила в имеющихся чипах интерфейсную часть, поставив вместо интерфейса AGP 8x интерфейс PCI Express x16.
К этому надо добавить, что полноценная поддержка шины PCI Express x16 требует переработки драйверов для видео и самой платформы. Однако этот процесс на настоящее время пока не завершён. Скорее всего, полноценная поддержка PCI Express x16 на программном уровне появится только с выходом Longhorn. Всё это приводит к тому, что современные графические карты с интерфейсом PCI Express x16 пока ещё не могут использовать всех преимуществ графической шины PCI Express x16, и реальные дивиденды от её появления мы получим значительно позже.
Однако кое-какие подвижки в сторону роста практической пропускной способности шины, соединяющей видеокарту и чипсет, можно заметить уже сейчас. Даже PCI Express x16 графические карты от NVIDIA, использующие мосты HSI и обладающие шиной AGP «внутри», всё же могут использовать возросшую пропускную способность шины, связывающей чипсет с видеоядром. Для этого для соединения графического чипа и моста HSI в платах на базе решений от NVIDIA используется интерфейс AGP, разогнанный до AGP 16x. Пропускная способность такой шины составляет порядка 4 Гбайт в секунду, что как раз соответствует пропускной способности PCI Express x16 в одном направлении. То есть, теоретически, потери в скорости прокачки данных по PCI Express x16 при использовании моста от NVIDIA могут возникать только лишь в случае использования дуплексного режима, то есть, при одновременной передаче данных в обоих направлениях. Что же касается необходимости конвертации пакетов данных из формата PCI Express в формат AGP, то такие преобразования, как утверждают представители NVIDIA, ухудшают латентность не более чем на 3-5%.
Впрочем, все эти теоретические выкладки проверить очень нетрудно. В своём распоряжении мы имеем специальную утилиту, позволяющую измерять скорость записи данных из основной памяти системы в видеопамять. Благодаря этой небольшой программе от Andrew Filimonov, являющимся также автором нашего фирменного теста Xbitmark, мы можем оценить эффективность реализации PCI Express x16 в графических картах от ATI и NVIDIA. Для данного испытания мы измерили скорость передачи данных в платформе на базе чипсета i875, укомплектованной AGP 8x графической картой NVIDIA GeForce FX 5900XT, а также скорость передачи данных по шине PCI Express x16 в платформе на базе чипсета i925X Express с установленными графическими картами с интерфейсом PCI Express x16 от ATI и NVIDIA. В данном случае использовались видеокарты NVIDIA GeForce PCX 5900 и ATI RADEON X600. Результаты измерений приводятся на графике ниже.
Как мы видим, гигантский рост теоретической пропускной способности шины, связывающей графическое ядро и чипсет, отнюдь не приводит к столь же значительному росту скорости передачи данных на практике. Впрочем, ничего другого мы и не ожидали. Сырость программной поддержки шины PCI Express x16 приводит к тому, что максимальный прирост пропускной способности при переходе на использование более новой шины не превышает 40% при передаче данных к видеокарте. Что же касается передачи данных в обратную сторону, то тут мы видим более значительный рост практической пропускной способности. Заметим также, что решение от ATI, не использующей дополнительный чип-мост, смотрится более выигрышно. По скорости передачи данных по шине RADEON X600 существенно опережает GeForce PCX 5900.
При этом хочется обратить внимание вот на что. Несмотря на полноценный дуплексный режим, предусматриваемый архитектурой шины PCI Express x16, что скорость передачи данных по этой шине в строну от видеокарты значительно ниже скорости передачи данных в видеопамять, как у решения от ATI с нативной поддержкой новой шины, так и у решения от NVIDIA с применённым мостом-конвертором. Но данная особенность является как раз отличительной чертой шины AGP, и она не должна проявляться в полноценных PCI Express x16 решениях. Поэтому, столь странный факт может наводить на разные мысли, в том числе и о «честности» нативной реализации PCI Express x16 в чипах от ATI. Однако наиболее вероятным нам представляется объяснение, перекладывающее вину за столь подозрительный результат либо на реализацию PCI Express x16 в чипсете от Intel, либо на какие-то проблемы с драйверами.
Впрочем, ожидать, что перевод графических ускорителей на более быструю шину даст какие-либо результаты в плане возрастания игровой производительности, даже при условии нормальной реализации шины PCI Express x16, пока не приходится. За долгое время существования достаточно медленной по сравнению с локальной памятью шины AGP разработчики игровых программ пришли к негласному выводу о том, что передачи данных по шине AGP надо избегать. Именно поэтому все необходимые для построения кадра данные ускорители по возможности хранят в локальной памяти видеокарты. В результате, эффект от увеличения пропускной способности шины, связывающей видеоускоритель и чипсет сегодня будет минимален. Другое дело, что появление новой графической шины с высокой пропускной способностью и низкой латентностью может разрушить сложившиеся стереотипы и, в недалёком будущем разработчики программ уже не будут бояться прибегать к передаче данных по шине PCI Express x16. Тогда-то, возможно, мы и получим шанс оценить все плюсы PCI Express x16.
Ещё одним косвенным достоинством перехода на использование шины PCI Express x16 является более сильная схема питания, реализованная на этой шине. На нее подаются даже питающие линии с напряжением 12 В, а максимальная нагрузка, которую можно сажать на эти линии, составляет 75 Вт. Благодаря этому факту, многие видеокарты, постоянным атрибутом которых стал дополнительный разъём питания, легко могут его лишиться. Например, дополнительного питания не требовали протестированные нами NVIDIA GeForce PCX 5900 и ATI RADEON X600.
Вводя своими чипсетами i925 и i915 в употребление новую шину PCI Express x16, Intel отказался от обратной совместимости. Новые чипсеты не имеют поддержки AGP 8x, поэтому большинство материнских плат, основанных на этих новых наборах логики, слота AGP 8x иметь не будут и потребуют использования новых видеокарт. Однако некоторые производители плат всё же собираются представить свои модели продуктов на основе i925/i915, на которых одновременно с PCI Express x16 можно будет встретить и старые слоты AGP. В этом случае необходимо иметь в виду, что поддержка AGP слота реализуется на таких платах через шину PCI, что существенно ограничивает её скоростные возможности и отрицательно сказывается на производительности графического решения.
Шина PCI Express x1
Помимо ввода новой графической шины PCI Express x16, Intel предлагает переходить и на новую шину для установки обычных карт расширения, PCI Express x1. Однако, в отличие от PCI Express x16, которая введена в чипсеты i925/i915 на безальтернативной основе, появление в новых чипсетах от Intel поддержки PCI Express x1 не означает предание обычной шины PCI забвению. Южные мосты семейства ICH6, которыми комплектуются наборы логики i925/i915, сохраняют поддержку шести PCI Master устройств. К ним просто добавляется поддержка четырех устройств PCI Express x1. В результате, материнские платы, построенные на новых наборах микросхем от Intel, могут содержать различное число слотов PCI и PCI Express x1 одновременно.
Сами по себе слоты PCI Express устанавливаются на плате вместо слотов PCI, однако отличимы они очень легко. 36-контактный разъём последовательной шины PCI Express x1 гораздо меньше стандартного слота PCI.
Какие плюсы может дать переход на использование PCI Express x1? В первую очередь, возросшую пропускную способность. В отличие от обычной 32-битной 33-мегагерцовой шины PCI, пропускная способность шины PCI Express x1 гораздо выше и составляет 500 Мбайт в секунду. Кроме того, PCI Express x1, будучи последовательной шиной имеет топологию точка-точка. В результате, каждое PCI Express x1 устройство получает выделенную пропускную способность 500 Мбайт в секунду, в то время как все устройства, подключенные к параллельной шине PCI, разделяют пропускную способность 133 Мбайт в секунду между собой. Помимо этого, ряд преимуществ PCI Express x1 обусловлен её архитектурой. Например, возможность конвейерного чтения или уменьшенные латентности.
Очевидно, что те устройства, которые сегодня чувствуют себя "тесновато", будучи подключенными к PCI, в ближайшее время должны перейти на новую шину. В числе таких устройств следует отметить гигабитные сетевые контроллеры, высокопроизводительные RAID контроллеры и пр. Однако, в отличие от производителей графических карт, производители периферийного оборудования не проявили аналогичной активности, поэтому единственное PCI Express x1 устройство, доступное сегодня, это гигабитный сетевой контроллер Marvell Yukon 88E8050.
Следует заметить, что производители материнских плат очень тепло встретили этот контроллер и его сегодня можно найти интегрированным на огромное количество материнских плат, построенных на базе наборов логики i925X Express и i915 Express.
Поскольку в нашей лаборатории нашлась материнская плата на базе i925X Express, на которой данный контроллер присутствовал, мы решили проверить, какую же производительность он способен обеспечить. Давайте посмотрим, даёт ли подключение этого контроллера к производительной шине PCI Express x1 какой-либо эффект, и как производительность этого контроллера соотносится с производительностью применявшегося в системах на базе i875/i865 контроллера Intel 82547EI, подключаемого по специальной выделенной шине CSA с пропускной способностью 266 Мбайт в секунду. Тесты проводились в системах с установле6нным процессором Intel Pentium 4 3.4E. Для целей тестирования использовалась утилита PassMark Advanced Network Test.
Как видим, использование шины PCI Express x1 даёт определенные выгоды при подключении гигабитного сетевого контроллера. По крайней мере, Marvell Yukon 88E8050 с шиной PCI Express x1 работает быстрее аналогичного чипа с интерфейсом PCI. Однако, контроллер для выделенной шины CSA, предлагаемой Intel для нужд гигабитной сети в чипсетах i875/i865 работает ощутимо быстрее. Тем не менее, в i925/i915 Intel отказался от реализации шины CSA, поскольку она не нашла поддержки у производителей сетевых контроллеров.
Intel High Definition Audio
В своих новых чипсетах i925/i915 на смену звуковому стандарту AC97 Intel предложил новую концепцию High Definition Audio, известную ранее под кодовым именем Azalia. Основная цель введения Intel High Definition Audio состоит в предложении пользователям равноценной замены дорогим дискретным звуковым картам. Для этого новый стандарт определяет более качественный 192 кГц 24-битный 8-канальный звук, обладающий к тому же массой дополнительных интересных возможностей.
Помимо возросшего качества звука и поддержке 8 каналов, Intel High Definition Audio предлагает поддержку всех новых аудиоформатов, включая Dolby Digital 5.1/6.1/7.1, DTS ES/Discrete 6.1, DVD-Audio и SACD и пр. Кроме этого обеспечивается лучшее качество записи голоса для пакетной передачи. Однако, наиболее интересным нововведением, нашедшим своё место в Intel High Definition Audio, стала реальная многопоточность. На практике это означает возможность одновременного направления различных аудиопотоков на различные устройства. Например, Intel High Definition Audio позволяет часть из восьми каналов задействовать для проигрывания звука одним приложением, в то время как оставшиеся каналы будут отведены для работы другого приложения. Со звуковой системой, построенной на базе Intel High Definition Audio, без всяких проблем вы сможете смотреть цифровое видео, в то время как другой пользователь, подключив свои наушники к незадействованным вами разъёмам сможет, например, прослушивать музыку. Подобных примеров можно привести массу. Кроме того, верно и обратное, используя одно и то же устройство вывода звука, вы можете одновременно играть в игру и использовать голосовой чат для переговоров с соперником.
Очевидным образом в Intel High Definition Audio поддерживается и технология Jack Sensing/Retasking – автоматическая перенастройка функциональности аудиоразъема в зависимости от типа подключенного к нему устройства. Например, когда микрофон подключен через разъем громкоговорителя, система автоматически переводит микрофонный канал на этот разъём и т.п.
несомненно, что благодаря своим возможностям и высокому качеству, аудиоподсистема Intel High Definition Audio может стать важной составляющей концепции цифрового дома. Впрочем, производители кодеков, применяемых совместно с новой аудиоподсистемой от Intel, могут существенно урезать возможности Intel High Definition Audio, заложенные в ICH6. Поэтому, на реальных материнских платах с целью уменьшения стоимости конечного продукта могут устанавливаться и дешёвые кодеки, не поддерживающие те или иные функции, заложенные в High Definition Audio.
Новые возможности Serial ATA контроллера
Претерпел изменения и Serial ATA контроллер, встроенный в семейство новых южных мостов ICH6. Наиболее значительным и заметным шагом в этом направлении, который произошёл при переходе от ICH5 к ICH6, стало увеличение числа Serial ATA-150 портов. Если прошлое поколение наборов логики от Intel поддерживало два Serial ATA порта, то теперь в i925/i915 число Serial ATA портов выросло до четырёх. В то же время, необходимо заметить, что увеличение в ICH6 числа Serial ATA портов одновременно повлекло за собой и сокращение Parallel ATA портов до одного. То есть, бурно развивающийся стандарт Serial ATA начал потихоньку теснить Parallel ATA, что, в общем-то, совсем не удивительно, учитывая всё большее число носителей информации с последовательным интерфейсом Serial ATA, появляющееся на рынке.
Увеличение числа поддерживаемых каналов Serial ATA не могло ни сказаться на функциональности южного моста ICH6R, поддерживающего RAID массивы. Как и ICH5R, он поддерживает массивы уровня 0 и 1, причём имеющиеся в наличие четыре канала Serial ATA позволяют создавать средствами ICH6R два массива одновременно. Вопреки ожиданиям, ICH6R не поддерживает массивы уровня 0+1. Объясняется это тем, что, по мнению инженеров Intel, четыре жёстких диска используются в составе одного PC крайне редко. Зато Intel предложил свою очень интересную альтернативу RAID 0+1, так называемый Matrix RAID.
Технология Matrix RAID позволяет организовывать тома RAID 0 и RAID 1 одновременно всего на двух жестких дисках. Суть данной технологии состоит в том, что каждый из двух дисков массива делится на две части. Первые части обоих дисков идут под создание массива уровня 0, то есть отводятся под хранение данных, скоростной доступ к которым наиболее важен. Вторые части обоих дисков зеркалируются, то есть отводятся под массив уровня 1, на котором хранятся наиболее ценные данные, сохранность которых должна быть обеспечена специальными мерами. С точки зрения Intel, хранение данных на массиве Matrix RAID должно быть организовано так: в первой части дисков, отведённых под RAID 0 должны храниться: операционная система, приложения и файл подкачки; вторая же часть дисков с массивом RAID 1 должна отводиться для хранения файлов пользователя. Таким образом, технология Matrix RAID позволяет обеспечивать как быстрый доступ, так и повышенную надёжность данных, при использовании всего двух дисков. То есть, Matrix RAID может являться неплохой альтернативой RAID 0+1, особенно благодаря тому, что для её использования не требуется приобретение четырех винчестеров.
Также, необходимо отметить, что Serial ATA контроллер в ICH6 стал полноценным AHCI устройством (Advanced Host Controller Interface). Это, в частности, стало предпосылками для появления поддержки "горячей замены" Serial ATA жестких дисков, а также для реализации технологии Native Command Queuing (NCQ), пришедшей в ATA диски из более дорогих SCSI аналогов. Технология NCQ позволяет жёсткому диску переупорядочивать принимаемые запросы данных с целью уменьшения латентностей и увеличения производительности.
Только само устройство может оптимально перегруппировать последовательность команд, поскольку только ему известна организация диска и положение считывающих/записывающих головок. Поэтому, для реализации NCQ необходима поддержка со стороны диска, контроллера и драйвера одновременно. ICH6R и соответствующий новый драйвер Intel Application Accelerator 4.0 такую поддержку имеют. Значит, Serial ATA диски с поддержкой NCQ могут получить на платах с чипсетами i925/i915 "бесплатный" прирост в производительности.
Для иллюстрации этого факта мы провели тестирование одного из первых Serial ATA жёстких дисков с поддержкой NCQ, Maxtor MaxLine III. Измерение скорости работы жесткого диска "в реальных условиях" мы выполняли при помощи популярного теста PCMark04. Тесты проводились на старом Serial ATA контроллере из ICH5R, а также на новом контроллере из ICH6R в двух режимах: при использовании стандартного драйвера без поддержки NCQ и с драйвером Intel Application Accelerator 4.0, в котором поддержка NCQ реализована.
Как показывают тесты, уже сам по себе контроллер Serial ATA, встроенный в ICH6, несколько быстрее контроллера из ICH5. Включение же NCQ дополнительно увеличивает показатели ICH6, причём весьма существенно. От использования NCQ скорость работы дисковой подсистемы в реальных задачах возрастает на 7-10%. Таким образом, применение NCQ реально оптимизирует производительность устройств хранения данных с интерфейсом Serial ATA.
В заключение раздела необходимо отметить и ещё одно важное усовершенствование, появившееся в Serial ATA контроллере ICH6. Теперь этот контроллер поддерживает протокол ATAPI, что даёт возможность использования с новыми чипсетами i925/i915, например, оптических приводов с интерфейсом Serial ATA. В свете сокращения числа Parallel ATA каналов в ICH6 до одного, значение данного нововведения трудно недооценить.
Новые процессоры
Вместе с новыми наборами логики Intel 925X Express и Intel 915 Express компания Intel также объявила о выпуске и нескольких новых процессоров семейств Pentium 4 и Pentium 4 Extreme Edition. Хотя по сути новые CPU не имеют никаких кардинальных отличий с точки зрения архитектуры, новинки несут ряд инноваций, относящихся скорее к маркетинговой плоскости. Так, объявленные процессоры имеют новый форм-фактор LGA775, приходящий на смену Socket 478, а также являются носителями новой системы маркировки: теперь они обозначаются не тактовой частотой, а "процессорным номером". Подробнее об этих нововведениях мы поговорим чуть ниже, а сейчас познакомимся непосредственно с новинками.
Процессоры Prescott. Слева – в исполнении Socket 478, справа – в исполнении LGA775 Переход на новую платформу i925/i915 Intel тесно связывает с новым процессорным разъёмом LGA775. По планам Intel, современные материнские платы на базе новых чипсетов должны оснащаться и новым процессорным разъёмом. Хотя никто не мешает производителям материнских плат нарушить это правило, большинство плат, использующих новые наборы микросхем от Intel, будут оборудоваться процессорным разъёмом LGA775. Именно поэтому одновременно со своими новыми наборами логики Intel выпустил и целую линейку процессоров, выполненных в форм-факторе LGA775. Эта линейка на сегодняшний день включает несколько процессоров Pentium 4 серии 5XX, являющимися по сути обычными процессорами Pentium 4 на базе 90 нм ядра Prescott, а также процессор Pentium 4 Extreme Edition с частотой 3.4 ГГц. Следует заметить, что ни процессоров на базе ядра Northwood, ни бюджетных процессоров семейства Celeron в составе LGA775 линейки от Intel пока нет. Впрочем, процессоры Celeron в исполнении LGA775 будут выпущены совсем скоро. Что же касается Pentium 4 на базе ядра Northwood, то, по всей видимости, их в исполнении LGA775 мы не увидим.
Итак, давайте посмотрим, какие процессоры предлагается Intel для платформы LGA775 сегодня:
Процессоры на базе ядра Prescott уже хорошо знакомы нашим читателям по предыдущим материалам. Представленные новинки отличаются от предшественников только лишь форм-фактором:
Впрочем, необходимо заметить, что в основе новых Pentium 4 (Prescott) мы видимо обновлённое ядро степпинга D0, в то время как в процессорах Pentium 4, которые попадали в нашу лабораторию ранее, использовалось ядро Prescott степпинга C0. Переход на ядро нового степпинга не связан со сменой форм-фактора процессора. Миграция Prescott на ядро нового степпинга – это плановая акция, проводимая для понижения тепловыделения и увеличения частотного потенциала 90 нм CPU от Intel, благодаря чему Intel получил возможность представить процессор Pentium 4 с частотой 3.6 ГГц, носящий название Pentium 4 560.
Что касается процессора Pentium 4 Extreme Edition 3.4 для LGA775, то он являет собой полный аналог виденного нами ранее родственного процессора для разъёма Socket 478:
Впрочем, следует заметить, что применение новой упаковки этого процессора привело к некоторому увеличению тепловыделения. В целом, электрические и термические характеристики семейства LGA775 выглядят следующим образом (для сравнения приводятся и аналогичные характеристики процессоров для Socket 478):
Таким образом, несмотря на все старания Intel и переводом процессоров Pentium 4 (Prescott) на новое ядро степпинга D0, тепловыделение этих процессоров с переходом на LGA775 только увеличилось. Впрочем, на этот раз данный факт не вызывает катастрофических последствий. Материнские платы с разъёмом LGA775 спроектированы с учётом высоких требований к энергопотреблению и тепловыделению новых процессоров, в отличие от плат с гнездом Socket 478. Кроме того, Intel спроектировал и новую более эффективную систему охлаждения: кулеры для LGA775 процессоров имеют новое крепление и гораздо более внушительный размер.
Процессорный разъём LGA775
Отдельно следует затронуть вопрос и относительно перевода процессоров семейства Pentium 4 на использование нового процессорного разъёма LGA775 или, как его называли ранее, Socket T. Основными отличиями процессорного разъема LGA775 являются достаточно ощутимое увеличение числа контактов с текущих 478 до 775, а также принципиально новая конструкция самого разъема. Процессоры в форм-факторе LGA775 будут лишены привычных процессорных ножек. Они заменены плоскими контактными площадками, не выступающими на нижней поверхности процессора. При этом подпружиненные контактные ножки располагаются на самом процессорном гнезде. Крепление процессора в таком гнезде выполняется путем его точной установки на контактах благодаря специальной ограничивающей рамке и использованию прижимной клипсы, равномерно распределяющей нагрузку по поверхности CPU.
Конструкция процессорного разъёма LGA775 Контактные площадки процессора Контакты разъёма: крупно Однако гораздо более интересный вопрос касается причин перехода Intel на использование нового гнезда LGA775. Очевидно, что изменение конструкции механического крепления – это дело вкуса. Например, процессоры Athlon 64 FX и Opteron используют Socket 940 привычной конструкции с 940 контактами, при этом никаких механических проблем мы не наблюдаем. Так что применение новой схемы крепления вызвано скорее соображениями удобства использования массивных охлаждающих систем в свете высокого тепловыделения новых и будущих процессоров семейства Pentium 4 и перехода к новой конструкции корпусов форм-фактора BTX.
Что же касается резкого роста количества контактов (если быть более точным, то количество процессорных контактов при переходе от Socket 478 к LGA775 увеличивается на 62%) в рамках одного процессорного семейства и одной процессорной архитектуры NetBurst, то тут высказываются разные мнения. Однако, судя по всему, увеличение числа контактов процессора позволяет распределить электрическую нагрузку по ним более равномерно за счёт дублирования некоторых важных линий, в первую очередь линий питания. То есть, в каждой конкретной точке кристалла значение потерь мощности на переходе от контакта к расположенному в глубине ядра транзистору уменьшается. Чем больше ножек при неизменной совокупной нагрузке, тем ниже удельная нагрузка на каждый конкретный район кристалла, соседствующий с контактом. В результате, значения индуктивности и сопротивления в каждой переходной точке уменьшатся, а колебания напряжения от постоянного переключения состояния десятков миллионов транзисторов становятся более сглаженными. Все это приводит к тому, что транзисторы могут работать при более низком номинальном напряжении. А более низкое напряжение, как известно, означает и более низкую потребляемую мощность.
Таким образом, увеличение числа контактов призвано решить две основные задачи. Во-первых, появляется экономия потребляемой мощности, о которой так много говорилось при обсуждении достоинств LGA775. Разумеется, уровень тепловыделения при этом тоже снизится. Но не стоит обольщаться - экономия эта не столь велика, чтобы ощутимо уменьшить уровень тепловыделения текущих процессоров на ядре Prescott. Однако, в отдалённой перспективе, когда процессоры Pentium 4 с ядром Prescott II и частотой свыше 4.0 ГГц будут выделять до 150 Вт, любая экономия может оказаться к месту. Во-вторых, благодаря увеличению числа контактов достигается значительное улучшение в части стабильности работы процессоров на высоких тактовых частотах. В этой связи переход на использование LGA775 видится нам как некое подготовительное мероприятие перед переводом процессоров Pentium 4 на использование более скоростной системной шины. Так, ожидается, что процессоры в исполнении LGA775 в перспективе смогут работать при частоте шины 1066 МГц, что гарантирует ей пропускную способность в 8.5 Гбайт в секунду.
Что касается длины жизненного цикла нового разъёма LGA775, то он, очевидно, станет не менее коротким, нежели жизненный цикл Socket 478. Для нового процессорного гнезда будут выпускаться CPU семейства Pentium 4 на ядре Prescott на протяжении как минимум этого и следующего года. Как ожидается, процессорный форм-фактор LGA775 будет широко применяться как минимум вплоть до 2006 года. И лишь через два с небольшим года, когда Intel собирается выпустить процессоры на ядрах Nahalem, Merom и Conroe, для изготовления которых будет использоваться технологический процесс с нормами 65 нм, процессоры для настольных систем перейдут на использование нового процессорного гнезда, в настоящее время известного под именем Socket C.
Intel вводит "процессорный номер"
Учитывая то, что процессоры в исполнении LGA775 в отличие от своих Socket 478 предшественников, будут маркироваться при помощи нового процессорного рейтинга, рассмотрению этого вопроса тоже необходимо уделить отдельное внимание. Основная цель такого изменения, по мнению Intel, состоит в облегчении восприятия маркировок процессоров неподготовленными пользователями. Действительно, в настоящее время Intel предлагает несколько различных линеек CPU с кардинально отличающимися характеристиками, однако существующее обозначение процессоров частотой, привычное и понятное для специалистов, вводит в заблуждение неподготовленных покупателей.
Итак, сегодня для настольных компьютеров компания Intel предлагает уже четыре различных семейства процессоров:
Intel Pentium 4 XE (Extreme Edition). Процессоры, основанные на 0.13-микронном ядре Gallatin, снабженные, подобно серверным процессорам среднего и верхнего уровня, кеш-памятью третьего уровня объёмом 2 Мбайта. Эти процессоры имеют максимально достижимые при используемой технологии частоты 3.2 и 3.4 ГГц, имеют наиболее быструю системную шину с частотой 800 МГц и поддерживают технологию Hyper-Threading. Фактически, семейство Pentium 4 XE вобрало в себя все самые лучшие черты процессоров Intel для настольных систем, которые были усилены к тому же добавлением кеш-памяти третьего уровня. Эти процессоры являются самыми производительными CPU от Intel для настольных систем на сегодняшний день и позиционируются компанией как решения для экстремальных геймеров. Правда, стоимость процессоров этого класса составляет порядка 1000 долларов.
Intel Pentium 4. Количество разнообразных модификаций процессоров, продающихся под брендом Pentium 4, просто поражает. CPU этого семейства могут основываться на 130 нм ядре Northwood с кеш-памятью второго уровня 512 Кбайт или на новом 90 нм ядре Prescott с кеш-памятью 1024 Кбайта. Старшие модели в линейке используют системную шину с частотой 800 МГц и поддерживают технологию Hyper-Threading. Более дешевые модели поддерживают несколько более медленную шину с частотой 533 МГц и лишены поддержки Hyper-Threading. Процессоры семейства Pentium 4 позиционируются производителем в качестве решений для настольных систем среднего уровня.
Intel Celeron. Под этим брендом компания Intel предлагает "упрощенные" версии Pentium 4 для дешевых систем. Хотя процессоры Celeron и производятся из тех же самых полупроводниковых кристаллов, что и Pentium 4 с ядром Northwood, их характеристики сильно ухудшены. Во-первых, объем кеша второго уровня процессоров Celeron урезан до 128 Кбайт. Во-вторых, в процессорах этого семейства отсутствует поддержка технологии Hyper-Threading. В третьих, частота процессорной шины Celeron составляет 400 МГц. Все это приводит к тому, что даже несмотря на тактовые частоты, достигающие на данный момент величины 2.8 ГГц, производительность этих CPU оказывается ощутимо ниже скорости младших моделей Pentium 4, например, с частотой 2.4 ГГц.
Intel Celeron D. Несколько улучшенная модификация Celeron, основывающаяся на "ухудшенном" ядре Prescott. Процессоры этого семейства, которые начали появляться в розничной продаже в эти дни, имеют частоты шины 533 МГц и обладают кеш-памятью второго уровня объёмом 256 Кбайт. В остальном, характеристики аналогичны обычным Celeron: в этих процессорах отсутствует поддержка технологии Hyper-Threading и нацеливаются они прежде всего на рынок бюджетных компьютеров.
Естественно, одновременное присутствие на рынке нескольких моделей процессоров с одинаковой частотой, которую, надо заметить, многие производители компьютеров сегодня выносят на первый план в качестве основной характеристики своего продукта, порождает серьёзную неразбериху. Тем более что достаточно часто в магазинах можно встретить несколько модификаций одного и того же процессора с одинаковой тактовой частотой, но различающихся по характеристикам. Например, процессоров Intel с тактовой частотой 2.8 ГГц на сегодняшний день представлено целых шесть модификаций. Во-первых, Pentium 4 2.8 на ядре Northwood с 533 мегагерцовой шиной, во-вторых, Pentium 4 2.8A на ядре Prescott с 533-мегагерцовой шиной, в-третьих, Pentium 4 2.8C на ядре Northwood с шиной 800 МГц и поддержкой технологии Hyper-Threading, в-четвёртых, Pentium 4 2.8E на ядре Prescott с частотой шины 800 МГц и поддержкой Hyper-Threading, в-пятых, Celeron 2.8 с частотой шины 400 МГц и 128-килобайтной кеш-памятью второго уровня и, в-шестых, Celeron D 2.8 с частотой шины 533 МГц и 256-килобайтным кешем второго уровня. Запутаться в этом многообразии немудрено, особенно если принять во внимание тот факт, что в рамках одной линейки маркировки процессоров с одинаковой частотой различаются лишь литерой после обозначения частоты.
Именно поэтому компания Intel приняла решение видоизменить маркировку своих CPU, сделав её более понятной для обычных пользователей. В результате, теперь процессоры Intel начнут маркироваться по-новому – трехзначным числом, по которому можно будет однозначно установить архитектуру ядра, тактовую частоту процессора, частоту FSB, размеры кешей и наличие дополнительных технологий в процессоре. Однако при этом маркировка будет проста и понятна и неспециалистам, для которых она будет являться отражением позиционирования данного CPU. Важно понимать, что маркировка от Intel несёт совершенно иную смысловую нагрузку, нежели процессорный рейтинг AMD. Если у AMD маркировка является неким воспроизведением производительности процессора, и несколько CPU с разной архитектурой могут иметь одинаковый процессорный рейтинг, то с маркировкой от Intel такое невозможно: различные по каким-либо характеристикам процессоры будут иметь разную маркировку, однако при этом "процессорный номер" никоем образом не является технической характеристикой. Также, "процессорный номер" от Intel никаким образом не связан с производительностью: это аппарат чисто маркетинговый.
В частности, процессоры Intel образуют три серии: 7XX, 5XX и 3XX. Подобно автомобилям BMW серия 7XX будет позиционироваться как процессоры высшей ценовой категории для пользователей-энтузиастов, 5XX станет линейкой процессоров нацеленной на среднюю ценовую категорию, а процессоры серии 3XX – это предложения компании для бюджетных систем.
Пока новая маркировка затрагивает лишь относительно новые модели процессоров. Старые же процессоры с 0.13-микронными ядрами (например, LGA775 модификация Pentium 4 XE) будут продолжать обозначаться частотой вплоть до их полного исчезновения с рынка. Также, достаточно любопытен тот факт, что процессорный номер будет использоваться Intel только для маркировки мобильных процессоров и процессоров для мобильных компьютеров. Серверные же процессоры в линейках Xeon и Itanium продолжат маркироваться тактовой частотой, поскольку персонал, обслуживающий сервера и рабочие станции, как считает Intel, имеют достаточную квалификацию и не нуждаются в "упрощенной" модели обозначения процессоров.
Несмотря на то, что новые CPU будут нести на себе маркировку в виде "процессорного номера", это не означает полную отмену использования объективных характеристик для маркировки. То есть, вместе с рейтингом на процессоре также будет указываться его частота, частота шины, размер кеш-памяти и т.п. Однако на первый план будет вынесена именно маркировка в виде рейтинга. В таблице ниже мы приводим расшифровку процессорного номера от Intel, присвоенного уже вышедшим и будущим моделям настольных процессоров:
Глядя на приведенное соответствие между характеристиками процессоров и их процессорным номером, становится понятно, что новая маркировка процессоров может сопоставляться лишь в рамках конкретной линейки CPU. Номера же процессоров, принадлежащих разным линейкам сравнивать между собой совершенно бессмысленно. Именно поэтому процессоры будут маркироваться названием бренда и указанием номера после него, например, Pentium 4 530 или Celeron 335. При этом больший процессорный номер в рамках одной линейки всегда означает что процессор, им обладающий, лучше по какому-либо признаку, чем аналогичный процессор с меньшим процессорным номером. Однако при этом маркировка не может быть использована в качестве прямого руководства к действиям при покупке. Больший рейтинг вовсе не означает, что рассматриваемый процессор более предпочтителен для любых применений.
Заметим, что решение Intel перейти на рейтинговую маркировку процессоров, действительно, назрело уже очень давно. Поэтому сегодня этот шаг выглядит вполне логичным. Более того, мы сами являемся невольными свидетелями того, что тактовая частота процессоров в качестве их базовой характеристики постепенно отходит на задний план. Производители процессоров в последнее время добиваются роста производительности и расширения функциональности своих продуктов совершенно иными путями. Нетрудно заметить, что за последний год, например, частоты старших процессоров от AMD и Intel выросли совсем незначительно. Однако это вовсе не означает, что производительность систем в течение последнего года практически не возросла. Просто разработчики CPU добивались этого другими способами: повышали частоту FSB, увеличивали объем кэш-памяти, вводили всякие технологии вроде 64-битных расширений или Hyper-Threading. В дальнейшем это экстенсивное развитие будет продолжено. Например, не за горами появление двухядерных процессоров, объединяющих в одной упаковке или на одном кристалле два процессорных ядра. Также необходимо понимать, что архитектура NetBurst будет существовать вполне ограниченное время. Уже в следующем году, например, Intel планирует адаптировать для настольных процессоров архитектуру Pentium M. Это неизбежно приведет к понижению тактовых частот CPU, и к этому времени пользователи уже должны чётко осознавать, что частота – это техническая характеристика, лишь косвенным образом связанная с производительностью.
Как мы тестировали
В рамках данного тестирования мы исследовали производительность новой LGA775 платформы от Intel, сравнивая быстродействие LGA775 процессоров на платформе i925E Express со скоростью Socket 478 процессоров на платформе i875P. Кроме того, мы сравнили скорость новой платформы, представленной Intel со скоростью старших процессоров, предлагаемых основным конкурентом, компанией AMD. Для сравнений использовались платформы следующей архитектуры:
LGA775: чипсет i925X Express, двухканальная DDR2-533 память, PCI Express x16 графика NVIDIA GeForce PCX 5900 (390/700 МГц);
Socket 478: чипсет i875P, двухканальная DDR400 память, AGP 8x графика NVIDIA GeForce FX 5900XT (390/700 МГц);
Socket 939: чипсет VIA K8T800 Pro, двухканальная DDR400 память, AGP 8x графика NVIDIA GeForce FX 5900XT (390/700 МГц);
Socket 754: чипсет VIA K8T800, одноканальная DDR400 память, AGP 8x графика NVIDIA GeForce FX 5900XT (390/700 МГц);
Таким образом, процессоры, использующие разъём LGA775 работали в несколько отличающихся условиях, обусловленных особенностями новой платформы. Так, в системе с LGA775 применялась иная графическая карта с интерфейсом PCI Express x16. Однако архитектура графического ядра и его частоты у PCI Express x16 видеокарты были те же, что и в случае других платформ с поддержкой AGP, что даёт возможность корректно сопоставлять полученные на разных платформах результаты.
В составе тестовых систем использовалось следующее оборудование:
Процессоры:
AMD Athlon 64 FX-53 (Socket 939);
AMD Athlon 64 3800+ (Socket 939);
AMD Athlon 64 3700+ (Socket 754);
AMD Athlon 64 3500+ (Socket 939);
AMD Athlon 64 3400+ (Socket 754);
Intel Pentium 4 560 (LGA775);
Intel Pentium 4 550 (LGA775);
Intel Pentium 4 Extreme Edition 3.4 ГГц (LGA775).
Intel Pentium 4 3.4E ГГц (Socket 478, Prescott);
Intel Pentium 4 3.4 ГГц (Socket 478, Northwood);
Intel Pentium 4 Extreme Edition 3.4 ГГц (Socket 478).
Материнские платы:
ASUS A8V Deluxe (Socket 939, VIA K8T800 Pro);
ASUS P4C800-E Deluxe (Socket 478, i875P);
ABIT KV8-MAX3 (Socket 754, VIA K8T800).
Intel D925XCV (LGA775, i925X Express).
Память:
1024 Мбайт DDR400 SDRAM (Corsair CMX512-3200LLPRO, 2 x 512 Мбайт, 2-3-2-6);
1024 Мбайт DDR2-533 SDRAM (Corsair CM2X512-4300, 2 x 512 Мбайт, 4-4-4-12).
Видеокарты:
NVIDIA GeForce FX 5900XT (390/700 МГц);
NVIDIA GeForce PCX 5900 (390/700 МГц).
Дисковая подсистема: Western Digital Raptor WD740GD.
Тестирование выполнялось в операционной системе Windows XP SP1 с установленным пакетом DirectX 9.0b.
Перед тем, как перейти непосредственно к результатам тестов, приведём фотографию материнской платы Intel D925XCV, поскольку данная плата не рассматривалась нами ранее:
Плата построена на базе набора логики Intel 925X Express и поддерживает LGA775 процессоры с частотой шины 800 МГц. Intel D925XCV оснащена слотом PCI Express x16, двумя слотами PCI Express x1 и четырьмя слотами PCI. Для установки подсистемы памяти предусмотрено четыре 240-контактных DDR2 DIMM слота, расположенные группами по два – на каждый канал. Плата поддерживает технологии Matrix RAID, High Definition Audio и имеет интегрированный гигабитный сетевой контроллер, подсоединённый к шине PCI Express. Таким образом, благодаря Intel D925XCV мы получили возможность исследовать все тонкости новой LGA775 платформы от Intel.
Синтетические тесты подсистемы памяти
Поскольку с выходом новой платформы i925/i915 от Intel мы впервые сталкиваемся с подсистемой памяти, построенной на использовании DDR2 SDRAM, первым делом исследуем её производительность при помощи синтетических тестов. Для начала мы воспользовались утилитой ScienceMark 2.0, имеющей неплохой инструментарий и для тестирования подсистемы памяти. В первую очередь мы измерили пропускную способность и латентность подсистем памяти, получаемую в платформах, основанных на CPU класса Pentium 4 при использовании DDR400 SDRAM и при применении новой DDR2-533 SDRAM. В таблице ниже приведены результаты измерений, которые были сняты в Socket 478 и LGA775 платформах при использовании процессоров класса Pentium 4 с различными ядрами, но работающими с одинаковой тактовой частотой 3.4 ГГц. Кроме того, к этим цифрам мы добавили результаты, полученные нами в системах на базе Socket 939 Athlon 64, Socket 940 Athlon 64 FX и Socket 754 Athlon 64. Для того чтобы можно было более корректно соотнести результаты, протестированные процессоры архитектуры AMD64 работали на частоте 2.2 ГГц.
Полученные результаты показывают, что, как и ожидалось, DDR2 память и на практике имеет большую латентность, нежели DDR400 SDRAM. Однако, несмотря на более высокую пиковую теоретическую пропускную способность, на практике DDR2-533 не может похвастать лучшей пропускной способностью, нежели привычная DDR400 SDRAM. Дело в том, что полностью пропускная способность, обеспечиваемая двухканальной DDR2-533, составляющая 8.5 Гбайт в секунду, не может быть задействована современными процессорами семейства Pentium 4 с частотой шины 800 МГц, так как такая процессорная шина имеет меньшую пропускную способность в 6.4 Гбайт в секунду. Таким образом, все преимущества DDR2 памяти процессоры Pentium 4 смогут использовать только лишь после их перехода на 1066 МГц Quad Pumped Bus. Ждать этого события осталось недолго: такие CPU от Intel должны появиться в третьем квартале этого года.
Посмотрим теперь, какие же результаты покажут процессоры в тесте подсистемы памяти из пакета SiSoftware Sandra 2004, использующем алгоритм Stream для измерения пропускной способности памяти на практике:
Заметим, что вновь системы, использующие DDR2-533 SDRAM, показывают результаты хуже, нежели системы с DDR400 SDRAM. В результате, нам остаётся только констатировать, что желание Intel перевести свои системы на использование новых типов памяти – это скорее шаг на будущее, все плюсы от которого мы увидим лишь впоследствии. Пока же подсистема памяти, построенная на использовании DDR2 SDRAM, не может порадовать нас своими высокими показателями в синтетических тестах. В то же время, следует заметить, что делать выводы о том, что при использовании DDR2 SDRAM современные платформы работают медленнее, чем при применении DDR SDRAM пока рано. В конечном итоге скорость зависит и от алгоритмов работы с памятью, так что в некоторых приложениях системы с DDR2 SDRAM могут работать несколько быстрее своих собратьев с DDR400 SDRAM.
Также, хотелось бы обратить внимание на тот факт, что DDR2 SDRAM лучше раскрывает свой потенциал в паре с процессорами на базе ядра Prescott. Объясняется это, по-видимому, особенностями работы алгоритмов программной и аппаратной предвыборки данных, которые в этом процессоре претерпели существенные изменения. В любом случае, данную особенность следует иметь в виду. Ниже мы посмотрим, сохраняется ли эта тенденция и в реальных приложениях, или же она заметна только на примерах синтетических тестов.
Производительность
Игровые приложения Тестирование новой платформы LGA775 в игровых приложениях – задача отнюдь не простая. Дело в том, что платы, построенные на базе наборов логики i925/i915, оснащены графической шиной PCI Express x16 и не имеют совместимости с AGP 8x. Платформы же для Socket 478 процессоров, основанные на чипсетах i875/i865, напротив, поддерживают AGP 8x и не имеют шины PCI Express x16. Поэтому, при сравнении старой и новой платформы от Intel нам волей-неволей приходится пользоваться различными графическими картами. Мы попытались нивелировать влияние этого фактора, и в обоих платформах были использованы одинаковые видеоплаты с ядром NVIDIA GeForce FX 5900, 128 Мбайтами локальной видеопамяти и с одинаковыми частотами 390/700 МГц. Однако, как показала практика, этого недостаточно. Дело в том, что NVIDIA не предлагает официального драйвера для PCI Express x16 плат. Для работы приходится использовать бета-драйвера (например, мы использовали ForceWare 61.32), а они не лишены проблем. Причём, в некоторых игровых приложениях проблемы у этих драйверов возникают с AGP 8x платами, а в некоторых – с PCI Express x16, причем наборы этих приложений в том и в ином случае оказываются различными. Поэтому, мы ограничили список игровых приложений, в которых проводились тесты лишь небольшим числом игр и бенчмарков, в которых обе платы функционируют заведомо нормально.
На примере этих приложений мы видим, что перевод процессоров Pentium 4 и Pentium 4 XE на новую платформу не даёт никакого преимущества. Сравнение результатов Pentium 4 3.4E на базе ядра Prescott и Pentium 4 550, имеющего такую же частоту 3.4 ГГц, показывает, что в большинстве случаев процессор, работающий в системе с DDR400 памятью, демонстрирует более высокие результаты, чем аналогичный LGA775 процессор. Это неудивительно. Известно, что для современных игр низкая латентность подсистемы памяти имеет большее значение, чем её высокая пропускная способность. Поэтому, DDR2-533 на современном этапе не может дать преимуществ геймерам. Кстати, по этой же причине процессоры семейства Athlon 64 работают в игровых приложениях столь быстро. Фактически, новый Pentium 4 560 с частотой 3.6 ГГц может соперничать с Athlon 64 3400+ с большим трудом.
Положение не спасает и Pentium 4 XE 3.4, для которого перевод на платформу LGA775 с DDR2 памятью выглядит вообще как катастрофа. Новые чипсеты с DDR2 контроллером гораздо лучше ведут себя с процессорами с ядром Prescott, поэтому большее преимущество над Pentium 4 (Prescott) процессор Pentium 4 XE 3.4 демонстрирует, работая в системах с чипсетом i875P и DDR400 памятью.
В общем, всё это говорит о том, что геймеры, желающие получить максимальную производительность в играх, должны пока игнорировать новые платформы от Intel. Более того, в задачах этого типа большее быстродействие способны продемонстрировать процессоры с архитектурой AMD64.
SYSmark 2004 Новый тестовый пакет SYSmark 2004, разработанный группой компаний, включающей AMD и Intel, очень неплохо отражает производительность систем при решении наиболее типовых комплексных задач. Поэтому, тестированию новой платформы в этом пакете мы уделили особое внимание.
Прежде чем комментировать результаты, кратко расскажем о составе тестов:
3D Creation. в пакете 3ds max 5.1 рендерится изображение в bmp файл, в это время пользователь готовит web-страницы в Dreamweaver MX. Затем пользователь рендерит в векторном графическом формате 3D анимацию. В данном тесте основной вклад в итоговый результат (95.5%) вносит скорость работы в 3ds max.
2D Creation. В данном случае моделируется работа пользователя в Premiere 6.5, который создает видео-ролик из нескольких других роликов в raw-формате и отдельных звуковых треков. Ожидая окончания операции, пользователь готовит изображение в Photoshop 7.01, модифицируя имеющуюся картинку и сохраняя ее на диске. После завершения создания видео-ролика, пользователь редактирует его и добавляет специальные эффекты в After Effects 5.5. Вклад скорости в приложениях в конечный индекс оценивается так: 43.3% - Adobe Photoshop 7.01, 39.1% - Premiere 6.5, 17.6% - AfterEffects 5.5.
Web Publication. Пользователь разархивирует контент из архива в zip-формате, одновременно используя Flash MX для открытия экспортированного 3D векторного графического файла. Пользователь модифицирует его путем включения других картинок и оптимизирует для более быстрой анимации. Итоговый ролик со специальными эффектами сжимается с использованием Windows Media Encoder 9 для транслирования через Интернет. Затем создаваемый веб-сайт компонуется в Dreamweaver MX, а параллельно система сканируется на вирусы с использованием VirusScan 7.0. Основное влияние на результат в тесте оказывает Windows Media Encoder 9 (56%), VirusScan 7.0 (30.4%) и Flash MX (9.8%).
Communication. Здесь моделируется работа пользователя, получающего письмо в Outlook 2002, которое содержит набор документов в zip-архиве. Пока полученные файлы сканируются на вирусы при помощи VirusScan 7.0, пользователь просматривает e-mail и вносит пометки в календарь. Затем пользователь просматривает корпоративный веб-сайт и некоторые документы при помощи Internet Explorer 6.0. Основной вклад в итоговый индекс вносит в этом случае VirusScan 7.0 (80.8%) и Outlook 2002 (15.4%).
Document Creation. В данном тесте гипотетический пользователь редактирует текст в Word 2002, а также использует Dragon NaturallySpeaking 6 для преобразования аудио-файла в текстовый документ. Готовый документ преобразуется в pdf формат с использованием Acrobat 5.0.5. Затем, пользуясь сформированным документом, создается презентация в PowerPoint 2002. Вклад приложений в итоговый результат оценивается следующим образом: Word 2002 - 10.4%, PowerPoint 2002 - 16.7%, Dragon NaturallySpeaking 6.0 - 34.6% и Acrobat 5.0.5 - 38.4%.
Data Analysis. Используемая модель: пользователь открывает базу данных в Access 2002 и выполняет ряд запросов. Документы архивируются с использованием WinZip 8.1. Результаты запросов экспортируются в Excel 2002, и на их основании строится диаграмма. Основную лепту в конечный результат вносят Excel 2002 - 76.6% и Access 2002 - 19.8%.
Как видно из результатов, задачи, в которых платформа LGA775 с DDR2 памятью работает быстрее Socket 478 платформы, использующей DDR SDRAM, существуют. Например, LGA775 Pentium 4 550 обгоняет Socket 478 Pentium 4 3.4E в подтесте 2D Creation, где моделируется обработка видео и изображений. Однако в целом мы видим повторение картины, отмеченной нами в играх: высокая латентность DDR2 SDRAM проводит к отставанию процессоров LGA775 от Socket 478 собратьев, работающих на одинаковой частоте.
Приведём итоговый результат:
Наивысший результат в этом тесте демонстрирует новый процессор Pentium 4 560, представляющий собой Prescott с частотой 3.6 ГГц. Этому CPU удаётся обогнать все процессоры для платформы i875P, а также процессоры Pentium 4 XE, частота которых сегодня не превышает 3.4 ГГц. Следует отметить, что по данным этого теста процессоры Athlon 64 отстают от CPU семейства Pentium 4. Объясняется это тем, что благодаря поддержке технологии Hyper-Threading, Pentium 4 решает задачи параллельной обработки данных несколько лучше. Модель же работы пользователя, принятая в SYSmark 2004, предполагает, что пользователь работает в нескольких приложениях одновременно, что, впрочем, недалеко от истины.
Winstone 2004 Ещё один тест, позволяющий оценить производительность систем при обычной работе в офисных приложениях и программах для создания цифрового контента – это Winstone. Традиционно, мы приводим и результаты, полученные в этом бенчмарке. Предварительно следует заметить, что модель используемая в бенчмарках этого семейства предполагает, что пользователь не выполняет более одной задачи одновременно, а поэтому прирост производительности от технологии Hyper-Threading в этих тестах незначителен.
В то время, как платформа построенная на базе набора логики i875P лидирует в Business Winstone, тест Content Creation Winstone демонстрирует превосходство платформы i925X Express с DDR2 памятью (при условии использования процессоров с одинаковой тактовой частотой). Впрочем, сюрпризом это не является, подобную картину мы уже наблюдали в SYSmark 2004. Таким образом, мы можем только подтвердить, что для задач обработки изображений и видео использование новой памяти DDR2 SDRAM совместно с процессорами на базе ядра Prescott может быть не лишено смысла.
Приведём также и результаты, которые получаются в Winstone при использовании тестов, рассчитанных на исследование производительности систем при многопоточной нагрузке.
Данные тесты моделируют следующие ситуации:
Multitasking Test 1. В данном тесте в качестве фоновой нагрузки используется обычное копирование файлов. Одновременно с этим измеряется производительность работы в приложениях Microsoft Outlook и Internet Explorer.
Multitasking Test 2. В данном случае в качестве фоновой нагрузки используется более серьезная задача – работающий архиватор Winzip. В параллель процессу архивирования в бенчмарке эмулируется работа в Word и Excel.
Multitasking Test 3. Это - наиболее тяжелый тест, в котором параллельно работает программа проверки файлов на вирусы Norton AntiVirus и целая когорта офисных приложений, включающих Microsoft Excel, Microsoft Project, Microsoft Access, Microsoft PowerPoint, Microsoft FrontPage и WinZip.
Что касается результатов, то обратить внимание читателя хочется в первую очередь на тест 2, в котором платформа LGA775 имеет достаточно сильное преимущество над Socket 478 системами. Вообще же данная ситуация является редкой и в других двух тестах старая платформа оказывается лучше новой, при условии использования одинаковых процессоров. Производительность же Pentium 4 560, имеющего частоту 3.6 ГГц, позволяет достичь более высоких результатов, чем при использовании Pentium 4 3.4E с чипсетом i875P и DDR400 памятью.
Архивирование данныхХотя переход на ядро Prescott существенно поднял производительность процессоров Pentium 4 в задачах архивации данных, ввод в строй новой платформы эту тенденцию не продолжил. Увеличение латентности памяти, вызванное переходом на использование DDR2-533 SDRAM привело к тому, что производительность при архивации сильно упала. Например, даже наиболее скоростной в WinRAR LGA775 процессор Pentium 4 560 отстаёт от Pentium 4 3.4E, работающий в составе системы, построенной на чипсете i875P. В 7-zip новая платформа ведёт себя несколько лучше, чем в WinRAR, однако это положение не спасает.
Обратный процесс – разархивирование данных – требует от процессора прежде всего высокой вычислительной мощности. Именно поэтому процессоры Athlon 64 значительно опережают Pentium 4, а среди процессоров от Intel наивысшую скорость демонстрирует Pentium 4 560, который на сегодняшний день имеет самую высокую тактовую частоту среди всех CPU с архитектурой NetBurst.
Кодирование медиа данныхПри кодировании аудио и видео контента все минусы перехода к использованию в LGA775 платформе DDR2 памяти сказываются не столь сильно. В результате, производительность платформ LGA775 и Socket 478 в приложениях этого типа примерно равна с незначительным перевесом в пользу i875P.
3D рендерингПропускная способность и латентность подсистемы памяти мало влияет на скорость финального ренедеринга. В результате, i925X Express и i875P демонстрируют примерно одинаковые результаты.
Параллельно хочется заметить, что если сравнивать производительность процессоров Athlon 64 и Pentium 4 между собой, то выделить однозначного лидера будет весьма проблематично. В зависимости от типа и содержания объекта рендеринга результат может склоняться как в ту, так и в другую сторону.
Adobe Photoshop Adobe Photoshop CS 8.0 – очень популярный графический редактор, который многие используют для редактирования двумерной графики. Поэтому тестам в этом пакете мы уделили отдельное внимание. Для тестирования нами использовался слегка видоизмененный бенчмарк PSBench 7 со 100-мегабайтным изображением.
В качестве итогового индекса мы приводим среднее геометрическое от времени выполнения различных распространённых операций. Таким образом, мы уравниваем вклад скорости платформ при выполнении различных операций над изображениями в итоговый индекс. На диаграмме ниже с итоговым индексом производительности в Photoshop результат приводится в секундах. Поэтому меньший результат соответствует лучшей скорости.
Приведем и более подробные результаты, показывающие скорость работы различных фильтров Photoshop CS 8.0 на протестированных системах. В таблице показано время в секундах:
Нажмите для увеличения Mathematica То, что процессоры Athlon 64 очень сильны при вычислительной нагрузке, говорилось уже не раз. Данный тест – ещё одно подтверждение этого факта. Все протестированные Athlon 64 значительно опережают процессоры семейства Pentium 4. Что же касается производительности новой платформы от Intel, то использование DDR2 SDRAM памяти с высокой латентностью оказывает своё отрицательное влияние и тут.
Выводы
Подводя итог, следует отметить, что однозначного мнения о новой платформе i925/i915 у нас не сложилось. Безусловно, новые чипсеты обладают и определёнными плюсами, например поддержкой High Definition Audio, технологией Matrix RAID и поддержкой WiFi. Также, к положительным сторонам i925/i915 следует отнести и новую шину PCI Express x1, которая должна снять ограничения пропускной способности, которые ставит на пути работы некоторых устройств 33-мегагерцовая 32-бтная шина PCI.
Есть среди новых возможностей, привносимых в i925/i915, и спорные моменты. К ним следует отнести, прежде всего, появление шины PCI Express x16 для графических карт на безальтернативной основе. Безусловно, возросшая пропускная способность этой шины имеет место, однако современные графические карты вполне нормально способны обходиться и старой AGP 8x. Впрочем, прогресс не стоит на месте, и, скорее всего в недалёком будущем видеокарты смогут использовать все преимущества PCI Express x16. Обидно лишь то, что новые наборы логики не имеют совместимости с распространёнными на рынке AGP 8x решениями.
Абсолютный же минус новых чипсетов i925/i915 – это поддержка DDR2 SDRAM. На данный момент эта память, имеющая большую пропускную способность, но обладающая и более высокой латентностью, чем DDR400 SDRAM, не может обеспечить новым платформам прирост в производительности. По сути, поддержка DDR2 памяти является тормозом для i925/i915, из-за которой эти чипсеты показывают более низкое быстродействие, нежели их предшественники. Мы не станем отрицать перспективность DDR2 SDRAM. Действительно в будущем, с ростом частоты процессорной шины и улучшением характеристик этой памяти, DDR2 может стать реально востребованной. Однако на сегодняшний день использование этой памяти в Pentium 4 платформах положительных эмоций не вызывает.
Ниже мы приводим сводный график падения производительности, получаемой при переходе от i875P к i925X Express в системах с процессорами Pentium 4 (Prescott) и Pentium 4 Extreme Edition (частота процессоров постоянна).
Столь плачевные для i925X результаты вызваны в первую очередь применением в составе системы памяти DDR2 SDRAM. К счастью, семейство чипсетов i915 Express, нацеленное на использование в системах среднего уровня, имеет обратную совместимость с DDR400 SDRAM. Надеемся, что этот факт позволит i915 выступить против i865 более достойно. Однако, практическая проверка этого факта у нас пока остаётся впереди.
Попутно хочется заметить, что процессоры на ядре Prescott работают с новыми чипсетами явно лучше, чем Pentium 4 XE, в основе которых лежит ядро Northwood/Gallatin. Очевидно, что DDR2 SDRAM проявляет себя лучше, когда с этой памятью общаются CPU с более новыми ядрами, обладающие усовершенствованными алгоритмами предвыборки данных.
Вместе с выводом на рынок новых чипсетов Intel перешёл к применению и нового процессорного разъёма, LGA775. С одной стороны такой переход даёт Intel возможность безболезненно проводить дальнейшее наращивание тактовых частот своих процессоров, а также и увеличение частоты шины, однако с другой означает несовместимость новых процессоров и старых плат, как и новых плат и старых процессоров.
В целом, следует заметить, что столь большое количество инноваций, которые Intel ввёл в своих новых платформах с чипсетами i925/i915, приводит к тому, что пользователи начисто лишаются возможности апгрейда. В частности, при переходе от старых платформ к новым, пользователям придётся менять не только материнскую плату и процессор, но и память и графическую карту. Кроме того, в ряде случаев переход на i925/i915 может потребовать и смены жёстких дисков на их Serial ATA варианты, плюс, возможно, кто-то может испытать потребность в переводе периферийного оборудования на шину PCI Express x1. Таким образом, выпуск i925/i915 – это не только технологический рывок и смена стандартов. Это ещё и отличный повод для выкачивания денег из конечных потребителей.
Таким образом, получилась достаточно парадоксальная ситуация. Обновив платформу и добавив большое количество инноваций, порой действительно полезных, Intel одновременно заставляет пользователей менять и процессор, и память, и графическую карту при том, что реальных плюсов от смены всего этого оборудования нет. Нам кажется, что в этих условиях аргументов за переход на новую платформу явно немного. Тем более что в недалёком будущем Intel обновит и свои процессоры, придав им более скоростную шину, больший кеш второго уровня и 64-битные расширения. Когда это произойдёт, возможно, переход на платформу i925/i915 действительно станет вполне аргументируемым действием. А пока старые и проверенные платы на базе i875/i865 вполне могут продолжать нести "боевое дежурство" в наших системах. Час i925/i915 ещё не пробил.