Битва титанов: Athlon 64 FX-51 против Pentium 4 Extreme Edition 3.2 ГГц

Автор: Gavric
Дата: 23.09.2003
Все фото статьи

Введение


День 23 сентября 2003 года ждали многие. Эта дата у большинства из нас уже давно ассоциировалась с началом внедрения процессоров с 64-битной архитектурой на рынок настольных PC. И хотя это не совсем так, поскольку первый 64-битный CPU для настольных систем – это IBM PowerPC G5, вышедший еще в начале лета и применяющийся в компьютерах семейства PowerMac G5, маркетинговые усилия AMD сделали свое дело. Началом новой эры в развитии настольных систем считают сегодняшний день не только наиболее впечатлительные пользователи, но даже консервативные и видавшие виды люди относятся к появлению новых 64-битных Athlon 64 с большим интересом. Действительно, кто знает, ведь может небольшая по сравнению с Intel компания AMD сможет сделать еще один решительный прорыв, как это уже случалось во время выхода процессорного семейства Athlon, и перехватит инициативу в свои руки.
Интерес к процессорам Athlon 64 подогревался давно. По сравнению с первоначальным планом этот CPU появляется на год позже изначально намеченного рубежа. Вышел бы он год назад – безо всяких сомнений Athlon 64 совершил бы революцию. Но, теперь ситуация уже не та. За это время Intel значительно развил свои 32-битные процессоры семейства Pentium 4. За последний год в CPU семейства Pentium 4 появилась и технология Hyper-Threading, и 800-мегагерцовая шина, да и тактовые частоты этих CPU выросли ощутимо. Не будет ли на таком фоне Athlon 64 смотреться слишком бледно? Это и есть главная интрига, из-за которой сегодняшнего дня все ждали с нетерпением.
Кроме того, благодаря совместным стараниям AMD и Intel сегодняшний день войдет в историю и еще по одной причине. Как уже, наверняка известно всем, читающим эту статью, AMD сегодня представляет сразу два семейства своих процессоров, основанных на 64-битной архитектуре AMD64. Это – Athlon 64 и Athlon 64 FX. Первое семейство по замыслу AMD должно ориентироваться на рынок mainstream, второе же на рынок энтузиастов-геймеров, стремящихся выжать из своей системы максимальную производительность. Таким образом, в арсенале AMD оказывается сразу три независимых линейки CPU: Athlon XP, Athlon 64 и Athlon FX. Эти семейства как раз и нацеливаются на разные рынки: value, mainstream и enthusiast. То есть, AMD решила дифференцировать рынок процессоров еще дальше, предлагая каждой категории покупателей свой процессор.
Intel также не остался в стороне от этого начинания и предложил дополнительную линейку процессоров Pentium 4 Extreme Edition, о которой мы еще поговорим сегодня. Эти процессоры по своей производительности и стоимости будут стоять над обычными Pentium 4 и подобно Athlon 64 FX нацеливаться на рынок энтузиастов-геймеров. Так что у Intel теперь также имеется три независимых линейки для каждой категории пользователей – Celeron, Pentium 4 и Pentium 4 Extreme Edition. В результате, на рынке процессоров мы теперь имеем примерно такую же ситуацию, как и на рынке графических карт. Производители поделили целевую аудиторию на части и собираются продавать теперь каждой категории покупателей свой собственный продукт, наиболее отвечающий потребностям и финансовым возможностям этой группы покупателей.
В рамках данной статьи мы сравним новые процессоры от AMD и Intel, которые обе компании будут позиционировать в качестве решений для пользователей-энтузиастов. То есть, наиболее производительные и дорогостоящие CPU от обоих производителей: Intel Pentium 4 Extreme Edition 3.2 ГГц и AMD Athlon 64 FX-51.

AMD Athlon 64 FX-51


Новые процессоры семейств Athlon 64 и Athlon 64 FX, анонсированные сегодня, построены на том же самом ядре с архитектурой AMD64, которое нам уже хорошо известно по процессорам Opteron. Особенностям этого ядра мы уже посвятили несколько статей, поэтому, если вы хотите ознакомиться с этой архитектурой подробнее, обратитесь к следующим материалам:

Взгляд в будущее: процессоры AMD Hammer и технология x86-64

ASUS SK8N + AMD Opteron 144: однопроцессорная рабочая станция на базе AMD Opteron и NVIDIA nForce3 Professional

Вкратце напомним, что процессоры с архитектурой AMD64 основываются на архитектуре классического Athlon XP. Основное отличие новых процессоров от предшественников, благодаря которому эти CPU даже называются процессорами восьмого поколения, это - поддержка технологии AMD64, позволяющей при сохранении полной аппаратной совместимости с существующими приложениями, исполнять и 64-битный код. Внедрение 64-битных режимов повлекло за собой как расширение адресного пространства, так и удвоение количества регистров общего назначения с соответствующим ростом их разрядности до 64 бит. Однако для того чтобы воспользоваться всеми этими преимуществами 64-битных режимов, необходимо программное обеспечение, поддерживающее архитектуру AMD64. Если для серверного рынка, на которое ориентирован AMD64 процессор Opteron, такое программное обеспечение уже существует в виде портированных клонов Linux, веб-серверов, баз данных и т.п., то с процессорами Athlon 64 и Athlon 64 FX дело обстоит несколько хуже. Пользователи настольных систем предпочитают операционные системы семейства Windows. Microsoft же явно не торопится с выпуском 64-битной версии Windows XP для процессоров с технологией AMD64. Да, бета-варианты этой операционной системы существуют, что вселяет некоторые надежды на ее скорое появление, однако, конкретная дата этого события остается неизвестной.
В итоге, на данный момент Athlon 64 и Athlon 64 FX для большинства пользователей оказываются попросту усовершенствованными Athlon XP. Усовершенствований этих не так уж и много, но производительность процессоров от них будет явно выше. Среди них следует отметить:

Интегрированный контроллер памяти, поддерживающий двухканальную и одноканальную DDR SDRAM;

Выделенная шина Hyper-Transport для связи с чипсетом, через который в Athlon 64 системах реализуется поддержка AGP 8x и функций ввода-вывода;

Увеличенный до 1 Мбайта кеш второго уровня с возросшей пропускной способностью шины, связывающей его с ядром;

Поддержка набора инструкций SSE2;

Удлиненный до 12 ступеней целочисленный конвейер и до 17 ступеней - вещественночисленный конвейер (у Athlon XP число ступеней конвейеров 10 и 15 соответственно). Данное усовершенствование направлено на улучшение масштабируемости архитектуры, а также ускоряет декодирование некоторых команд;

Увеличенные буферы целочисленного планировщика (24 вхождения против 18 вхождений у Athlon XP).

Увеличенные размеры TLB. TLB L1 кеша инструкций увеличена с 24 до 40 вхождений, а TLB L2 кеша возросла до 512 вхождений (с 256 у Athlon XP);

Усовершенствованная схема предсказания переходов с увеличенной до 16000 вхождений таблицей истории (с 4000 у Athlon XP).

Основными отличиями новых процессоров, увеличивающими их производительность в обычных задачах, которые почувствовать «на своей шкуре» не составит труда, являются увеличенная кеш-память второго уровня и высокопроизводительный встроенный контроллер памяти с низкой латентностью. Именно эти два нововведения и являются базисом возросшей производительности Athlon 64 и Athlon 64 FX.
Если подходить к новым процессорам AMD с другой стороны, как к очередному улучшению Athlon XP, то можно отметить еще кое-какие интересные детали. AMD уже давно остановилась на пути наращивания тактовых частот. Используемая на Fab30 в Дрездене в настоящее время технология с проектными нормами 0.13 микрон не дает компании увеличивать частоты процессоров выше 2.2 ГГц уже почти год. Однако реальная производительность CPU от AMD растет от модели к модели. Дело в том, что реальное быстродействие CPU зависит как от тактовой частоты, так и от количества исполняемых процессором инструкций за один такт. Именно на повышении второй характеристики и сосредоточены инженеры AMD. За последний год в процессорах Athlon XP уже вырос до 512 Кбайт кеш второго уровня, и два раза увеличивалась частота шины. Это все сказалось на скорости подачи данных и инструкций в процессорное ядро, в результате чего в ряде приложений возросло и число исполняемых инструкций за такт. Athlon 64 и Athlon 64 FX представляют собой еще один шаг в этом направлении. Интегрированный контроллер памяти и вновь расширившийся до 1 Мбайта кеш второго уровня в очередной раз позволят ускорить подачу инструкций и кода в процессорное ядро, что, естественно, выльется в уменьшение простоев исполнительного ядра. Однако, на этот раз это еще не все. Тонкие архитектурные модификации, в частности, изменение алгоритма декодирования команд, увеличат и эффективность процессорного ядра, которое сможет пропускать через себя большее количество команд за такт. Впрочем, заметим сразу, что ускорение декодера команд слабо сказывается на производительности в реальных задачах. Во-первых, оно имеет эффект лишь при достаточно ограниченном наборе инструкций, а во-вторых, ускорение это само по себе не столь значительно.
Что касается тактовых частот новых процессоров, то утешительного тут мало. Хотя выпуск процессоров с архитектурой AMD64 и выполняется при использовании несколько усовершенствованного 0.13-микронного технологического процесса с SOI, частоты Athlon 64 и Athlon 64 FX пока через порог 2.2 ГГц не перепрыгнули. Так, анонсированный сегодня Athlon 64 FX-51 имеет частоту 2.2 ГГц, такую же, как Athlon XP 3200+, а Athlon 64 3200+ и того меньше – 2 ГГц. В ближайшее время AMD представит также Athlon 64 3400+ c частотой 2.2 ГГц. Что же касается более высоких частот, то существует определенная надежда, что модель Athlon 64 FX с частотой 2.4 ГГц все-таки увидит свет при использовании 0.13-микронного процесса производства. Далее, рост частот процессоров семейства AMD64 связывается с переводом производственных мощностей на 90-нанометровую технологию и появлением нового 64-битного процессорного ядра с кодовым именем San Diego.
Посмотрим теперь, чем же отличаются друг от друга массовый Athlon 64 и элитный Athlon 64 FX для пользователей-энтузиастов. По сути, отличий не так уж и много. AMD Athlon 64 – это тот процессор, который AMD планировала выпустить уже давно. Его визитная карточка – одноканальный встроенный контроллер памяти, поддерживающий DDR400/DDR333 SDRAM. Именно такой процессор, правда с достаточно низкой тактовой частотой, был протестирован нами полгода назад. В остальном, никаких отличий от других AMD64 CPU этот продукт не имеет, кроме, разве только, собственного процессорного разъема Socket 754. Что же касается Athlon 64 FX, то идея представления такого продукта возникла у AMD относительно недавно. Выпустить экстремально быстрый процессор для геймеров AMD решила в свете того, что производительность обычного Athlon 64 на частоте 2 ГГц была бы не столь высока, как хотелось бы. Athlon 64 FX – это полный аналог Opteron с двухканальным контроллером памяти. Даже процессорное гнездо он использует то же самое: Socket 940. Единственное, что изменилось, это – маркировка. Поэтому, Athlon 64 FX не лишен некоторых наследственных признаков серверных процессоров. В частности, что выглядит совсем уж странно, Athlon 64 FX требует использования регистровой памяти. Также, AMD говорит и о поддержке регистровой DDR400 SDRAM, однако, ничего нового в этом нет, с памятью такой частоты может работать и Opteron. Другое дело, что регистровая DDR400 SDRAM пока не принята JEDEC и число моделей таких модулей от разных производителей можно сосчитать по пальцам. Впрочем, выход Athlon 64 FX наверняка подтолкнет многих производителей к началу производства такой памяти. Например, сегодня, одновременно с выходом процессоров Athlon 64 FX, была объявлена регистровая DDR400 память от Kingston, которая будет продаваться в числе продуктов серии HyperX, а несколько дней назад о начале поставок аналогичных модулей объявила и OCZ.
В Athlon 64 и Athlon 64 FX появились и некоторые долгожданные изменения, касающиеся конструктивного исполнения корпусировки и защиты от перегрева. В первую очередь отметим появление на CPU крышки, защищающей хрупкий кристалл от повреждения при установке кулеров. Кроме того, помимо встроенного термодиода, в Athlon 64 FX и Athlon 64 появилась, наконец, и собственная схема защиты процессорного ядра от перегрева. Правда, ничего особенного она собой не представляет: при достижении процессором критической температуры он попросту отключается. Однако, отрадно, что AMD все же учла нарекания относительно надежности процессоров, которые частенько высказывались в адрес Athlon и Athlon XP.
Итак, подведем итог всему вышесказанному, собрав данные об анонсированных сегодня Athlon 64 FX-51 и Athlon 64 3200+ в таблице. Для сравнения приведены аналогичные данные и по Athlon XP 3200+.

  Athlon 64 FX-51 Athlon 64 3200+ Athlon XP 3200+
 Корпусировка Socket 940 Socket 754 Socket 462
 Частота 2.2 ГГц 2.0 ГГц 2.2 ГГц
 Технология производства 0.13 мкм, SOI 0.13 мкм, SOI 0.13 мкм
 Число транзисторов 105.9 млн. 105.9 млн. 54.3 млн.
 Площадь ядра 193 кв.мм 193 кв.мм 101 кв.мм
 Номинальное напряжение 1.5В 1.5В 1.65В
 Встроенный контроллер памяти Двуканальный, 128-битный Одноканальный, 64-битный. Нет
 Поддерживаемые типы памяти Регистровая DDR400/ DDR333/ DDR266 SDRAM DDR400/ DDR333/ DDR266 SDRAM -
 Поддержка ECC + + -
 L1 кеш 128 Кбайт (по 64 Кбайта на код и данные) 128 Кбайт (по 64 Кбайта на код и данные) 128 Кбайт (по 64 Кбайта на код и данные)
 L2 кеш 1024 Кбайт (эксклюзивный) 1024 Кбайт (эксклюзивный) 512 Кбайт (эксклюзивный)
 Поддержка SIMD инструкций SSE2/SSE/3DNow! SSE2/SSE/3DNow! SSE/3DNow!
 Поддержка технологии AMD64 + + -

* Заметим, что ввиду того, что память в Athlon 64 и Athlon 64 FX тактуется относительно частоты ядра, реальные частоты для памяти в этом случае составляют 100, 129.4, 157.1 и 200 МГц.

Некоторой неожиданностью является то, что Athlon 64 FX и Athlon 64 используют одно и то же процессорное ядро, несмотря на различия в их архитектуре. Однако для унификации производства AMD использует одни и те же кристаллы для обоих CPU, впрочем также как и для процессоров Opteron. Урезание функциональности производится путем аппаратного отключения тех или иных возможностей.


Родство Athlon 64 FX и Opteron проверяется элементарно. Оба процессора имеют один и тот же CPUID. Например, мы сравнили информацию, выдаваемую утилитой CPUZ на процессоры Athlon 64 FX-51 и Opteron 246.




А вот как выглядит новый Athlon 64 FX-51 (слева) по сравнению с Opteron (справа):




Отрадно, что сегодняшний анонс Athlon 64 FX-51 приурочен к началу продаж этих процессоров. Однако, цена Athlon 64 FX-51, предназначающегося для экстремальных геймеров, малой вам не покажется. AMD установила стоимость этих процессоров в $733.

Pentium 4 Extreme Edition 3.2 ГГц


Оставлять без внимания выход новых процессоров от AMD Intel не захотел. Это и неудивительно. Позиционирование Athlon 64 FX и Athlon 64 таково, что верхний сектор рынка, на который ориентировался Athlon 64 FX, оставался незакрытым со стороны Intel.


Хотя приведенный слайд и сделан силами маркетингового отдела AMD, информация, приведенная на нем, не далека от истины. Athlon 64 FX-51 с заоблачной ценой, нацеленный на рынок энтузиастов-геймеров, не имел симметричной альтернативы со стороны Intel. Поэтому, Intel был вынужден придумывать и свое предложение для этого рынка. Мы не думаем, что такое решение микропроцессорный гигант был вынужден принимать поспешно. Скорее всего, такой ответ готовился достаточно давно, но Intel тщательно скрывал все свои приготовления, чтобы появление семейства Pentium 4 Extreme Edition оказалось полной неожиданностью для конкурента и общественности, произведя достойный эффект.
Итак, несколько дней назад на IDF это семейство было объявлено. Оно, также как и Athlon 64 FX, будет включать продукты немассового характера, предназначенные для самых требовательных пользователей. Первый «пробный шар» Intel в этом направлении – Pentium 4 Extreme Edition 3.2 ГГц, которой нашей тестовой лаборатории удалось заполучить.
Что же представляет собой этот CPU? В принципе, его архитектура неожиданностью не оказалась. Пока новое ядро Prescott у Intel еще не готово, а рост тактовых частот предыдущего, Northwood, уперся в «потолок» 0.13-микронного технологического процесса, Intel использовал тот же прием, который компания уже опробовала на Xeon для двухпроцессорных систем. А именно, к существующему Pentium 4 был попросту добавлена кеш-память третьего уровня.
Кеш этот расположен на одном кристалле вместе с ядром, имеет объем 2 Мбайта и работает на полной частоте процессора. Таким образом, Pentium 4 Extreme Edition оказался своего рода вариантом Xeon MP на ядре Gallatin с другой упаковкой и другой целевой аудиторией. Конечно, инженеры Intel прямо этот факт не подтверждают, говоря о том, что в ядро Gallatin для его применения в Pentium 4 Extreme Edition были внесены кое-какие изменения, направленные на достижение совместимости с 800-мегагерцовой шиной. Но, тем не менее, L3 кеш современного Pentium 4 Extreme Edition имеет точно такое же строение, как и L3 кеш старших Xeon MP. То есть, этот кеш инклюзивный, ассоциативный с 8 областями (8-way) и использующий 64-битную шину.
Вот какую информацию об этом процессоре можно получить, воспользовавшись утилитой CPUZ:


Как видим, это действительно ядро Northwood с добавленной кеш-памятью третьего уровня. Хочется обратить внимание, что ядро степпинга M0, которое обнаруживается в Pentium 4 Extreme Edition, также используется и в новых Xeon DP с мегабайтным кешем третьего уровня. Так что «откуда растут ноги» нового процессора, становится вполне понятно. Отметим, что выпуск Pentium 4 Extreme Edition 3.2 ГГц – это не разовый шаг, призванный поддержать репутацию Intel до выхода процессоров Prescott. Pentium 4 Extreme Edition – это новая полноправная линейка процессоров, которая будет выпускаться Intel и в дальнейшем, в том числе и с использованием ядра Prescott, когда оно появится.
Выпущенная первая модель Pentium 4 Extreme Edition 3.2 ГГц ориентирована на использование 800-мегагерцовой Quad Pumped Bus и, как и все старшие модели Pentium 4, поддерживает технологию Hyper-Threading. Процессоры Pentium 4 Extreme Edition 3.2 ГГц совместимы со всеми современными Socket 478 материнскими платами и не требуют, несмотря на увеличившееся до 169 миллионов транзисторов ядро и возросшее до 94 Ватт типичное тепловыделение, специальных систем охлаждения. Таким образом, все владельцы современных Socket 478 систем при желании легко смогут перейти на Pentium 4 Extreme Edition. Если, конечно, их не остановит цена этого процессора, за который придется выложить порядка $740. Впрочем, пока Pentium 4 Extreme Edition в продаже нет, и появится он не сегодня и не завтра, а в течение месяца-двух.
На фотографии ниже мы привели Pentium 4 Extreme Edition 3.2 ГГц (слева) и обычный Pentium 4 3.2 ГГц (справа).




По внешнему виду новый CPU мало отличается от предшественника. Выдает его, пожалуй, только лишь большее число элементов на оборотной поверхности.

Как мы тестировали


В сегодняшнем тестировании мы свели в едином поединке новые процессоры от AMD и Intel, рассчитанные на применение энтузиастами. То есть, в рамках этого обзора мы протестируем AMD Athlon 64 FX-51 и Intel Pentium 4 Extreme Edition. Athlon 64, относящийся к немного другой ценовой категории, пока окажется обойден вниманием – ему мы посвятим одну из наших следующих статей. Для сравнения в этом обзоре будут приведены и результаты систем, построенных на топовых процессорах предыдущего поколения: Intel Pentium 4 3.2 ГГц и AMD Athlon XP 3200+. Тот факт, что оба эти процессора функционируют на той же частоте, что и их последователи, даст нам возможность делать выводы и об эффективности архитектур AMD Athlon 64 FX и Pentium 4 Extreme Edition.
Следует заметить, что пока из 64-битных операционных систем, поддерживающих процессоры с технологией AMD64 доступны только клоны Linux. Именно поэтому основную часть тестирования нам приходится вновь проводить под 32-битной Windows XP.

Итак, в составе наших тестовых систем использовались следующее оборудование:

Процессоры: AMD Athlon 64 FX-51 (2.2 ГГц), AMD Athlon XP 3200+ (2.2 ГГц, 400 МГц FSB), Intel Pentium 4 3.2 ГГц (800 МГц FSB), Pentium 4 Extreme Edition 3.2 ГГц (800 МГц FSB);
Материнские платы: ASUS P4C800 (i875P), ASUS SK8N (NVIDIA nForce3 Pro 150), ABIT NF7-S 2.0 (NVIDIA nForce2 Ultra 400);
Память: 1024 Мбайт DDR400 SDRAM (2 x 512 Мбайт, 2-2-2-5), 1024 Мбайт Registered DDR400 SDRAM (2 x 512 Мбайт, 2.5-3-3-5);
Видеокарта NVIDIA GeForce FX 5900 Ultra (Detonator 45.23)
Жесткий диск Western Digital WD400JB.

Примечания:

Память во всех случаях эксплуатировалась в наиболее быстром режиме с минимально возможными для данной конфигурации таймингами. Таким образом, системы, не требующие регистровой памяти, работали с DDR400 с таймингами 2-2-2-5, тайминги же для регистровой памяти в Athlon 64 FX системе были установлены в 2.5-3-3-5, поскольку более быстрые регистровые модули пока недоступны на рынке;
Тестирование, если не указано иное, выполнялось в операционной системе Windows XP SP1 с установленным пакетом DirectX 9.0a.


Синтетические тесты: скорость кешей и памяти


Поскольку основные участники сегодняшнего тестирования, AMD Athlon 64 FX и Pentium 4 Extreme Edition, представляют собой архитектурно новые решения, причем в первую очередь в части взаимодействия с памятью, в первую очередь мы решили провести исследование пропускной способности и латентности подсистем памяти этих новинок. Для этого мы воспользовались утилитой Cache Burst 32, являющейся достойной преемницей традиционного Cachemem.




Приведенные графики наглядно демонстрируют все плюсы процессоров новых архитектур, влияющие на скорость памяти. Виден и инклюзивный кеш третьего уровня Pentium 4 Extreme Edition, имеющий вполне достойную пропускную способность, и возросший до 1 Мбайта L2 кеш Athlon 64 FX. Также, видно и то, что интегрированный двухканальный контроллер памяти Athlon 64 FX позволяет этому процессору обеспечить скорость работы с памятью, сравнимую со скоростью работы контроллера памяти чипсета i875P, через который работают процессоры Pentium 4. Однако, все это результаты ожидаемые и вполне логичные.
Есть же среди приведенных данных и некоторые неожиданности. Во-первых, мы наблюдаем возросшую скорость работы кеша второго уровня Athlon 64 FX по сравнению с Athlon XP. Это подтверждает как раз тот факт, что AMD расширила шину, связывающую ядро и L2 кеш процессора до 128 бит. Причем, как показывают более глубокие тесты, на самом деле имеет место двунаправленная шина с шириной 64 бита в каждом направлении. Кроме того, стоит отметить и то, что пропускная способность L1 кеша первого уровня у процессоров Athlon XP и Athlon 64 FX оказывается выше аналогичной характеристики Pentium 4. Впрочем, L1 кеш Pentium 4 замечателен другой характеристикой - своей низкой латентностью, и это мы увидим ниже. Что же касается L2 кешей, то тут по пропускной способности выигрывают Pentium 4, что совсем неудивительно, учитывая, что шина L2 кеша в процессорах этого семейства 256-битная. Пропускная же способность L3 кеша Pentium 4 Extreme Edition приближается к пропускной способности L2 кеша Athlon XP, что говорит о применении для связи L3 кеша с ядром в Pentium 4 Extreme Edition 64-битной шины. К слову, в ядрах семейства Prescott эта шина будет расширена. Ну и, пожалуй, самое интересное это то, что использование большого L3 кеша позволяет увеличить у Pentium 4 Extreme Edition скорость записи в память, выдаваемую нашим тестом.
Для более наглядного сравнения приведем данные из графиков и в виде таблицы:

  Pentium 4 3.2 Pentium 4 3.2 EE (2MB L3) Athlon XP 3200+ Athlon 64 FX-51
 L1 cache read speed, MB/s 23108 23295 26309 29260
 L2 cache read speed, MB/s 12915 12920 6667 10145
 L3 cache read speed, MB/s - 6522 - -
 Memory read speed, MB/s 3699 3686 1778 3436
 L1 cache write speed, MB/s 10793 10789 16424 16431
 L2 cache write speed, MB/s 10802 10799 6512 8293
 L3 cache write speed, MB/s - 7236 - -
 Memory write speed, MB/s 1416 2142 1226 2314

Посмотрим теперь, какие же результаты покажут наши системы при исследовании не менее важной характеристики – латентности.


Измеренные латентности приводятся на графике в процессорных циклах. Поэтому, сравнивать их между собой можно только для процессоров с одинаковой тактовой частотой. Интересные факты можно подметить и тут. Например, латентность L3 кеша у Pentium 4 Extreme Edition получается очень даже не плохой: примерно всего лишь в два раза больше латентности L2.
Для более корректного сравнения приведем латентности, переведенные из процессорных циклов во время.


Этот график дает больше пищи для размышления. И в первую очередь в глаза бросается тот факт, что латентность подсистемы памяти Athlon 64 FX очень низкая даже по сравнению с двухканальными контроллерами памяти, применяемыми в интеловских платформах. Вот где интегрированный двухканальный контроллер памяти проявляет себя в полную силу! И ведь это далеко еще не предел. Как известно, регистровая память имеет несколько большую латентность, чем нерегистровая, поэтому, при модификации контроллера памяти Athlon 64 FX, которую AMD собирается осуществить в следующем году, скорость работы процессоров этого семейства возрастет еще сильнее.
Те же данные, но в виде таблицы:

  Pentium 4 3.2 Pentium 4 3.2 EE (2MB L3) Athlon XP 3200+ Athlon 64 FX-51
 L1 cache latency, cycles 2 2 3 3
 L2 cache latency, cycles 19 19 20 13
 L3 cache latency, cycles - 43 - -
 Memory latency, cycles 204 206 180 125
 L1 cache latency, ns 0.63 0.63 1.36 1.36
 L2 cache latency, ns 5.94 5.94 9.09 5.90
 L3 cache latency, ns - 13.44 - -
 Memory latency, ns 63.75 64.38 81.82 56.81

Хочется отметить, что сильным козырем архитектуры Pentium 4 является чрезвычайно низкая латентность кеша первого уровня. Правда, при этом он имеет и маленький размер – всего лишь 8 Кбайт. L1 кеш Athlon 64 FX медленнее, но и значительно больше. Латентность кешей второго уровня после усовершенствования шины L2 кеша в Athlon 64 FX примерно сравнялась у новых процессоров от Intel и AMD. Поэтому, за счет в два раза большего объема кеш Athlon 64 FX может дать этому CPU некоторый выигрыш.

Синтетические тесты: скорость SSE2 в Athlon 64 FX


Еще одно нововведение, появившееся в Athlon 64 и Athlon 64 FX – это встроенный блок SSE2. Он, также как и в Pentium 4 присутствует в этих процессорах в единственном числе, поэтому было бы интересно оценить его эффективность. Во время нашего тестирования Opteron 144 мы уже задавались этим вопросом и при помощи теста BLAS из пакета ScienceMark 2.0 пришли к выводу, что скорость работы SSE2 блока в процессорах архитектуры AMD оказывается не так уж и высока, как того хотелось бы. Попробуем посмотреть на эту проблему снова, вооружившись другим синтетическим тестом, SiSoft Sandra 2003. В состав Sandra 2003 входит два бенчмарка, способных измерять производительность SSE2 блока: переписанный под SSE2 инструкции известный тест Whetstone С 2.0 и бенчмарк, построенный на измерении скорости расчета множества Мандельброта. Приведем результаты обоих:






Как мы видим, производительностью своего SSE2 блока Athlon 64 FX не блещет. Виной тому как низкая частота этого процессора по сравнению с частотами Pentium 4, так и не совсем удачная реализация SSE2 блока. В общем, можно говорить о том, что поддержка SSE2 введена в новые CPU от AMD просто формально. Инженеры AMD не стали заботиться о высоком быстродействии этого блока, понадеясь, что это попросту не нужно. Впрочем, теперь AMD действительно догнала Intel по числу используемых в процессоре наборов SIMD расширений (3DNow! в расчет не берем). Такая ситуация продлится еще пару-тройку месяцев, пока Intel не выпустит свой процессор Prescott, в котором будет добавлено несколько новых SIMD инструкций, предназначенных для перевода чисел с плавающей точкой в целые, операций с комплексными числами и декодирования видео.

Производительность: офисные приложения и приложения для создания цифрового контента


Переходим к тестированию в реальных приложениях. Оговоримся еще раз, что, несмотря на поддержку процессором AMD Athlon FX-51 технологии AMD64, для тестов мы использовали обычную 32-битную версию Windows XP. Вызвано это тем, что из 64-битных операционных систем, поддерживающих x86-64 инструкции, на данный момент доступны только клоны Linux, которые индивидуальные пользователи не очень-то жалуют.
В первую очередь мы уделили внимание тестированию в офисных приложениях и приложениях для создания и редактирования видео и аудио файлов. Для этих тестов мы использовали популярный пакет Winstone.


В тесте Business Winstone 2002, показывающем производительность систем в типичных офисных приложениях вроде MS Word, Excel или Access, первое место занимает Athlon 64 FX-51. Данный факт нисколько не удивляет нас, поскольку даже процессоры предыдущего поколения, Athlon XP, показывали в этом бенчмарке хорошие результаты. Что касается Pentium 4 Extreme Edition, то добавление в этот процессор 2-мегабайтного кеша третьего уровня позволило увеличить его производительность по сравнению с обычным Pentium 4 на 5%. Однако, этого оказывается явно недостаточно для соперничества на равных с новым CPU от AMD.


В Multimedia Content Creation Winstone 2003, в котором проверяется скорость работы систем с цифровым контентом, ситуация несколько иная. Хотя Athlon 64 FX-51 работает здесь быстрее своего предшественника на 26%, благодаря большему кешу второго уровня, поддержке SSE2 и интегрированному контроллеру памяти, обогнать Pentium 4 Extreme Edition ему не удается, поскольку добавление в этот CPU L3 кеша несколько ускорило NetBurst архитектуру.

Производительность: приложения для кодирования данных


Перед тем, как перейти непосредственно к результатам, напомним, что в данном типе приложений процессоры от AMD никогда не были сильны. NetBurst архитектура, специально оптимизированная для обработки потоковых данных, в задачах этого типа проявляет себя с лучшей стороны.


Скорость работы в WinRAR очень сильно зависит от производительности подсистемы памяти. Как мы видели на примере синтетических тестов, в этом отношении Athlon 64 FX-51 значительно превосходит предшественников и оказывается даже быстрее конкурирующих CPU. Поэтому, совершенно неудивительно, что Athlon 64 FX-51 удается обогнать Pentium 4 3.2. Однако, Pentium 4 Extreme Edition 3.2 ГГц, в котором присутствует объемный кеш третьего уровня, также работает при сжатии информации более эффективно, чем предшественник. В итоге, Athlon 64 FX-51 победителем все-таки не становится, уступая Pentium 4 Extreme Edition 3.2 ГГц в быстродействии на 4.7%.


Кодирование mp3 файлов наоборот, задача, в первую очередь нагружающая вычислительные блоки процессора, включая и SSE/SSE2. С тех пор, как Intel реализовал в своих CPU технологию Hyper-Threading, Pentium 4 стал справляться с задачей кодирования mp3 лучше, чем процессоры конкурентов. Как видим, Athlon 64 FX-51 переломить ситуацию не смог. Архитектура его вычислительных блоков осталась практически той же, что и в Athlon XP, тактовая частота не выросла, а на производительность подсистемы памяти кодеку LAME, мягко говоря, наплевать. К слову, принудительное включение использования SSE/SSE2 инструкций при тестировании Athlon 64 FX-51 его результатов в этом тесте, к сожалению, не улучшает. Как уже было подмечено, похвастать скоростным исполнением SSE2 инструкций Athlon 64, к сожалению, не может.


Тестирование скорости кодирования видео из AVI в MPEG2 выводит в победители процессор Athlon 64 FX-51. Появление в нем поддержки SSE2 инструкций и значительное ускорение подсистемы памяти дало возможность ускорить этот процесс по сравнению с Athlon XP 3200+ на 13.3%. Данный прирост производительности обеспечивает уверенное превосходство новичка от AMD даже над Pentium 4 Extreme Edition, L3 кеш которого при данном виде кодирования совершенно не помогает.


NetBurst архитектура процессоров Pentium 4, их высокоскоростная 800-мегагерцовая шина, поддержка технологии Hyper-Threading и SSE2 инструкций ранее не оставляла процессорам Athlon XP в данном бенчмарке шансов на реванш. С выходом Athlon 64 FX-51 ситуация поменялась: теперь SSE2 и быстрая подсистема памяти появились и в процессорах от AMD. В итоге, Athlon 64 FX-51 смог по своей скорости в данной задаче практически сравняться с Pentium 4 3.2 ГГц. Однако, последний штрих от Intel, добавление в свой новейший CPU L3 кеша, разрушил призрачные надежды Athlon 64 FX-51 на успех. В итоге, мы имеет лидерство Pentium 4 3.2 Extreme Edition примерно в 3.6%.


В Windows Media Encoder 9 для Athlon 64 FX-51 картина несколько печальнее. Хотя Athlon 64 FX-51 работает здесь примерно на 11% быстрее Athlon XP 3200+, догнать даже обычный Pentium 4 3.2 ГГц он не в состоянии, не говоря уже о Extreme Edition, который работает быстрее обычного процессора на 2.1%.

Производительность: игровые приложения


Обе серии, и Athlon 64 FX, и Pentium 4 Extreme Edition позиционируются производителями в первую очередь как решения для экстремальных геймеров. Поэтому именно данный раздел нашего тестирования представляет наибольший интерес. Посмотрим, как проявят себя новые процессоры в современных играх.


В популярном тесте 3DMark2001 SE процессор для геймеров от AMD совсем немного превосходит процессор для геймеров от Intel. Разница – менее процента, что не позволяет говорить об однозначном лидерстве какого-либо из процессоров.


Тест CPU из пакета 3DMark03, выполняющий алгоритмы шейдеров при помощи вычислительных мощностей центрального процессора, выводит вперед Athlon 64 FX-51. Его превосходство над Pentium 4 Extreme Edition 3.2 ГГц составляет 8.7%, а над обычным Pentium 4 – и вовсе целых 18%.


Общий же результат 3DMark03 оказывается в пользу обоих Pentium 4. С чем связана такая разноголосица, сказать наверняка трудно. Однако мы склоняемся к мысли, что дело в лучшей оптимизации драйвера Detonator для NetBurst архитектуры.


Для данного тестирования мы также воспользовались недавно вышедшим тестом Aqumark3. Этот новый тест основывается на реальном игровом движке с поддержкой DirectX 9 и первый из игровых 3D приложений умеет использовать технологию Hyper-Threading. Это сказывается и на результатах: даже обычный Pentium 4 слегка обгоняет Athlon 64 FX-51. Все-таки жаль, что AMD так и не реализовала в своих процессорах аналог этой чрезвычайно полезной технологии.


Тест CPU из Aqumark3 и вовсе ставит Athlon 64 FX-51 в некрасивое положение. Его отставание от Pentium 4 3.2 увеличивается до 7.3%, а от Pentium 4 Extreme Edition – до 11.2%. Надо сказать, что это тревожный знак для всей линейки Athlon 64 и Athlon 64 FX. Дело в том, что поддержка Hyper-Threading будет постепенно появляться в новых играх. В частности, главные хиты конца этого года Half-Life 2 и Doom III, по заявлениям производителей, будут использовать Hyper-Threading.


Традиционно лидировавшие в Quake3 с момента их появления процессоры семейства Pentium 4 оказываются повержены Athlon 64 FX-51. Благодаря быстрой подсистеме памяти Athlon 64 FX-51 обгоняет Pentium 4 3.2 ГГц на 5.6%. Однако, добавление к Pentium 4 кеш-памяти третьего уровня размером 2 Мбайта плодотворно сказывается на производительности и этого процессора, увеличивая его результат на целых 13.3%. И в итоге, Athlon 64 FX-51 все же проигрывает Pentium 4 Extreme Edition.
Однако, как недавно выяснилось, низкая производительность процессоров AMD в Quake3 обуславливается низким качеством оптимизации этого игрового движка под процессоры семейств Athlon XP и Athlon 64. Не так давно в сети появились специально оптимизированные для архитектуры этих процессоров .dll для Quake3. Естественно, мы заинтересовались и вопросом производительности процессоров AMD при использовании более оптимизированного кода.


Как сильно все меняется! Теперь уже Athlon 64 FX-51 значительно превосходит не только обычный Pentium 4, но и Pentium 4 Extreme Edition. Таким образом, всем любителям Quake3, использующим процессоры Athlon XP, Athlon 64 и Athlon 64 FX мы рекомендуем пользоваться оптимизированными .dll.


В игре Unreal Tournament 2003 традиционно лидируют процессоры от AMD. Видимо, Epic, в отличие от id Software, не на шутку озаботился оптимизацией своего кода под архитектуру процессоров от AMD. В результате, Athlon 64 FX-51 обгоняет Pentium 4 3.2 ГГц на 31.5% и Pentium 4 Extreme Edition 3.2 ГГц на 22.9%. К слову, столь трепетное отношение Epic к AMD приведет, по всей видимости, и к тому, что выходящий вскоре Unreal Tournament 2004 окажется первой игрой, оптимизированной для x86-64 архитектуры.


Также превосходство нового CPU от AMD обнаруживается и в Serious Sam: The Second Encounter.


Хотя Splinter Cell построен на том же движке, что и Unreal Tournament 2003, преимущество Athlon 64 FX-51 в этой игре не столь очевидно. Тем не менее, этот CPU от AMD все-таки опережает Pentium 4 Extreme Edition 3.2 ГГц с 2-мегабайтным кешем третьего уровня.


Подобная ситуация прослеживается и в новой игре Gun Metal, построенной на собственном движке.


А вот в бенчмарке, основанном на красивой игре космической тематики X2 – The Threat, позиции Athlon 64 FX-51 не столь сильны. И он, хотя и обгоняет старшую модель Pentium 4, вынужден отступить под натиском Pentium 4 Extreme Edition 3.2 ГГц.
В целом, отметим, что в большем числе случаев в современных играх лидирует новичок от AMD. Однако не следует забывать, что вскоре рынок игр сильно изменится в свете выхода нескольких давно ожидаемых боевиков. И как себя поведут процессоры в тех же Half-Life 2 или Doom III, сказать пока невозможно.

Производительность: Photoshop


Adobe Photoshop 7.01 – очень популярное приложение, которое многие используют для редактирования двухмерной графики, поэтому тестам в этом пакете мы уделили отдельное внимание. Для тестирования нами использовался бенчмарк PSBench с 50-мегабайтным изображением, седьмая версия которого стала недавно доступна.


Хотя при тестировании в Photoshop Athlon 64 FX-51 превосходит работающий на той же частоте Athlon XP 3200+ на 14%, благодаря в первую очередь поддержке SSE2 инструкций, этого оказывается недостаточно для обгона системы на базе Pentium 4. Кстати, весьма любопытно, что кеш третьего уровня, появившейся в Pentium 4 Extreme Edition вообще никак не сказывается на скорости работы в этом графическом редакторе.
Приведем и более подробные результаты, показывающие скорость работы различных фильтров Photoshop 7.01 на протестированных системах. В таблице показано время в секундах:

  Pentium 4 3.2 Pentium 4 3.2 EE (2MB L3) Athlon XP 3200+ Athlon 64 FX-51
 Rotate 90 0.1 0.1 0.2 0.1
 Rotate 9 2.3 2.4 2.5 1.9
 Rotate .9 2.2 2.2 2.3 1.8
 Gaussian Blur 1 0.6 0.6 0.7 0.6
 Gaussian Blur 3.7 1.6 1.6 2.6 1.7
 Gaussian Blur 85 1.8 1.9 3 1.9
 Unsharp 50/1/0 0.8 0.8 0.8 0.7
 Unsharp 50/3.7/0 1.8 1.8 2.7 1.8
 Unsharp 50/10/5 1.8 1.8 2.8 1.8
 Despeckle 2.1 2.1 2.5 2.4
 RGB-CMYK 6.9 6.9 7.8 6
 Reduce Size 60% 0.8 0.8 1.1 0.9
 Lens Flare 2.2 2.3 3.7 3.5
 Color Halftone 1.9 1.9 2.6 2.1
 NTSC Colors 1.8 1.8 1.7 1.5
 Accented Edges 9.9 9.8 9.8 9.4
 Pointillize 11.3 11.4 17.3 16.9
 Water Color 24 24 21.2 20.1
 Polar Coordinates 5.5 5.5 7.7 6.6
 Radial Blur 30.9 30.9 41.3 32.8
 Lighting Effects 1.6 1.6 1.9 1.7


Производительность: 3D рендеринг






Усовершенствование ядра процессора Athlon 64 FX дает ощутимый эффект в виде ускорения рендеринга в 3d studio max 5.1. Однако, технология многопоточности Pentium 4, эффективно задействуемся этим приложением, не дает процессорам от AMD проявить себя. Отставание Athlon 64 FX-51 даже от обычного Pentium 4 весьма значительно, не говоря уже об Extreme Edition.




А вот в Lightwave 7.5 ситуация иная. Появившаяся в процессорах архитектуры AMD64 поддержка SSE2 инструкций значительно увеличила их производительность в этом пакете. В итоге, даже Pentium 4 Extreme Edition 3.2 ГГц, имеющий 800-мегагерцовую шину, 2-мегабайтный кеш третьего уровня и поддерживающий Hyper-Threading, отстает от Athlon 64 FX-51.


CINEMA4D подобно 3ds max 5.1 эффективно задействует Hyper-Threading, аналога которого так не хватает в Athlon 64 FX. В результате, даже обычный Pentium 4 3.2 ГГц обгоняет новый конкурирующий продукт на 22%.


A вот новая версия Maya 5.0 относится к архитектуре Athlon 64 более лояльно. Как мы видим, Athlon 64 FX-51 в этом бенчмарке является лидером.

Производительность: научные расчеты


В роли теста производительности CPU при научных расчетах выступает новая бета-версия пакета ScienceMark 2.0, измеряющая скорость решения различными платформами реальных задач математического моделирования.






Один из существенных плюсов архитектуры Athlon – мощный блок FPU, который как раз и задействуется в подобных приложениях. Поэтому, совершенно неудивительно, что в ScienceMark 2.0 достаточно высокую производительность показывает даже Athlon XP 3200+. Усовершенствование же этого процессора до Athlon 64 FX-51 поднимает быстродействие на еще более высокий уровень. Топовые процессоры Pentium 4 и Pentium 4 Extreme Edition ничем выдающимся в данном случае похвастать не могут.

Производительность: профессиональные OpenGL задачи


В этом разделе мы посмотрим на производительность наших тестовых платформ в окнах проекции CINEMA4D и в AutoCAD 2002.




При использовании встроенного в CINEMA4D алгоритма затенения лидирует Athlon 64 FX-51. По всей видимости, большая вычислительная мощность этого CPU оказывается в данном случае как нельзя более кстати. Что же касается второго теста, где основная часть работы возлагается на OpenGL драйвер, то в этом случае на высоте оказываются процессоры Pentium 4 и Pentium 4 Extreme Edition.










Тестирование, проведенное нами в AutoCAD 2002 при помощи теста Cadalyst C2001 показывает, что в этом популярном пакете автоматизированного проектирования процессор Athlon 64 FX-51 обеспечивает более высокую производительность кроме тех случаев, когда дело доходит до 3D-визуализации. Высказанное выше наше подозрение о лучшей оптимизации драйверов NVIDIA для процессоров семейства Pentium 4 вновь находит еще одно подтверждение.

Windows XP 64-Bit Edition: первый взгляд


Несмотря на то, что 64-битной версии Windows XP c поддержкой технологии AMD64 пока нет, это не значит, что ее не будет никогда. Хотя Microsoft не называет никаких конкретных сроков, работа над такой версией операционной системы ведется. В настоящее время доступны пре-бета релизы так называемой Windows XP 64-Bit Edition. Один из таких релизов, за номером сборки 3790 оказался в нашем распоряжении во время тестирования процессора AMD Athlon 64 FX-51.


Обращаем внимание на надпись Physical Address Extension на скриншоте с окна свойств этой версии. Наличие этой надписи означает то, что данная операционная система с данным процессором может работать с адресами длиной более 32 бит, что является одной из отличительных черт этой связки. Также, очень похоже, что в основе Windows XP 64-Bit Edition используется ядро от операционной системы Windows 2003, а не от классической XP. В пользу такого подхода говорит и то, что версия системы для AMD64 процессоров, которая как известно может работать и на двухпроцессорных системах, должна поддерживать технологию NUMA (Non-Uniform Memory Access), реализация которой как раз и появилась в Windows 2003 Server.
Впечатления от той версии Windows XP 64-Bit Edition, которую мы видели, остались вполне благоприятные. Это система работоспособна и на первый взгляд функционирует без ошибок. В состав системы входят также два портированных для системы команд x86-64 приложения: Internet Explorer 6.0 и Outlook Express 6. Остальные приложения на данный момент поставляются в стандартном 32-битном варианте.
Одна из сильных сторон архитектуры AMD64 – это обратная совместимость процессоров, работающих в 64-битных режимах, с 32-битным кодом. Таким образом, в Windows XP 64-Bit Edition обычные 32-битные приложения могут исполняться без каких-либо проблем. Однако, что касается драйверов для этой системы, то тут ситуация несколько иная. Со старыми 32-битными драйверами система, работать не может, а производители оборудования, судя по всему, явно не торопятся с созданием их 64-битных вариантов для AMD64. К настоящему моменту нам удалось получить бета-драйвера для Windows XP 64-Bit Edition только лишь от NVIDIA.
Но основная соль 64-битной версии Windows заключается в том, что помимо исполнения стандартных 32-битных приложений, которые работают и в обычных версиях Windows XP, Windows XP 64-Bit Edition может выполнять и специально написанные для нее задачи, имеющие возможность пользоваться всеми ресурсами AMD64 процессоров, такими как 64-битная адресация и все шестнадцать 64-битных регистра общего назначения. За счет использования этих ресурсов задачи, портированные на Windows XP 64-Bit Edition, теоретически должны работать быстрее, чем на стандартной Windows XP. К сожалению, в настоящий момент говорить что-то конкретное о появлении приложений, написанных для Windows XP 64-Bit Edition достаточно сложно. Некоторое число софтверных разработчиков выразило свою готовность выпустить соответствующие клоны программ, однако для этого должно быть продано ощутимое число процессоров с архитектурой AMD64 вместе с 64-битными операционными системами. Пока же нет как финальной версии 64-битной операционной системы, так и сами процессоры с архитектурой AMD64 только-только начинают свое проникновение на рынок. В итоге, большое, если не решающее значение после появления Windows XP 64-Bit Edition приобретёт скорость работы в этой операционной системе обычных 32-битных приложений.
В связи с этим мы решили прикинуть, как же работают 64-битные и 32-битные приложения в Windows XP 64-Bit Edition. За неимением нормальных 64-битных приложений и тестов, для тестирования скорости работы Athlon 64 FX-51 с 64-битным кодом под Windows, нам пришлось пользоваться синтетическими бенчмарками. Мы применяли три небольших утилиты, скомпилированные как под 64-битную, так и под 32-битную версию Windows. В их числе:

DivX Encoder – бенчмарк, измеряющий скорость кодирования видео потока;
Mini-GZIP – бенчмарк, реализующий известный алгоритм сжатия информации;
RSA – набор бенчмарков, измеряющих производительность стандартных криптографических алгоритмов.

Исходный код всех трех бенчмарков был предварительно оптимизирован для архитектуры AMD64. Поэтому, приведенные результаты представляют собой некий «идеальный» случай. Тем не менее, в какой-то мере они позволят нам оценить, каков же тот максимальный выигрыш в скорости, который можно будет получить на Athlon 64 и Athlon 64 FX при перекомпиляции программ с использованием системы команд x86-64. Также заметим, что алгоритмы, лежащие в основе использованных тестов, не работают с большими объемами данных. Поэтому, говорить о комплексной производительности 64-битных процессоров AMD под 64-битными Windows, опираясь на полученные результаты, не следует.
Итак, в следующей таблице сведены данные по времени выполнения перечисленных тестов:

  Win32, 32-bit .exe Win64, 32-bit .exe Win64, 64-bit .exe
 Minigzip   
 Zip, sec 9.6 9.6 4.3
 Unzip, sec 0.7 0.7 0.3
 RSA   
 AES-128 Encrypt, sec 3.5 3.5 2
 AES-128 Decrypt, sec 3.6 3.5 2.5
 Triple-DES Encrypt, sec 6.9 7 6.6
 Triple-DES Decrypt, sec 6.9 7 6.6
 RC4 Encrypt, sec 2.3 2.3 2
 RC4 Decrypt, sec 2.3 2.4 2
 RSA Encrypt (key size = 4096, number of primes = 2), sec 4.6 4.5 1.4
 RSA Decrypt (key size = 4096, number of primes = 2), sec 14.1 14 3.1
 SHA-1 Digest, sec 3.8 3.8 3.5
 DivX   
 DivX, sec 8.9 9.1 7.6

Как видим, прирост производительности от перехода на использование преимуществ 64-битной архитектуры новых процессоров AMD может быть весьма значительным. Ускорение от простой перекомпиляции в некоторых криптографических задачах может измеряться не процентами, а даже разами. При этом, как видим, скорость выполнения 32-битного кода на 64-битной системе отнюдь не падает – в том-то как раз и заключается преимущество x86-64.
Однако мы недаром оговорились, что речь идет о тех приложениях, где обращения к памяти сведены к минимуму. Дело в том, что перекомпиляция 32-битных адресов, которыми оперируют 32-битные приложения, в 64-битной системе может снижать производительность. Для доказательства этого факта позволим себе привести результаты известного бенчмарка Stream, скомпилированного как под 32-битный, так и под 64-битный вариант Windows XP:

  Win32, 32-bit .exe Win64, 32-bit .exe Win64, 64-bit .exe
 Copy (MB/s) 5453 5342 5299
 Scale (MB/s) 5439 5370 5395
 Add (MB/s) 5319 5253 5304
 Triad (MB/s) 5354 5277 5298

И вот тут-то нас поджидает неприятный сюрприз. 64-битная адресация немного снижает производительность операций с памятью, а использование 32-битного кода под 64-битным Windows XP замедляют операции такого типа еще сильнее. Правда, падение производительности в синтетическом тесте Stream вряд ли можно считать критическим: разница между скоростью памяти при использовании 32-битного кода в 32-битной и 64-битной операционной системе не превышает 2%. Однако, это только начало.
Использование не синтетических тестов, а нормальных 32-битных приложений под Windows XP 64-Bit Edition потребует от операционной системы некоторых дополнительных действий, направленных на организацию взаимодействия со средой и 64-битными драйверами. За примерами далеко ходить не надо. Вот результаты нескольких наших обычных 32-битных бенчмарков, запущенных в Windows XP 64-Bit Edition:

  Win32, 32-bit .exe Win64, 32-bit .exe
 ScienceMark 2.0, Molecular Dynamics Benchmark, sec 79.77 84.73
 ScienceMark 2.0, Primordia, sec 378 385.67
 ScienceMark 2.0, Cipher, sec 12.19 12.52
 3ds max 5.1, Final Rendering, Underwater, sec 267 273
 3DMark2001 SE, Default 18912 15346
 Quake3 (four), High Quality, 1024x768x32 451.5 75.1
 Unreal Tournament 2003 (dm-antalus), 1024x768x32 86.38 77.32

Как это не прискорбно, но 32-битные приложения работают в 64-битной версии Windows XP медленнее. И если в случае 3D приложений неудачу можно списать на NVIDIA, которая пока не доделала свой графический драйвер для платформы Win64 (на это явно указывает провал производительности в Quake3), то тесты в ScienceMark 2.0 от драйверов графики не зависят никоим образом. Тем не менее, при переходе на Windows XP 64-Bit Edition мы наблюдаем падение производительности, достигающее 6%.
Если данный недостаток не будет исправлен в последующих сборках Windows XP 64-Bit Edition, то 64-битный режим новых процессоров AMD, да и саму Windows XP 64-Bit Edition, ожидает тяжелая судьба. Просто так на эту платформу никто переходить не станет, для совершения такого перехода нужны будут веские основания, такие как, например, выход более быстрых 64-битных вариантов приложений, производительность в которых действительно критична. Например, 3D игр или утилит для обработки мультимедиа файлов.

Выводы


В нескольких словах сформулировать выводы из огромного полученного нами практического материала достаточно сложно. Тем не менее, попробуем. Оба основных производителя процессоров, Intel и AMD решили начать внедрение отдельных линеек процессоров для пользователей энтузиастов, к которым, по мнению обоих компаний, относятся в первую очередь хардкорные геймеры. Теперь лица, относящие себя к этой категории, будут вынуждены выбирать между Athlon 64 FX и Intel Pentium 4 Extreme Edition.
Что касается анонсированного сегодня процессора Athlon 64 FX-51, то это первый CPU с архитектурой AMD64 для рынка настольных систем. Фактически, представляя собой аналог Opteron с частотой 2.2 ГГц, Athlon 64 FX-51 действительно показывает высокую производительность и в большинстве тестов превосходит Intel Pentium 4 3.2 ГГц, являвшийся самым быстрым CPU для настольных систем до сегодняшнего дня. Имея двухканальный контроллер памяти, кеш-память общим объемом 1152 Кбайта и поддерживая набор инструкций SSE2, Athlon 64 FX-51 стал гораздо быстрее своего предшественника, Athlon XP 3200+.
Кроме того, внимания заслуживает и технология AMD64, реализованная в новом CPU от AMD. Использование 64-битных приложений, которых, правда, пока нет, теоретически может сильно увеличить привлекательность платформы от AMD. В этой связи нам остается только надеяться на Microsoft и разработчиков программного обеспечения, потому что 64-битный режим новых процессоров от AMD скрывает в себе немалый потенциал.
Intel ответил на выпуск Athlon 64 FX-51 анонсом процессора Pentium 4 Extreme Edition 3.2 ГГц, имеющего кеш третьего уровня объемом 2 Мбайта. Этот достаточно простой шаг позволил добиться улучшения уровня производительности в реальных приложениях до 15%, однако средняя величина этого прироста составляет всего лишь 3.5%. Наибольшую эффективность кеш третьего уровня имеет в играх, что еще раз подтверждает направленность этого CPU на рынок игровых платформ. Появление Pentium 4 Extreme Edition 3.2 ГГц, реальные продажи которого начнутся через месяц-два, может слегка поколебать позиции Athlon 64 FX-51. Тем более что технология Hyper-Threading, таящая в себе значительный потенциал для увеличения производительности и реализованная в Pentium 4 Extreme Edition в самое ближайшее время начнет применяться в играх.
Пока же расклад сил выглядит следующим образом. За новым процессором от Intel остается превосходство в скорости обработки потоковых данных и приложениях для кодирования мультимедиа файлов, а также большее быстродействие в приложениях, способных эффективно использовать многопоточность, например в 3ds max или в Photoshop. Новичок от AMD при этом уверенно побеждает в научных расчетах, при использовании офисных приложений и, при некоторых оговорках, в современных 3D играх.
И в заключение пару слов хочется сказать о дальнейших перспективах процессоров семейств Athlon 64 FX и Pentium 4 Extreme Edition. Обе линейки этих процессоров в настоящий момент производятся при использовании 0.13-микронного технологического процесса (плюс технология SOI у AMD). Предел по частотам кристаллов эти технологические процессы уже исчерпали, это подтверждают и наши опыты по разгону протестированных CPU. Максимальная частота, которой нам удалось достичь при разгоне Pentium 4 Extreme Edition составила 3.6 ГГц (напряжение питания обоих CPU мы увеличили при разгоне на 0.1В), а предельная частота для Athlon 64 FX-51 немного не дотянула до 2.4 ГГц. Это значит, что последующие модели в обоих линейках будут скорее всего выпускаться уже по новому, 90-нанометровому техпроцессу. Поэтому, во многом будущий успех Athlon 64 FX и Pentium 4 Extreme Edition будет связан с расторопностью компаний при переводе оборудования на новую технологию.