ATI RADEON X1000: Новая графическая архитектура от ATI Technologies

Автор: Vader
Дата: 07.10.2005
Все фото статьи
Введение

Обычно ведущие графические компании анонсируют решения нового поколения в начале или в самом конце года, причем, происходит это практически одновременно, с интервалом не более 1-2 месяцев. Так было в 2003 году: 12 марта увидел свет графический процессор ATI R350, а 12 мая NVIDIA представила на суд публики NV35. Повторилась ситуация и на следующий год - 14 апреля NVIDIA объявила графический процессор NV40, а уже 4 мая ATI Technologies ответила на это анонсом R420. Но совсем по-иному сложилась ситуация в этом году, и традиция оказалась нарушенной.

До 22 июня 2005 года ATI удавалось удерживать лидерство в области производительности – RADEON X850 XT/XT Platinum Edition в ряде тестов значительно опережали GeForce 6800 Ultra, и NVIDIA могла ответить на это лишь с помощью multi-GPU технологии SLI. Но в этот день все изменилось – на свет появился графический процессор NVIDIA G70, ознаменовавший рождение продуктовой линейки GeForce 7. NVIDIA не стала устраивать революцию; новинка в лице GeForce 7800 GTX вобрала в себя все преимущества архитектуры GeForce 6 и, благодаря наличию 24 усовершенствованных пиксельных конвейеров и 8 вершинных процессоров, моментально стала самым быстрым 3D-решением бытового класса. К тому же, NVIDIA смогла наладить массовые поставки новых видеоадаптеров в кратчайшие сроки, что в значительной мере поспособствовало укреплению компании в секторе high-end; ей даже удалось отвоевать несколько OEM-контрактов у ATI, в частности, на поставку GeForce 7800 GTX для высокопроизводительных ПК Dell. Несколько позже, компанией была представлена еще одна новинка – GeForce 7800 GT, также показавшая отличные результаты.

Ответа со стороны ATI Technologies не последовало ни в первый, ни во второй раз, хотя реакция компании была бы определенно нелишней. Массовое появление на рынке решений с архитектурой GeForce 7 аннулировало паритет между двумя гигантами графического рынка, и ситуация все больше начала склоняться в пользу NVIDIA, так как ответить ATI было нечем – появление на поле боя очередного орудия возмездия явно задерживалось. Первоначально анонс графического процессора нового поколения ожидался в июне этого года, но затем стали называться более поздние сроки – июль, август, и даже сентябрь 2005 года.


Причиной многочисленных задержек послужили проблемы технического характера. Первые прототипы нового GPU под кодовым названием R520 появились уже в декабре прошлого года, но с целью увеличения выхода кристаллов, способных работать на достаточно высоких тактовых частотах, ATI пришлось проделать ряд операций по доводке и отладке новой продуктовой линейки.

Каждая процедура внесения изменений в дизайн чипа отнимает много времени и средств, как правило, это несколько месяцев и миллионов долларов, так что задержки с выпуском чипа, известного под кодовым именем R520, получили вполне логичное объяснение. Наконец, все проблемы были решены, и 5 октября, мы, наконец, получили возможность увидеть ответный ход ATI. Будет ли он сокрушительным, и произойдет ли очередная смена лидера, или же мощь семейства GeForce 7 позволит ему остаться на троне? Добилась ли ATI технологического лидерства с новым семейством графических процессоров? Об этом мы расскажем в нашем сегодняшнем обзоре.
Встречайте: ATI RADEON X1000

Пространства для маневров с названиями у ATI было немного, и лишь в старшем сегменте: вакантным оставалось лишь название RADEON X900, в то время, как почти все остальные варианты были уже заняты, ведь, в отличие от NVIDIA, ATI Technologies в случае линейки RADEON X, оперировала трехзначными числами в названиях своих продуктов. Выход из положения нашелся; он оказался простым и, в то же время, достаточно элегантным – к числовым обозначениям новинок было добавлено число 1000. Таким образом, новые графические процессоры ATI получили имена RADEON X1800, RADEON X1600 и RADEON X1300. На наш взгляд – достаточно удачный ход, оставляющий немало места для дальнейших маневров с названиями, а также говорящий о том, что перед нами архитектура нового поколения.


RADEON X1800 core

На этот раз это действительно так: ATI и NVIDIA поменялись ролями. Если NVIDIA G70 представляет собой не что иное, как значительно улучшенный NV40 (эволюция), то RADEON X1000 действительно является совершенно новой архитектурой, имеющей мало общего с архитектурами ATI предыдущих поколений (революция).
Более того, старшая модель в семействе, чип RADEON X1800 (R520), получился более сложным, нежели NVIDIA G70 – 320 против 302 миллионов транзисторов! При этом, RADEON X1600 (RV530), нацеленный на средние сегменты рынка состоит из 157 миллионов тразисторов, тогда как RADEON X1300 (RV515) стал, согласно заявлениям разработчиков, первым чипом начального уровня, внутри которого около 100 миллионов транзисторов.

Причинами усложнения архитектуры стал целый набор новведений в чипе, включая такие особенности как:

Поддержка Shader Model 3.0;
Модернизированные шейдерные процессоры со специальным блоком, для выполнения branch инструкций;
Новый контроллер памяти;
Модернизированная система кешей;
Модернизированная система внутренних соединений разных блоков чипа.

До сегодняшнего дня об этой новинке ходили самые невероятные слухи, но сегодня мы можем, наконец, предоставить читателям достоверную информацию:


Как видите, ATI Technologies действительно удалось добиться частот свыше 600 МГц для нового, 0.09-мкм техпроцесса, даже, несмотря на отказ от применения материалов с низкой диэлектрической проницаемостью. С точки зрения других технических характеристик R520 также ни в чем не уступает G70, за исключением количества пиксельных процессоров, что должно компенсироваться гораздо более высокой тактовой частотой. Более того, память в старшем варианте RADEON X1800 работает на огромной даже по современным меркам частоте 750 (1500) МГц, что, теоретически, обеспечивает пропускную способность до 48 ГБ/сек, хотя сама ATI заявляет о несколько более скромной цифре – 42 ГБ/сек.


RADEON X1800 XT graphics card

В процессе разработки архитектуры нового поколения, ATI постаралась сделать ее максимально гибкой, и графический движок был разбит на отдельные компоненты, число которых можно произвольно компоновать в зависимости от конкретной модели GPU:


Теперь разные модели RADEON X1000 будут различаться не только количеством пиксельных и вершинных процессоров, что позволит добиться оптимального соотношения цена/производительность. Как обычно, менее производительные версии нового GPU получили названия, начинающиеся с RV.

Семейство RADEON X1000 будет представлено на рынке следующими моделями видеоадаптеров:

RADEON X1800 XT (R520, 625/1500MHz, 16pp, 8vp, 256-bit, 256MB/512MB, $499/$549);
RADEON X1800 XL (R520, 500/1000MHz, 16pp, 8vp, 256-bit, 256MB, $449);
RADEON X1600 XT (RV530, 590/1380MHz, 12pp, 5vp, 128-bit, 128/256 MB, $199/$249);
RADEON X1600 XT (RV530, 500/780MHz, 12pp, 5vp, 128-bit, 128/256MB, $149/$199);
RADEON X1300 PRO (RV515, 600/800MHz, 4pp, 2vp, 128-bit, 256MB, $149);
RADEON X1300 (RV515, 450/500MHz, 4pp, 2vp, 128-bit, 128/256MB, $99/$129);
RADEON X1300 HyperMemory (RV515, 450/1000MHz, 4pp, 2vp, 128-bit, 32MB, up to 128 MB HyperMemory, $79).

Как видите, новое семейство покрывает весь диапазон графических решений, от бюджетных до высокопроизводительных. Однако, на момент анонса доступны не все модели из вышеприведенного списка.

К 5 октября 2005 года ATI Technologies пообещала обеспечить массовые поставки RADEON X1800 XL, RADEON X1300 PRO и RADEON X1300. Более производительный RADEON X1800 XT станет доступен в массовых количествах ровно через месяц, 5 ноября 2005 года, а 30 ноября на полках магазинов к нему присоединятся и две модели среднего класса – RADEON X1600 XT и RADEON X1600 PRO.

По всей видимости, в данный момент, компания испытывает недостаток новых чипов RADEON X1800, способных работать на частотах свыше 500 МГц. А потому, дабы не создавать ажиотажный спрос на старшие модели, решила повременить с их выпуском.

В настоящее время все графические процессоры RADEON X1000 производятся на мощностях TSMC, но в будущем, это семейство будет выпускаться также и компанией UMC – по имеющимся данным, ATI уже разместила соответствующие заказы на мощностях этой компании. Дополнительные мощности по производству означают, что ATI сможет поставить на рынок большее количество графических чипов, а значит, между партнерами начнется ценовая конкуренция и стоимость финальных продуктов будет постепенно снижаться.

Все новинки поддерживают работу в режиме CrossFire, однако, на данный момент, соответствующие ведущие карты недоступны. В дальнейшем, стоимость RADEON X1800 CrossFire Edition, оснащенного 512МБ видеопамяти, планируется на уровне $599, RADEON X1600 CrossFire Edition обойдется будущему энтузиасту мультипроцессорных решений в $299. RADEON X1800 CF Edition и RADEON X1600 CF Edition будут избавлены от ограничений по разрешению, существующих в текущей версии технологии CrossFire: новый Compositing Engine позволит использовать разрешения вплоть до 2048х1536 при частоте обновления экрана, превышающей 70 Гц. Что касается RADEON X1300, то объединение двух таких карт в CF-связку будет осуществляться через шину PCI Express x16, соответственно, необходимость в выпуске RADEON X1300 CrossFire Edition отсутствует.
Пиксельные процессоры

Поскольку ATI уделила огромное внимание функциям распределения работы между разными испольнительными устройствами, новая архитектура RADEON X1000 стала по-настоящему мультипоточной, получив даже специальное название – Ultra-Threaded Architecture. Аналогия с Intel Hyper-Threading здесь вполне уместна, так как цели у этих технологий схожи: как можно более эффективное задействование имеющихся мощностей процессора и максимально возможное сокращение времени простоя исполнительных устройств.


ATI RADEON X1000 ultra-threaded architecture

Архитектура RADEON X1000 (R5xx) имеет сходства как с архитектурами RADEON 9000 (R3xx) и RADEON X800 (R4xx), так и с совершенно новой архитектурой, применяемой в GPU Xbox 360, однако, новые процессоры ATI содержат ряд уникальных особенностей, не имеющих аналогов в других чипах.

В частности, чипы RADEON X1000 имеют встроенный интеллектуальный коммутатор - специальный блок, называемый Ultra-Threading Dispatch Processor, отвечающий за оптимальное распределение нагрузки между квадами пиксельных процессоров (каждый квад состоит из четырех пиксельных процессоров, каждый из которых в состоянии обработать шейдер для блока 2х2 пиксела за такт), а также текстурными модулями. В частности, Ultra-Threading Dispatch Processor разбивает работу, связанную с одинаковыми пиксельными шейдерами (pixel processing workload) в небольшие группы, или нити (threads) из 4х4 пикселей.

Ultra-Threading Dispatch Processor распознаёт случаи, когда какие-либо пиксельные процессоры внутри квадов простаивают и моментально назначают им на выполнение новые задачи. Однако, в случае, когда для продолжения выполнения шейдера требуются еще не полученные данные, то подобная нить приостанавливается арбитражным процессором до их получения, таким образом высвобождая арифметические ресурсы (Arithmetic Logic Unit, ALU) для других нитей и маскируя латентность, к примеру, выборки текстур, находящихся как в кеше, так и в памяти. Согласно ATI, подобная организация работы позволяет достигать 90% эффективности задействования пиксельных процессоров на любых шейдерах.

Поскольку быстрое переключение между нитями требует сохранения промежуточных результатов каждой, ATI использует для этого специальные регистры - General Purpose Register Array - с высокоскоростным соединением с пиксельными процессорами, что мы уже видели в предыдущих графических процессорах. Пока непонятно, какое колиечество регистров имеется в RADEON X1800, X1600 и X1300 и насколько чувствительны новые чипы к сложностям пиксельных шейдеров.

Согласно стандарту Shader Model 3.0, циклы, ветвления и подпрограммы поддерживаются новыми решениями ATI в полной мере, а применение flow control позволяет им исполнять шейдеры практически неограниченной длины. Все вычисления процессоры семейства RADEON X1000 выполняют в формате 128-bit FP, что практически исключает возможность накопления ошибок и, как следствие, ухудшение качества изображения.

Количество одновременно выполняемых нитей кода было увеличено, а размер каждой, напротив, уменьшен до 4х4 пикселей, что позволило добиться большей эффективности при использовании динамического ветвлении, принцип которого хорошо иллюстрирует следующая диаграмма:


Thread size and dynamic branching efficiency

Преимущество подхода ATI налицо – при большем размере ветви эффективность динамического ветвления значительно падает; в случае с размером 64х64 пиксела его применение становится неоправданным. Старший представитель семейства, RADEON X1800 (R520) способен исполнять до 512 нитей (потоков) шейдерного кода одновременно, в то время как менее мощные модели ограничены 128 потоками.

Следует отметить, что еще одной особенностью RADEON X1000 является наличие специального блока по выполнению ветвлений (branch execution unit). Данный блок выполняет за такт до одной инструкции управления потоком (flow control), таких как conditional statements, loops, subroutines. Наличие выделенного блока исполнения ветвлений (branch execution unit) значительно уменьшает нагрузку на основные ALU, и шейдеры, использующие flow control, исполняются за меньшее число тактов, чем обычно, что, разумеется, может потенциально серьезно увеличить производительность с пиксельными шейдерами третьей версии по сравнению с решениями NVIDIA.


RADEON X1800 pixel shader, ALUs, and texture address units

Поскольку, пиксельные шейдеры в сегодняшних играх применяются чрезвычайно широко, при проектировании новой графической архитектуры, ATI сделала упор на увеличение производительности при их исполнении. Ход, более, чем логичный, ведь и в GeForce 7 пиксельные процессоры подверглись соответствующей доработке.

Цель была достигнута путем увеличения количества ALU – каждый пиксельный процессор R520 получил по 2 скалярных и по 2 векторных ALU, способных выполнять до 4 инструкций за такт (2 инструкции типа ADD + модификатор, 2 инструкции типа ADD/MUL/MADD).

Следует отметить, что впервые в истории графических процессоров текстурные модули и блоки адресации текстур "общаются" с собственно шейдерными процессорами через коммутатор Ultra-Threading Dispatch Processor, а не напрямую. Судя по всему, это было сделано для дальнейшей оптимизации работы всего графического ядра, в основном, для скрытия латентности вызова текстур, ведь наиболее эффективно, когда действия всех блоков координируются из одного "центра".

Если верить заявлению ATI Technologies, суммарная производительность RADEON X1800 (R520) достигает 83 Gflops. Как известно, NVIDIA декларирует аналогичный показатель для G70 на уровне 165 Gflops, что в два раза превышает цифру ATI, но не стоит забывать, что, в случае с GeForce 7800 GTX речь идет лишь об инструкциях типа MADD, поэтому, сравнение, скорее всего, является некорректным – мы не знаем, как измеряла производительность ATI.
Вершинные процессоры

Устройство вершинных процессоров RADEON X1000 весьма напоминает таковое в NVIDIA GeForce 7 – каждый процессор состоит из двух блоков, векторного и скалярного, с той разницей, что оба ALU в вершинном процессоре G70 являются 32-битными, а векторное ALU в аналогичном процессоре RADEON X1000 имеет разрядность 128 бит. Подобное преимущество даёт возможность использовать графический чип для эмуляции центральных процессоров.


RADEON X1800 vertex shader engine

Новые вершинные процессоры могут исполнять 2 инструкции за такт, а длина шейдера может достигать 1024 инструкций в обычном случае и быть практически бесконечной при использовании flow control. Разумеется, вершинные процессоры RADEON X1000 полностью отвечают спецификациям Shader Model 3.0.

Теоретически, производительность RADEON X1800 XT при обработке вершинных шейдеров должна быть значительно выше, нежели у GeForce 7800 GTX, так как его вершинные процессоры работают на значительно более высокой частоте, но подтвердить или опровергнуть это смогут лишь результаты соответствующих тестов.
Контроллер памяти

Контроллер памяти, входящий в состав новых графических процессоров ATI, был полностью переработан. Теперь внутренняя шина памяти RADEON X1800 имеет кольцевую топологию и состоит из двух 256-битных противонаправленных кольцевых шин, тогда как кольцевая топология RADEON X1600 состоит из пары противонаправленных 128-битных шин.


RADEON X1800 Ring Bus diagram, with a typical memory read
sequence highlighted

Дело в том, что кольцевые шины, идущие вокруг всего кристалла, позволяют упростить и оптимизировать разводку проводников внутри него, соединив компоненты кратчайшим путем. Такое решение, вкупе с использованием коммутатора при операциях записи в память минимизирует задержки и искажения сигнала. Благодаря технологии Ring Bus, RADEON X1800/1600 могут без проблем использовать даже самую высокочастотную память, например, GDDR4, что, в случае традиционной архитектуры, могло бы привести к нестабильной работе из-за наличия помех, вызванных неоптимальной разводкой соответствующих проводников внутри GPU.

Память подключена к шинам посредством так называемых "кольцевых остановок" (Ring Stop). Всего таких остановок четыре, каждая имеет два канала доступа к памяти шириной 32-бита каждый. Для сравнения, в RADEON X850 память подключалась к контроллеру четырьмя 64-битными каналами. Каждый Ring Stop может передавать, согласно инструкциям контроллера памяти, затребовавшему данные клиенту.

Принцип работы Ring Bus подсистемы памяти довольно прост. Клиент посылает запрос на получение данных контроллеру памяти, который находится в середине чипа. Контроллер памяти определяет приоритетность каждого из запросов по определенному алгоритму и даёт приоритет тому, который влияет на производительность в большей степени, посылая соответствующий запрос чипам памяти и передавая эти данные по Ring Bus до ближайшего для клиента Ring Stop, который затем передаёт данные клиенту. Для наиболее оптимального доступа к памяти вокруг непосредственного контроллера располагается так называемая Write Crossbar Switch, позволяющая равномерно распределить запросы.

Следует отметить, что алгоритм работы нового контроллера памяти может быть запрограммирован из драйвера, что даёт возможность улучшить его работу со временем. Более того, теоретически ATI может запрограммировать контроллер для работы с конкретным приложением и задать соответствующий профайл через CATALYST A.I.

Претерпела изменения и организация кэша – теперь он стал полностью ассоциативным, то есть, любая строка кэша может отображаться на любое место во внешней памяти.


Caches comparison

При равной частоте памяти ассоциативный кэш работает эффективнее, нежели кэш с прямым отображением. Фактически, в случаях, когда пропускная способность подсистемы памяти является критичным параметром, обеспечивается больший запас производительности. Это должно повлиять положительным образом на скорость работы RADEON X1000 в высоких разрешениях и/или при использовании FSAA и анизотропной фильтрации.

Улучшения коснулись и технологии HyperZ – теперь при определении невидимых областей, подлежащих отсечению, используются более продвинутый алгоритм. По словам ATI, он увеличивает эффективность отсечения скрытых поверхностей на 50% по сравнению с RADEON X850.

Отметим, что хотя RADEON X1300 не поддерживает ни Ring Bus, ни программируемого арбитра запросов к памяти, он использует другие техники, внедрённые для увеличения эффективности пропускной способности памяти в семейство RADEON X1000.
HDR: не только скорость, но и качество

Новое поколение графических процессоров ATI получило полноценную поддержку режимов отображения с расширенным динамическим диапазоном, известных под общим названием HDR.

Хотя поддержка одного из вариантов HDR существовала уже в семействе RADEON X800, но разработчики игр на тот момент не заинтересовались такой возможностью. Подробно суть HDR была описана в обзоре, посвященном графическому процессору NV40, в котором была реализована поддержка одного из стандартов HDR, а именно, OpenEXR, разработанного компанией Industrial Light and Magic, и использующего 16-битное представление цвета с плавающей запятой.

OpenEXR был выбран, как режим, широко использующийся в индустрии кино при создании спецэффектов, но и это не вдохновило разработчиков игр – долгое время единственной игрой, поддерживающей этот стандарт, являлся трехмерный шутер FarCry, причем, падение производительности при включении HDR было огромным. Об игре в разрешениях свыше 1024х768 не могло быть и речи, а особенности реализации HDR в архитектуре NVIDIA привели к невозможности использования полноэкранного сглаживания в этом режиме (впрочем, реализовывать такую возможность было бы нелогично именно из-за низкой производительности). Ситуация улучшилась с появлением GeForce 7800 GTX – новый графический процессор NVIDIA уже мог обеспечить вполне приемлемый уровень производительности при использовании OpenEXR, но поддержка FSAA по-прежнему отсутствовала.

Разрабатывая новую архитектуру, ATI Technologies постаралась учесть все недостатки, и графические процессоры RADEON X1000 получили широчайшие возможности по работе с HDR, в том числе, и поддержку различных форматов, в том числе, нестандартных (custom). Кроме того, в RADEON X1000 впервые появилась возможность использования HDR одновременно с полноэкранным сглаживанием. По сравнению с NVIDIA GeForce 6/7 это огромный шаг вперед, но хватит ли производительности новых GPU для обеспечения комфортной игры в этих режимах? Ответ на этот вопрос могут дать лишь результаты тестов. По крайней мере, теперь ясно, почему графический процессор R520, старшая модель в новом семействе ATI получилась более сложной, нежели NVIDIA G70 – все вышеописанные архитектурные инновации дались разработчикам не даром и потребовали своей доли транзисторов на кристалле. В результате, несмотря на наличие 16 пиксельных процессоров против 24 у изделия конкурента, общее число транзисторов достигло 320 миллионов, что сделало R520 самым сложным графическим процессором в мире.
Новые методы FSAA и анизотропной фильтрации, 3Dc+

Аналогично NVIDIA, наделившей G70 возможностью сглаживания прозрачных текстур, ATI разработала аналогичный режим FSAA для своего семейства RADEON X1000, получивший название Adaptive Anti-Aliasing. Основной акцент был сконцентрирован на улучшении отображения различных объектов, использующих прозрачные текстуры – проволочных заборов, листвы и т.д. Adaptive Anti-Aliasing может использоваться в сочетании со всеми другими видами и режимами сглаживания, поддерживаемыми RADEON X1000, включая Temporal AA и Super AA, при этом, обеспечивается полная поддержка HDR.

Алгоритм анизотропной фильтрации, реализованный в предыдущих продуктах ATI, также подвергся улучшению. Новый режим, Quality AF, использующий так называемый алгоритм Area-Aniso, позволил добиться лучшего качества фильтрации текстур, нежели ранее. Теоретически, это должно улучшить качество изображения, но, как мы уже неоднократно отмечали, в современных играх с динамичным сюжетом заметить улучшения бывает достаточно сложно, а, порой, и вовсе невозможно. Если разница между трилинейной и анизотропной фильтрацией видна отчетливо, то разница между AF 8x и 16x, зачастую, исчезающе мала. Насколько применение нового алгоритма анизотропной фильтрации способно улучшить восприятие реальной игры, мы расскажем в соответствующей главе нашего обзора, где будет также затронут вопрос падения производительности при использовании Adaptive AA и Quality AF.

Еще одна технология, непосредственно имеющая отношение к качеству изображения, также получила свое развитие в новом семействе RADEON. Речь идет о технологии сжатия карт нормалей 3Dc. В своем новом воплощении она приобрела + к названию
и возможность сжатия одноканальных текстур, используемых, например, в качестве карт освещения, затенения (luminance and shadow maps), HDR-текстур, свойств материалов и т.д. Для таких текстур 3Dc+ обеспечивает коэффициент сжатия 2 к 1, в то время, как для двухканальных текстур этот коэффициент равен 4 к 1. Напоминаем, использование 3Dc (а теперь и 3Dc+) позволяет добиться улучшения детализации 3D-моделей, не прибегая к увеличению количества полигонов, путем использования карт нормалей высокого разрешения. Для сравнения, технология DXTC обеспечивает сжатие текстур с коэффициентом 8 к 1, но для карт нормалей эта технология не подходит, так как в этом случае требуется обеспечить попиксельную точность, иначе сильно страдает качество финального изображения.
ATI Avivo: новая эра в обработке видео

Некоторыми способностями по обработке видеопотоков при помощи пиксельных шейдеров обладал еще RADEON 9700, первый в мире DirectX 9-совместимый графический процессор, но с тех пор прогресса в данной области в изделиях ATI Technologies не наблюдалось. По сравнению с чипами NVIDIA или S3, возможности семейств RADEON X800/X850 в области обработки видео выглядели достаточно скромно. Появление RADEON X1000 положило этому конец. Разрабатывая новое семейство, ATI произвела мини-революцию и в области обработки видеопотоков, наделив GPU нового поколения возможностями по аппаратному кодированию и декодированию форматов H.264 и VC-1, служащих основой стандартов Blu-Ray и HD-DVD, соответственно.


Avivo engine

Кроме того, Avivo Display Engine, а именно такое название носит новая технология обработки видео, включает в себя два независимых 10-битных движка, каждый из которых поддерживает оверлеи, высококачественную гамма-коррекцию, цветовую коррекцию, а также может осуществлять масштабирование и деинтерлейсинг. Для кодирования сигнала в ТВ-формат используется решение Xilleon, созданное компанией для применения в бытовой аппаратуре высокого класса, обладающей поддержкой HDTV.

Наличие столь мощных возможностей по обработке видео особенно перспективно смотрится в RADEON X1300. Этот недорогой представитель семейства RADEON X1000 обладает наиболее низким уровнем тепловыделения и энергопотребления, что, вкупе с вышеописанными возможностями, может сделать его идеальным решением для построения высококачественного домашнего мультимедийного центра.

На этом мы завершаем теоретическую часть нашего обзора, и переходим к описанию конкретных продуктов на базе архитектуры RADEON X1000. Мы рассмотрим следующие модели видеоадаптеров, любезно предоставленные ATI Technologies:

RADEON X1800 XT
RADEON X1800 XL
RADEON X1600 XT
RADEON X1300 PRO

Эти карты будут исследованы в ряде теоретических тестов; мы также затронем вопросы, связанные с качеством изображения, обеспечиваемым новыми режимами FSAA и анизотропной фильтрации, разработанными и внедренными ATI Technologies.
Новое семейство RADEON: взгляд вблизи: RADEON X1800 XT

Описание новых видеоадаптеров ATI мы начнем, как водится, со старшей модели, RADEON X1800 XT. По сравнению с RADEON X850, новинка гораздо длиннее и легко соперничает по этому параметру с GeForce 7800 GTX:


Столь длинная PCB – не прихоть конструкторов. Чип, состоящий из 320 миллионов транзисторов и память, работающая на частоте 750 (1500) МГц, потребляют немало энергии, и чтобы обеспечить их потребности, требуется мощная схема питания, которая и занимает всю заднюю часть платы RADEON X1800 XT. Силовые транзисторы, в отличие от GeForce 7800 GTX, расположены в одну вертикальную линию, и прикрыты узким радиатором. Похожий дизайн использовался в GeForce 6800 Ultra. За управление силовыми элементами схемы питания отвечает мультифазный контроллер Volterra VT1103, на снимке он расположен под шестиконтактным разъемом для подключения внешнего питания. Все остальное скрыто под массивной двухслотовой системой охлаждения, которую мы демонтировали с целью подробного изучения конструкции новинки:


Традиционно, память в видеоадаптерах ATI всегда располагалась в форме буквы L, но на этот раз, инженеры-разработчики компании были вынуждены использовать ту же схему, которую NVIDIA использует со времен GeForce FX. Это было необходимо для обеспечения стабильной работы памяти на частотах свыше 1200 МГц. Но даже такое расположение микросхем памяти потребовало весьма замысловатой разводки, чтобы добиться оптимальной длины проводников, соединяющих GPU и память. В результате, PCB получилась очень сложной, но своей цели разработчики достигли.


На плате установлено 8 чипов GDDR3, маркированных, как Samsung K4J52324QC-BJ12. Согласно спецификациям, эти микросхемы емкостью 512 Мбит имеют время доступа 1.25 наносекунды и работают при напряжении питания 2.0 Вольта. Номинальная частота работы для этих чипов составляет 800 (1600) МГц, но работают они на несколько более низкой частоте – 750 (1500) МГц. 8 микросхем емкостью 512 Мбит в сумме дают 512 МБ видеопамяти, так что перед нами самая мощная модель в семействе RADEON X1800.

Левая сторона PCB не представляет особого интереса – здесь, кроме привычных разъемов DVI-I и S-Video, установлен чип Rage Theater, отвечающий за захват видеосигнала с внешних источников. В сочетании с Avivo это устаревшее решение смотрится несколько странно, но, по какой-то причине, ATI не пожелала использовать более прогрессивный Rage Theater 200, оснащенный 12-битными АЦП, даже в видеоадаптерах нового поколения. В любом случае, Rage Theater обеспечивает примерно такое же качество захвата видео, как и Philips SAA7115HL, применяемый NVIDIA в GeForce 7800 GTX.
Несколько выше можно заметить пустующую контактную площадку, предназначенную, скорее всего, для установки дополнительного TMDS-трансмиттера, с целью обеспечения возможности подключения TFT-панелей высокого разрешения по интерфейсу DVI. Еще выше расположен разъем, напоминающий VESA feature connector, который можно было увидеть практически на всех старых видеокартах. Назначение данного разъема неизвестно; не исключено, что в одном из будущих вариантов технологии CrossFire объединение двух карт в CF-связку будет осуществляться посредством этих разъемов и специального шлейфа. Обратная сторона платы не представляет собой ничего интересного – здесь, помимо массы мелких элементов, можно увидеть лишь металлическую рамку, являющуюся элементом системы крепления кулера и предотвращающую возможность перекоса и повреждения PCB.


Новый, 0.09-мкм техпроцесс принес свои плоды – несмотря на то, что по количеству транзисторов ATI R520 превосходит NVIDIA G70, площадь кристалла нового GPU заметно меньше и сопоставима с площадью R480, выполненного по 0.13-мкм техпроцессу.
Данный экземпляр R520 произведен на 37 неделе 2005 года, то есть, приблизительно в начале-середине сентября. Это значит, что окончательная ревизия R520 была запущена в производство совсем недавно, а до этого ATI действительно испытывала проблемы технологического плана с новым GPU. Чип оснащен металлической предохранительной рамкой, служащей для предотвращения возможных сколов. В варианте RADEON X1800 с индексом XT, частота графического процессора составляет 625 МГц.

Что касается системы охлаждения RADEON X1800 XT, то она является ничем иным, как слегка модифицированной системой охлаждения RADEON X850 XT, хорошо знакомой нашим читателям по предыдущим обзорам. Ее основой является медный радиатор, непосредственно контактирующий с кристаллом GPU через тонкий слой темно-серой термопасты. Память охлаждается, отдавая тепло массивному алюминиевому основанию кулера через эластичные прокладки. Как и в RADEON X850 XT, турбина прогоняет воздух сквозь оребрение радиатора, и выбрасывает его наружу, за пределы корпуса ПК.
Основными отличиями от кулера RADEON X850 являются большие размеры радиатора и иная конфигурация основания. Кроме того, нижняя половина кожуха окрашена в белый цвет и украшена рисунком, изображающим символ ATI – девушку по имени Ruby, держающую в руках меч. Увы, относительно шумовых характеристик чуда ожидать не приходится – если турбина большую часть времени будет работать на более высоких оборотах, нежели в RADEON X850 XT, то приемлемым уровень шума назвать будет трудно, учитывая то, что замкнутый кожух является неплохим резонатором. Впрочем, так ли это, мы проверим в соответствующем разделе обзора. (есть подозрение на тепловые трубки)
Новое семейство RADEON: взгляд вблизи: RADEON X1800 XL

Менее мощная модель RADEON X1800 с индексом XL, использует ту же PCB и отличается от старшего собрата только конструкцией системы охлаждения и тактовыми частотами. Как и RADEON X1800 XT, RADEON X1800 XL оснащен чипом Rage Theater.


В данном изделии используется память Samsung K4J55323QG-BC14. Эти чипы имеют емкость 256 Мбит, время доступа 1.4 наносекунды и напряжение питания 1.8 Вольт. Номинальная рабочая частота составляет 700 (1400) МГц, но в RADEON X1800 XL память работает на частоте 500 (1000) МГц. Поскольку, емкость одной микросхемы равна 256 Мбит, 8 микросхем в сумме дают объем видеопамяти 256 МБ. Как и в RADEON X1800 XT, память расположена только с одной стороны PCB, посадочные места на обратной стороне отсутствуют. В отличие от GeForce 7800 GTX, увеличение объема видеопамяти решается заменой чипов емкостью 256 Мбит на микросхемы емкостью 512 Мбит.


Этот экземпляр R520 несколько старше того, что установлен на RADEON X1800 XT – он произведен на 32 неделе 2005 года. 32 неделя приходится на начало августа; возможно, перед нами одна из более ранних ревизий R520, неспособная работать на частотах свыше 500-550 МГц.

Система охлаждения RADEON X1800 XL совершенно иная, нежели та, что установлена на RADEON X1800 XT. В ее основе лежат 2 U-образные тепловые трубки, равномерно распределяющие тепло от основания, контактирующего с кристаллом GPU, по секции, набранной из тонких медных ребер. Память довольствуется теплоотводом через алюминиевый кожух системы. Вентилятор с прямыми лопастями забирает воздух из корпуса ПК, прогоняет сквозь оребреную секцию и выбрасывает обратно в корпус. По пути поток воздуха обдувает радиатор, охлаждающий силовые элементы схемы питания.
Применение тепловых трубок позволило ATI ограничить высоту системы охлаждения RADEON X1800 XL одним слотом, но применение данного вентилятора, скорее всего, приведет к повышенному уровню шума. Мы уже сталкивались с аналогичным вентилятором в обзоре PowerColor X800 XL, и он произвел на нас не самое лучшее впечатление. Как и в случае с RADEON X1800 XT, систему охлаждения украшает изображение Ruby.
Новое семейство RADEON: взгляд вблизи: RADEON X1600 XT

RADEON X1600 XT значительно компактнее старших моделей: в размерах PCB эта модель уступает не только RADEON X1800, но и RADEON X850; ее размеры сопоставимы с размерами RADEON X700 PRO.


Место для установки Rage Theater на плате имеется, но, в отличие от RADEON X1800, сам чип не распаян. Вероятно, его установка будет являться прерогативой производителей видеоадаптеров, и в стандартном варианте RADEON X1600 XT не будет оснащен функциями VIVO. Как и RADEON X1800 XT/XL, RADEON X1600 XT оснащен двумя разъемами DVI-I и одним разъемом S-Video.

Поскольку, в архитектуре RADEON X1000 графический процессор разбит на множество независимых блоков, RV530 отличается от R520 не только меньшим количеством пиксельных и вершинных процессоров. Создавая новое решение среднего класса, ATI урезала также число текстурных модулей, render back-ends и блоков Z-compare, а максимальное количество одновременно выполняемых потоков шейдерного кода было сокращено с 512 до 128. В результате, новый чип получился очень компактным и экономичным.


Схема питания RADEON X1600 XT очень проста по сравнению со схемой питания RADEON X1800, и содержит гораздо меньшее количество элементов. Часть этих элементов расположена в правом верхнем углу PCB, но силовые ключи находятся в левой части карты. Их расположение несколько необычно – под углом в 45 градусов к GPU. В качестве управляющих элементов в схеме питания RADEON X1600 XT используется два программируемых PWM-контроллера RichTek RT9232, расположенных с обратной стороны PCB. Один из этих контроллеров отвечает за питание графического процессора, другой – за энергоснабжение памяти. Там же, с обратной стороны платы, расположено место для установки дополнительного TMDS-трансмиттера и скоба, являющаяся частью крепления кулера.

В отличие от старших моделей, память расположена традиционным образом, но, как и в RADEON X1800 XT/XL, посадочные места для памяти имеются только на фронтальной стороне PCB. Всего плата несет четыре микросхемы Samsung K4J52324QC-BJ12, о которых мы уже рассказывали в описании RADEON X1800 XT. 4 таких чипа емкостью 512 Мбит составляют 256 МБ видеопамяти, а, так как эти микросхемы имеют организацию 16Мх32, ширина шины памяти равна 128 битам. Не вполне ясно, зачем ATI применила чипы со временем доступа 1.25 наносекунды – при тактовой частоте 690 (1380) МГц можно было бы ограничиться менее дорогими микросхемами K4J52324QC-BJ14 с номинальной частотой 700 (1400) МГц. Вероятно, столь дорогая память является уделом инженерного образца, а серийные RADEON X1600 XT будут все-таки оснащаться несколько более дешевой памятью.


Блочная архитектура и 0.09-мкм техпроцесс позволили уменьшить площадь кристалла RV530 практически до размеров кристалла RV380 (RADEON X600), и это при наличии 12 пиксельных и 5 вершинных процессоров. Браво, ATI! Сам чип едва ли старше экземпляра R520, установленного на RADEON X1800 XT – он произведен на 36 неделе 2005 года, при этом, перед нами, скорее всего, не окончательная ревизия, о чем говорит надпись Eng Sample. В отличие от RADEON X1800, упаковка GPU не снабжена защитной рамкой, впрочем, здесь ее необходимость сомнительна, так как система охлаждения RADEON X1600 значительно компактнее и легче, нежели используемые в RADEON X1800 XT/XL.

Сама система охлаждения RADEON X1600 представляет собой медное основание с припаянной к ней "гармошкой ребер" и закрытое черным пластиковым кожухом. В отличие от классического кулера RADEON X800 XT, здесь используется вентилятор с иной конфигурацией лопастей. Прямые вертикальные лопасти направляют воздушный поток в стороны от вентилятора, что при используемой конструкции кулера наиболее оптимально. Вентилятор подключается к плате двумя проводами, таходатчик, в отличие от RADEON X1800 XL, отсутствует – RADEON X1600 XT использует упрощенную схему управления оборотами кулера. В отличие от RADEON X1800 XT и RADEON X1800 XL, кожух системы охлаждения ничем не украшен, может быть, потому, что данный образец RADEON X1600 XT не является финальным. К сожалению, глядя на вентилятор, можно предположить, что при достаточно высоких оборотах он будет сильно шуметь.
Новое семейство RADEON: взгляд вблизи: RADEON X1300 PRO

На первый взгляд, RADEON X1300 PRO ничем не отличается от RADEON X1600 XT, но на самом деле, отличия есть, и куда более кардинальные, нежели кажется на первый взгляд.


В отличие от других представителей семейства RADEON X1000, RADEON X1300 PRO оснащен только одним разъемом DVI, место другого занимает 15-контактный D-Sub. По этой причине возможность установки дополнительного TMDS-трансмиттера отсутствует. Как и в случае с RADEON X1600 XT, возможность установки чипа VIVO имеется, но она не задействована.


Схема питания заметно упрощена, но основное отличие – иная разводка в местах установки памяти. В отличие от RADEON X1600 XT, здесь установлена память GDDR2, причем, чипы расположены с обеих сторон PCB. Чипы HYB18T256161AF-25 произведены компанией Infineon и имеют организацию 16Мх16, поэтому, для обеспечения 128-битной шины их количество потребовалось довести до 8. Поскольку, емкость одной микросхемы составляет 256 Мбит, суммарный объем видеопамяти составляет 256 МБ. Номинальная частота для этих чипов, имеющих время доступа 2.5 наносекунды, равна 400 (800) МГц. На этой частоте память и работает.


На корпусе RV515 расположено гораздо меньше резисторов, чем на корпусе RV530. Площадь кристалла также заметно меньше – чип содержит лишь 4 пиксельных и 2 вершинных процессора, а количество блоков Z-compare уменьшено с 8 до 4. Данный экземпляр произведен в то же время, что и R520, установленный на RADEON X1800 XL – в 32 неделю текущего года, причем, в отличие от RV530, перед нами, скорее всего, окончательная ревизия чипа. Как и положено по спецификации, он работает на частоте 600 МГц. Относительно системы охлаждения можно сказать лишь одно: она точно такая же, как и на RADEON X1600 XT, поэтому, повторяться, описывая ее, не имеет смысла.
Энергопотребление: 100 Ватт – не предел

Мы не могли пройти мимо такой важной темы, как уровень энергопотребления нового семейства. Соответствующие замеры были произведены для всех четырех новинок ATI.
Для этого использовался специальный тестовый стенд, в основе которого лежала модернизированная системная плата, позволяющая подключать измерительные приборы к шинам питания 12В и 3.3В, ведущим к слоту PCI Express x16. Для измерения мощности, потребляемой видеоадаптером через внешний разъем, мы использовали специальный переходник, оснащенный соответствующим шунтом и разъемами. Данный стенд имел следующую конфигурацию:

Процессор Intel Pentium 4 560 (3.60ГГц, 1МБ L2);
Системная плата Intel Desktop Board D925XCV;
Память PC-4300 DDR2 SDRAM (2x512МБ);
Жесткий диск Samsung SpinPoint SP1213C (Serial ATA-150, буфер 8МБ);
Microsoft Windows XP Pro SP2, DirectX 9.0c.

Для создания условий, приближенных к реальным, мы использовали третий тест пакета 3DMark05, запускаемый в разрешении 1600х1200 при включенных FSAA 4x и AF 16x. Этот тест очень сильно нагружает пиксельные процессоры, поэтому, видеоадаптер в нем работает в условиях, характерных для многих современных игр, следовательно, результаты замеров также близки к тому, с чем пользователь может столкнуться в реальной жизни. В процессе тестирования были получены весьма любопытные результаты:


RADEON X1800 XT потребляет почти в два раза больше энергии, нежели RADEON X1800 XL, более того, этот видеоадаптер перекрыл все рекорды для одиночных карт, и превзошел даже 24-конвейерный GeForce 7800 GTX! Разумеется, не последнюю роль в этом сыграла высокая тактовая частота и сложность нового чипа, но можно предположить, что основной вклад в энергопотребление RADEON X1800 XT внесли 512 МБ памяти, работающей на частоте 750 (1500) МГц при напряжении питания 2.0В.
Возможно, для обеспечения максимальной стабильности, напряжение на памяти было поднято и сверх этого значения, но проверить это предположение мы не можем, за отсутствием утилит, позволяющих осуществлять мониторинг питающих напряжений RADEON X1000. Две карты RADEON X1800 XT, работающие в режиме CrossFire, таким образом, могут потреблять до 225 Ватт, и обойтись блоком питания мощностью 400-450 Ватт будущим владельцам такой системы вряд ли удастся. Скорее всего, потребуется блок питания, способный выдавать в продолжительном режиме мощность 550-600 Ватт и выше, учитывая, что в высококлассной игровой системе, помимо двух RADEON X1800 XT, обязательно будут присутствовать и другие прожорливые компоненты, к примеру, мощный процессор и несколько жестких дисков.

Показатели RADEON X1800 XL куда скромнее – всего 59 Ватт, что примерно соответствует уровню энергопотребления GeForce 7800 GT. Последний использует графический процессор, выполненный по 0.11-мкм техпроцессу и несущий на борту 20 пиксельных процессоров, но решение ATI компенсирует это более высокой частотой и сложностью чипа. В отличие от RADEON X1800 XT, память RADEON X1800 XL работает в 1.5 раза медленнее, ее напряжение питания составляет лишь 1.8В, а общий объем – 256 МБ против 512 МБ у старшей модели. Это еще один довод в пользу гипотезы о том, что основным потребителем энергии в RADEON X1800 XT является память. Теоретически, это можно было бы проверить разгоном GPU RADEON X1800 XL до уровня XT, но, к сожалению, мы не смогли этого сделать, так как, на данный момент ни RivaTuner, ни PowerStrip не умеют работать с семейством RADEON X1000. RivaTuner 15.7 просто не распознает установленные видеоадаптеры, а PowerStrip 3.61 некорректно демонстрирует частоту памяти и отказывается регулировать частоту GPU.

Более предсказуемые результаты были получены для менее мощных представителей семейства RADEON X1000:


11 Ватт разницы между 12-конвейерным RADEON X1600 XT и 4-конвейерным RADEON X1300 PRO, возможно, обусловлены тем, что последний использует 8 чипов памяти GDDR2, тогда, как на RADEON X1600 XT установлены 4 чипа GDDR3.
Шумность и качество 2D

Приемлемые шумовые характеристики, к сожалению, смогли продемонстрировать только RADEON X1800 XT и RADEON X1800 XL. Их вентиляторы работали на полную мощность только в момент включения системы. Через несколько секунд RADEON X1800 XT незначительно понижал обороты, а некоторое время спустя, еще раз снижал их, на этот раз, до минимального уровня, при котором шум был совсем незначительным. В процессе тестирования обороты вентилятора RADEON X1800 XT несколько повышались, но уровень шума все время оставался в комфортных пределах, даже, учитывая, что тестирование проводилось на открытом стенде.

Практически так же вел себя и RADEON X1800 XL, но его кулер менял обороты менее плавно и работал либо достаточно громко, либо очень тихо. Уровень комфорта, в целом, был не ниже, чем в случае с RADEON X1800 XT, а может быть, и выше – в спектре шума, издаваемого картой, отсутствовал характерный "пластиковый" оттенок, характерный для двухслотовых систем охлаждения ATI. В любом случае, в закрытом корпусе RADEON X1800 XT и RADEON X1800 XL вели бы себя одинаково тихо.

Совершенно противоположное впечатление о себе оставили RADEON X1600 XT и RADEON X1300 PRO – их турбины все время работали на повышенных оборотах, и уровень шума при этом был трудновыносимым, особенно, после длительного тестирования. Основная составляющая шума этих карт приходилась на высокие частоты (визг вентилятора), и закрытый корпус, скорее всего, повлиял бы на общую картину незначительно. К счастью, ничто не обязывает производителей карт придерживаться референсного дизайна системы охлаждения, и большинство RADEON X1600 и RADEON X1300, скорее всего, будут комплектоваться менее шумными кулерами. Особенно привлекательно будет выглядеть RADEON X1300, оснащенный пассивной системой охлаждения на тепловых трубках – в этом случае он действительно может стать идеальным видеоадаптером для мультимедийного центра.

Все четыре видеоадаптера продемонстрировали хорошее качество 2D в разрешениях до 1800х1440х75 Гц, что, впрочем, характерно для 99% всех современных карт.
Конфигурация тестовой платформы и настройки драйверов

Тестирование нового семейства RADEON мы провели на платформе со следующей конфигурацией:

Процессор AMD Athlon 64 4000+ (2.40ГГц, 1МБ L2);
Системная плата ASUS A8N-SLI Deluxe (NVIDIA nForce4 SLI);
Память OCZ PC-3200 Platinum EL DDR SDRAM (2x1ГБ, CL2-3-2-5);
Жесткий диск Samsung SpinPoint SP1213C (Serial ATA-150, буфер 8МБ);
Звуковая карта Creative SoundBlaster Audigy 2;
Блок питания Cooler Master Real Power 450 (RS-450-ACLY, номинальная мощность 450W);
Мониторы Dell P1130/Dell P1110 (21", максимальное разрешение 1800х1440х75 Гц);
Microsoft Windows XP Pro SP2, DirectX 9.0c;
ATI CATALYST 8.173.1-050921a-026915E;
NVIDIA ForceWare 78.01.

Драйверы ATI и NVIDIA были настроены следующим образом:

ATI CATALYST:

CATALYST A.I.: Standard
Mipmap Detail Level: Quality
Wait for vertical refresh: Always off
Adaptive antialiasing: Off
Temporal antialiasing: Off
Quality AF: Off
Остальные настройки: по умолчанию

NVIDIA ForceWare 78.01:

Image Settings: Quality
Vertical sync: Off
Trilinear optimization: On
Anisotropic mip filter optimization: Off
Anisotropic sample optimization: On
Gamma correct antialiasing: On (только для GeForce 7)
Transparency antialiasing: Off (только для GeForce 7)
Остальные настройки: по умолчанию

Перед тем, как перейти к результатам теоретических тестов, расскажем о том, насколько же могут улучшить качество изображения новые методы FSAA и анизотропной фильтрации, представленные ATI в новом семействе RADEON.
Качество анизотропной фильтрации

Как обычно, перед началом тестирования графических карт, мы проверяем качество анизотропной фильтрации и трилинейной фильтраций. Благо, для этого есть повод: ATI декларирует для семейства ATI RADEON X1000 возможность включения улучшенного алгоритма анизотропной фильтрации в сравнении с предшественниками.

RADEON X1800RADEON X800GeForce 7800


Trilinear


Aniso 16x


Aniso 16x Quality

Как видно, при использовании трилинейной фильтрации особой разницы в качестве по сравнению с RADEON X850 XT не наблюдается, тогда как GeForce 7800 GTX демонстрирует чуть более резкие переходы между mip-уровнями, но это вряд ли можно назвать чем-то фатальным.

Как видно из изображений, RADEON X1800 XT действительно имеет несколько более качественный режим по сравнению с предшественниками и конкурентами. Режим, этот, впрочем, не по-умолчанию, а требует отдельного включения, а также, потенциально, уменьшает производительность.

Следует упомянуть, что мы не нашли ни одного реального свидетельства превосходства качественного режима анизотропной фильтрации над обычным. Иными словами, существенной разницы в качестве изображения в разных реальных играх между качественным режимом RADEON X1800 XT и обычными режимами его же и других видеокарт нет.
Качество FSAA

Помимо улучшенного качества анизотропной фильтрации, ATI заявляет для RADEON X1000 и метод полноэкранного сглаживания для альфа-текстур.

NVIDIA GeForce 7800 GTXATI RADEON X1800 XTATI RADEON X1800 XT


no FSAAno FSAA


FSAA 4x + TMSFSAA 4xaFSAA 4x


FSAA 4x + TSS


FSAA 8xS + TMSFSAA 6xaFSAA 6x


FSAA 8xS + TSS

Увы, как в случае и с Transparent AA на GeForce 7800, Adaptive FSAA на RADEON X1000 не может похвастаться улучшением качества изображения в игре Far Cry, во всяком случае, видимого увеличения качества мы не обнаружили.

Посмотрим, как обстоят дела с Half-Life 2.

NVIDIA GeForce 7800 GTXATI RADEON X1800 XTATI RADEON X1800 XT


no FSAAno FSAA


FSAA 4x + TMSFSAA 4xaFSAA 4x


FSAA 4x + TSS


FSAA 8xS + TMSFSAA 6xaFSAA 6x


FSAA 8xS + TSS

Как видно из скриншотов, адаптивное сглаживание прозрачных текстур на RADEON X1000 вполне работает, однако, как и в случае с мультисэмлпингом альфатекстур (TMS, transparent multi-sampling) на NVIDIA GeForce 7, улучшения качества не очень велико. К слову сказать, качество Adaptive FSAA RADEON X1000 значительно выше аналогичного режима у GeForce 7800 GTX, однако, оно много ниже, чем предоставляет суперсэмплинг прозрачных текстур (TSS, transparent super-sampling) на продуктах конкурента.

Следует также отметить, что адаптивное сглаживание альфатекстур в случае с RADEON X1800 XT подчас приводит к их исчезновению, что может быть следствием пока еще не идеальных драйверов, ведь, как известно, маски для сглаживания в ускорителях ATI RADEON могут быть заданы программно.

Таким образом, пальма первенства в области качества полноэкранного сглаживания остаётся у NVIDIA.
Падение производительности при использовании новых режимов

Разумеется, любые улучшения качества не остаются бесплатными, а потому, давайте взглянем на скорость, демонстрируемую RADEON X1800 XT с разными режимами качества.


Как видно, за исключением случая с игрой Far Cry и уровнем Pier, производительность новых режимов FSAA и анизотропной фильтрации находится вполне на уровне, который позволяет комфортно играть.

Желающие могут сделать не совсем корректное сравнение результатов ATI RADEON X1800 XT с GeForce 7800 GTX при приблизительно аналогичных условиях.
Результаты теоретических тестов: RADEON X1800 XT/XL

В процессе теоретического тестирования мы использовали следующие тесты:

Marko Dolenc's Fillrate Tester;
Xbitmark v0.60;
3DMark 2001SE build 330;
3DMark03 build 360;
3DMark05 build 120.

Поскольку обзор посвящен не только RADEON X1800, но и RADEON X1600 и RADEON X1300, мы провели три цикла теоретических тестов, а не один, как обычно. Начнем по порядку, со старших представителей семейства, RADEON X1800 XT и RADEON X1800 XL. Для сравнения с ними мы взяли следующие видеоадаптеры:

GeForce 7800 GTX (G70, 430/1200MHz, 24p, 8v, 256-bit, 256MB)
GeForce 6800 Ultra (NV45, 425/1100MHz, 16pp, 6vp, 256-bit, 256MB)
RADEON X850 XT Platinum Edition (R480, 540/1180MHz, 16pp, 6vp, 256-bit, 256MB)


Скорость заполнения сцены

На этот раз, мы использовали новую версию Marko Dolenc's Fillrate Tester, любезно предоставленную автором программы. По сравнению со старой версией, новый Fillrate Tester обладает более широкими возможностями.


Если судить по "чистой" скорости заполнения, то при отсутствии текстур, RADEON X1800 XT демонстрирует непревзойденный результат, что является следствием непревзойденных частот чипа и производительности подсистемы памяти. RADEON X1800 XL выглядит значительно скромнее, но и он несколько опережает GeForce 7800 GTX с его достаточно скромными тактовыми частотами.

Так как семейство RADEON X1000 не способно обрабатывать удвоенное количество значений Z за такт, как семейства GeForce 6/7, то на этом этапе лидируют решения NVIDIA.

Далее, появление одной текстуры практически уравнивает производительность RADEON X1800 XT, GeForce 7800 GTX и GeForce 6800 Ultra, в то время, как RADEON X1800 XL почему-то уступает RADEON X850 XT PE. Уже при двух текстурах ситуация кардинально меняется – скорость заполнения GeForce 6800 Ultra падает почти до уровня RADEON X1800 XL, который в этот момент начинает опережать RADEON X850 XT Platinum Edition. Старшие модели видеоадаптеров ATI и NVIDIA идут практически наравне, с небольшим перевесом в сторону GeForce 7800 GTX, что может означать в частности лучшее кеширование у продукта NVIDIA.

Увеличение количества текстур до трех приводит к резкому отставанию RADEON X1800 XT, несмотря на его огромную тактовую частоту. Судя по всему, лучшее кеширование и 24 конвейера GeForce 7800 GTX в данном случае являются отличной подмогой. Добавление еще одной текстуры расклада сил не меняет – GeForce 7800 GTX финиширует в гордом одиночестве, в то время, как RADEON X1800 XT, хоть и не сильно отстав, смог опередить лишь GeForce 6800 Ultra. RADEON X1800 XL и RADEON X850 XT Platinum Edition финишируют вместе.

Все говорит о том, что с наложением текстур дела у RADEON X1800 XT/XL обстоят несколько хуже, нежели у GeForce 7800 GTX/6800 Ultra. Достойно новинки ATI проявляют себя лишь при отсутствии текстур или при наличии лишь одной текстуры. Если проигрыш RADEON X1800 XT еще можно объяснить меньшим количеством пиксельных процессоров, то поведение RADEON X1800 XL, уступившего GeForce 6800 Ultra, а в некоторых случаях, и RADEON X850 XT PE, понять сложнее. Проблемы с кешированием? Сырые драйверы? Неизвестно. Выводы, однако, делать рано – посмотрим, как поведет себя новое семейство в тестах на исполнение пиксельных шейдеров, тем более, что, создавая новые графические процессоры, упор ATI сделала именно на увеличение производительности при исполнении шейдерного кода.

Производительность при исполнении пиксельных шейдеров

Новая версия Fillrate Tester содержит большее количество шейдерных тестов. Мы выбрали только те из них, в которых пиксельные шейдеры исполняются с полной точностью – половинная точность в наше время уже неактуальна.


Если простые шейдеры версий 1.1-2.0 даются RADEON X1800 XT почти так же хорошо, как и GeForce 7800 GTX, то увеличение длины шейдера приводит к резкому отставанию RADEON X1800 XT. При исполнении наиболее сложного шейдера данного теста, PS 2.0 Per Pixel, GeForce 7800 GTX опережает RADEON X1800 XT почти в два раза! RADEON X1800 XL удается, наконец, опередить GeForce 6800 Ultra, но не RADEON X850 XT Platinum Edition, но в данном случае, с ростом сложности шейдера, разрыв сокращается.
Увы, пока похвастать RADEON X1800 нечем – GeForce 7800 GTX выглядит лучше.


Результаты Xbitmark это подтверждают – в целом, производительность RADEON X1800 XT ниже или равна производительности GeForce 7800 GTX.

Имеются, однако, исключения: в случае многопроходных шейдеров (27-Pass Fur) и шейдеров, использующих динамическое ветвление, RADEON X1800 XT нет равных, причем, в наиболее тяжелом случае (Heavy Dynamic Branching) преимущество двухкратное.

Иными словами, архитектура Ultra-Threading и, потенциально, увеличенное количество временных регистров, действительно обеспечивает преимущество там, где теоретически должна обеспечивать – в многопроходном рендеринге и комплексных шейдерах, использующих ветвление. Высокий результат в шейдере 27-Pass Fur, по всей видимости, обусловлен сочетанием Ultra-Threading и интеллектуального контроллера памяти. К сожалению, шейдер NPR (hatch, 10 textures ps3), по неизвестной причине отказался запускаться на RADEON X1000, Xbitmark при этом демонстрировал пустой экран.


Как мы выяснили, на простых пиксельных шейдерах RADEON X1800 может проигрывать решениям NVIDIA, но тест на исполнение шейдеров версии 1.1, входящий в состав 3DMark 2001SE демонстрирует примерно одинаковую производительность RADEON X1800 XT и GeForce 7800 GTX.


Аналогичный тест, измеряющий скорость исполнения пиксельных шейдеров версии 1.4, показывает лидерство RADEON X1800 XT в низких разрешениях и паритет с конкурентом в 1600х1200.


RADEON X1800 XT очень сильно отстает от GeForce 7800 GTX – последний все-таки обладает большим количеством пиксельных процессоров, и против грубой силы ухищрения ATI помогают плохо. Возможно, дело не только в этом, но и в недоработанных драйверах, так как RADEON X1800 XL занимает в этом тесте последнее место, чего, теоретически, быть не должно, учитывая достаточно высокие тактовые частоты. Благотворное влияние нового контроллера памяти можно отметить и здесь – с ростом разрешения RADEON X1800 теряет в производительности не так резко, как решения NVIDIA.


Аналогичный тест из пакета 3DMark05 еще раз подтверждает, что RADEON X1800 отлично справляется с шейдерами, сложными с точки зрения текстурной нагрузки. В данном случае, шейдер, изображающий скалу, состоит из двух карт цвета, двух карт нормалей и использует диффузное затенение "по Ламберту" (Lambertian diffuse shading). Только наличие 24 пиксельных процессоров позволяет GeForce 7800 GTX удержаться в лидерах. RADEON X1800 XL также демонстрирует неплохой результат в данном тесте, уступая лишь старшему собрату.

Производительность при исполнении вершинных шейдеров


3DMark 2001SE, возможно, не вполне корректно работает с RADEON X1800 и предварительной версией CATALYST – результаты моделей с индексами XT и XL не отличаются, кроме того, производительность не падает с ростом разрешения.


Высокие частоты и наличие 8 вершинных процессоров делают RADEON X1800 XT и XL чемпионом в области обработки вершинных шейдеров в 3DMark03.


Тест Simple Vertex Shader производит трансформацию и освещение нескольких высокополигональных моделей. Общее число вершин в тесте достигает 6 миллионов при одном источнике света. Используемые шейдеры укладываются в Shader Model 1.1. В данном случае, RADEON X1800 XT демонстрирует подавляющее преимущество. RADEON X1800 XL также идет впереди остальных участников теста, но отрыв не так велик, как в случае со старшей моделью.


Тест Complex Vertex Shader гораздо сложнее, так как в травяной полянке, демонстрируемой тестом, каждая травинка обрабатывается отдельно. Почему-то RADEON X1800 XL сдает позиции в этом тесте, и уступает второе место RADEON X850 XT Platinum Edition, а сам смещается на третье. RADEON X1800 XT по-прежнему вне конкуренции.


С технической точки зрения, геометрический тест Xbitmark весьма напоминает тест Simple Verterx Shader – здесь также производится трансформация и освещение нескольких высокополигональных моделей, при этом, количество источников света изменяется от 0 до 8. Производительность RADEON X1800 XT/XL с увеличением числа источников света падает значительно медленнее, нежели у остальных участников тестирования, что говорит об очень высокой эффективности его вершинных процессоров и подсистемы памяти.

Эмуляция фиксированного TnL


При наличии одного источника света RADEON X1800 XT лидирует, а вот RADEON X1800 XL плетется в хвосте, по всей видимости, из-за низкой для подобной архитектуры тактовой частоты.


Увеличение числа источников света до 8 меняет картину, но результаты остаются не менее странными – RADEON X1800 XT неожиданно начинает уступать GeForce 7800 GTX, что совершенно не согласуется с результатами геометрического теста Xbitmark, а RADEON X1800 XL, напротив, оказывается в состоянии опередить GeForce 6800 Ultra и RADEON X850 XT Platinum Edition.

Очень может быть, что драйверы CATALYST пока не умеют эффективно работать с эмуляцией TnL.


Тест на производительность при отрисовке систем частиц, по сути своей, является еще одним тестом вершинных процессоров, и он, похоже, работает корректно – результаты RADEON X1800 подтверждают его лидерство в области обработки геометрии.

Наложение рельефа и другие тесты


Эмуляция наложения рельефа методом EMBM плохо удается RADEON X1800 XT, к тому же, в низких разрешениях его результаты совпадают с результатами RADEON X1800 XL, что может свидетельствовать об их недостоверности.


При наложении рельефа методом Dot3 скорость RADEON X1800 XT сравнима с конкурентом в лице GeForce 7800 GTX, тогда как RADEON X1800 XL может похвастаться результатами, схожими с предшественниками.


Этот тест позволяет определить сбалансированность связки "CPU-драйвер-GPU", так как в нем используется движок с реалистичной физической моделью, пиксельные шейдеры версии 1.1 и вершинные шейдеры версии 1.4. С точки зрения сбалансированности лидером здесь является GeForce 6800 Ultra – график этого видеоадаптера наиболее пологий. Если же говорить о производительности, измеряемой в fps, то первое место занимает RADEON X1800 XT, второе - GeForce 7800 GTX и третье по праву принадлежит RADEON X1800 XL.
Результаты теоретических тестов: RADEON X1600 XT

Соперниками RADEON X1600 XT выступили:

RADEON X700 PRO (RV410, 425/864MHz, 8pp, 6vp, 128-bit, 256MB)
RADEON X800 PRO (R420, 475/900MHz, 12pp, 6vp, 256-bit, 256MB, AGP)
GeForce 6800 (NV42, 325/600MHz, 12pp, 5vp, 256-bit, 128MB)

Так как результаты RADEON X800 PRO были получены на AGP платформе, они приведены только в качестве примера, и сравнивать их с результатами карт с интерфейсом PCI Express не совсем корректно.

Скорость заполнения сцены


В отличие от RADEON X1800, RADEON X1600 XT ведет себя в тесте на скорость заполнения сцены совершенно иначе. Особенно любопытно выглядит результат Z pixel fillrate – RADEON X1600, как и GeForce 6800, умеет обрабатывать удвоенное количество значений Z за такт, ведь RV530 имеет четыре текстурных блока и 8 блоков Z-Compare, что и приводит к такому результату.

На всем протяжении теста он уступает 12-конвейерному решению NVIDIA, но превосходит RADEON X700 PRO. В последнем случае превосходство невелико – судя по всему, сказывается наличие лишь четырех текстурных блоков.

Производительность при исполнении пиксельных шейдеров


Простые пиксельные шейдеры даются RADEON X1600 XT с одинаковыми усилиями как для версии 1.1, так и для версии 2.0, что логично. Учитывая наличие лишь четырех текстурных модулей, шейдерные процессоры тратят такты в ожидании данных от них. Таким образом, наличие 12 пиксельных процессоров начинает проявляться лишь с увеличением длины шейдера. Именно поэтому производительность новинки, в отличие от производительности RADEON X1800 и GeForce 6800, почти не падает на всем протяжении теста, за исключением шейдера PS 2.0 Per Pixel.


Согласно ряду тестов из пакета Xbitmark, наличие лишь 4 текстурных блоков мешает RADEON X1600 XT проявить себя полностью. Особенно хорошо это видно на примере шейдера NPR (hatch, 8 textures), чье название говорит само за себя.

Наилучший результат новинка демонстрирует в шейдерах со сложной математикой и там, где используется динамическое ветвление. В первом случае RADEON X1600 XT помогает высокая тактовая частота (590 МГц против 325 МГц у GeForce 6800), а во втором – архитектура Ultra-Threading.


Тестер пиксельных шейдеров 1.1 из пакета 3Dmark 2001SE не изобилирует большим количеством текстур, а значит, едва ли четыре текстурных блока RADEON X1600 XT могут ограничить его производительность, а потому, он демонстрирует лидерство при исполнении пиксельных шейдеров версии 1.1 в данном конкретном тесте. В то же время, как в аналогичном случае с Fillrate Tester, он уступал другим картам.


Тест на исполнение пиксельных шейдеров 1.4 выводит RADEON X1600 XT на одну ступень с GeForce 6800, что выглядит достаточно правдоподобно: ведь в данном бенчмарке используется немалое количество текстур, а значит, всего четыре текстурных модуля могут ограничивать скорость.


Достаточно странно выглядит проигрыш RADEON X1600 XT в тесте 3DMark03 на производительность при исполнении пиксельных шейдеров версии 2.0 – нагрузка в нем, главным образом, носит математический характер, и при наличии у RADEON X1600 XT 12 пиксельных процессоров, работающих на частоте 590 МГц, результат, теоретически, должен быть значительно выше. Возможно, вина лежит на недоработанных драйверах CATALYST.


Аналогичный тест, но из пакета 3DMark05, расставляет все по своим местам – RADEON X1600 XT выходит в лидеры, но отрыв от GeForce 6800 не слишком велик. Все-таки, у модульной архитектуры RADEON X1000 есть свои недостатки – в погоне за компактностью и экономичностью, ATI, похоже, лишила RV530 слишком многого.

Производительность при исполнении вершинных шейдеров


И GeForce 6800, и RADEON X1600 XT несут на борту по 5 вершинных процессоров, только в последнем случае их тактовая частота значительно выше, чем и объясняется столь высокий результат.


Аналогичная картина наблюдается и в соответствующем тесте 3DMark03.


Еще большее преимущество над решениями старого поколения демонстрирует RADEON X1600 XT в тесте Simple Vertex Shader пакета 3DMark05. В данном случае, он опережает GeForce 6800 более, чем в два раза.


Несколько меньше это преимущество в тесте Complex Vertex Shader, но и здесь первенство RADEON X1600 XT неоспоримо.


При отсутствии источников света производительность GeForce 6800 и RADEON X1600 XT одинакова, последний незначительно выходит вперед при включении четырех источников света, но сильнее всего решение ATI опережает своего соперника при наличии в сцене 8 источников света, что подтверждает высокую эффективность новых вершинных процессоров ATI.

Эмуляция фиксированного TnL


Уже при наличии 1 источника света RADEON X1600 XT уступает только RADEON X800 PRO, но, по большей части, лишь в высоких разрешениях.


Та же сцена, но освещаемая восемью источниками света также не является чем-то сложным для RADEON X1600 XT, хотя RADEON X800 PRO все-таки несколько быстрее. Стоит учитывать, что данные для RADEON X800 PRO снимались на другой платформе, поэтому, сравнивать их с данными видеоадаптеров с интерфейсом PCI Express не вполне корректно. Кроме того, как мы уже говорили, результаты, полученные на RADEON X1000 в 3DMark 2001SE, особого доверия не вызывают.


5 вершинных процессоров RADEON X1600 XT в тесте на отрисовку систем частиц примерно соответствуют 6 процессорам RADEON X800 PRO, разумеется, с поправкой на тактовую частоту – у новинки она значительно выше. Также, ее контроллер памяти работает эффективнее – несмотря на 128-битную шину памяти, падение производительности с ростом разрешения меньше, нежели у RADEON X800 PRO.

Наложение рельефа и другие тесты


Эмуляция метода EMBM удается RADEON X1600 неплохо, во всяком случае, именно он демонстрирует в данном тесте наилучший результат.


При эмуляции наложения рельефа методом Dot3 RADEON X1600 XT, RADEON X800 PRO и GeForce 6800 продемонстрировали практически одинаковый результат, а вот RADEON X700 PRO значительно отстал.


Судя по всему, сбалансирован RADEON X1600 XT, в целом, хуже, нежели RADEON X800 PRO и GeForce 6800 – его производительность в тесте Ragtroll очень быстро падает с ростом разрешения. Поведет ли новое решение ATI себя так же и в реальных играх? Об этом мы расскажем в одной из будущих статей, посвященных игровому тестированию семейства RADEON X1000.
Результаты теоретических тестов: RADEON X1300 PRO

В качестве соперников RADEON X1300 PRO были избраны следующие карты:

RADEON X700 (RV410, 400/700MHz, 8pp, 6vp, 128-bit, 256MB)
RADEON X300 (RV380, 325/400MHz, 4pp, 2vp, 128-bit, 128MB)
GeForce 6600 (NV43, 300/500MHz, 8pp, 3vp, 128-bit, 128MB)
GeForce 6200 TC128 (NV44, 300/700MHz, 4pp, 3vp, 64-bit, 32MB onboard)

Поскольку наша лаборатория не располагает этими видеоадаптерами, они были получены путем снижения до соответствующего уровня тактовых частот RADEON X700 PRO, RADEON X600 XT и GeForce 6600 GT, соответственно.

Скорость заполнения сцены


Наивысшую теоретическую скорость заполнения сцены демонстрирует RADEON X700 – при частоте GPU 420 МГц, он оснащен 8 пиксельными конвейерами, в то время, как RADEON X1300 PRO, работающий на частоте 600 МГц, может похвастаться лишь 4 пиксельными процессорами и 4 текстурными блоками.

Новая архитектура позволяет ему выйти на первое место уже при наложении одной текстуры; неплохо держится RADEON X1300 PRO и при двух текстурах, а вот добавление третьей и четвертой текстуры уже не позволяет ему опережать GeForce 6600. В то же время, при четырех накладываемых текстурах RADEON X700, по-видимому, страдает от недостаточно емких кэшей и его результат вплотную приближается к результату бюджетного GeForce 6200.

Производительность при исполнении пиксельных шейдеров


8 пиксельных процессоров GeForce 6600, работающих на частоте 300 МГц, практически равны четырем пиксельным процессорам RADEON X1300 PRO, работающим на вдвое более высокой частоте. Исключение составляет шейдер PS 2.0 4 Registers, но во всех остальных случаях производительность этих решений совпадает.


В целом, можно наблюдать паритет между RADEON X1300 PRO и GeForce 6600, но исключением, как и в двух предыдущих случаях, являются три последних шейдера, использующих динамическое ветвление и работающих в рамках модели 3.0 – при исполнении таких шейдеров новая архитектура ATI непобедима.


Благодаря огромной тактовой частоте, RADEON X1300 PRO опережает всех, включая RADEON X700 и GeForce 6600.


Удивительно, но в тесте, измеряющем скорость пиксельных шейдеров 1.4 RADEON X1300 PRO отстал от соперника, GeForce 6600.


С проблемой низкой производительности RADEON X1300 PRO мы столкнулись также и в тесте Pixel Shader 2.0, входящем в состав 3DMark03. По всей видимости, ответственность за столь плачевный результат ложится на программистов ATI Technologies.


Памятуя о проблемах в предыдущих тестах, мы были приятно удивлены очень неплохими результатами новинки в 3DMark05. RADEON X1300 PRO сумел опередить как предшественников, так и соперников.

Производительность при исполнении вершинных шейдеров


Благодаря высочайшей тактовой частоте, RADEON X1300 PRO, в целом серьезно опережает GeForce 6600 и RADEON X700, что является не вполне логичным результатом.


Аналогичный тест из пакета 3DMark03 демонстрирует куда более реалистичный результат. 2 вершинных процессора RADEON X1300 PRO не позволяют ему догнать GeForce 6600, и тем более, RADEON X700, который, как известно, имеет шесть полноценных вершинных процессоров.


Интересно, что в случае простого вершинного шейдера 2.0 RADEON X1300 PRO оказывается вновь непобедимым, что может являтся следствием быстрой работы растеризационного блока, обусловленной высокой тактовой частотой.


Высокая тактовая частота и 128-битные векторные ALU позволяют RADEON X1300 демонстрировать неплохую производительность при обработке сложных вершинных шейдеров. Тем не менее, этого недостаточно, чтобы догнать RADEON X700 с его шестью вершинными процессорами.


Аналогично ведет себя новинка в геометрическом тесте Xbitmark, уступая лишь RADEON X700.

Эмуляция фиксированного TnL


Сцена недостаточно сложна, чтобы задействовать расширенные возможности RADEON X1300 PRO по обработке вершинных шейдеров. Как и в ряде других геометрических тестах, здесь он уступает GeForce 6600 и RADEON X700.


Однако, при восьми источниках света RADEON X1300 PRO слегка опережает GeForce 6600, но отстаёт от RADEON X700.


Новинка ATI, тем не менее, неплохо справляется с системами частиц, опережая соперников практически во всех разрешениях.

Наложение рельефа и другие тесты


Благодаря разнице в частотах, производительность RADEON X1300 PRO а также соперников – RADEON X700 и GeForce 6600 – при наложении рельефа методом EMBM становится приблизительно равной, впрочем, GeForce 6600 все же выглядит предпочтительней.


Эмуляция другого метода, Dot3, позволяет RADEON X1300 PRO опередить RADEON X700, но догнать GeForce 6600 ему явно не удаётся.


RADEON X1300 PRO выглядит вполне сбалансировано, почти не уступает в производительности RADEON X700.
Производительность при проигрывании видео

Для оценки производительности тестируемых видеоадаптеров при проигрывании различных форматов видео, мы использовали Windows Media Player 10 с установленным патчем, включающим Direct X Video Acceleration для WMV HD-контента. В качестве тестовых роликов использовались:

Ролик "Magic of Flight" в формате WMV HD, 1080p
Ролик в формате DivX, 640x480
DVD с фильмом "Starship Troopers", PAL

Как оказалось, все представители семейства RADEON X1000 продемонстрировали одинаковый результат:


Лучше всего новые видеоадаптеры ATI проявили себя при проигрывании файла в формате WMV HD – максимальный уровень загрузки CPU составил всего 41% на самой сложной сцене ролика, демонстрирующей огромную стаю птиц, взлетающую с поверхности озера. Минимальная загрузка CPU оказалась равной всего 15%, что более, чем в два раза лучше, нежели у GeForce 6/7 и RADEON X850 XT Platinum Edition. В среднем, в процессе проигрывания тестового ролика, центральный процессор был загружен на 20%-25%, что смело можно назвать великолепным результатом, а RADEON X1000 – наиболее подходящим решением для работы с HD-контентом.


Не столь удачно выступило новое семейство при проигрывании ролика, закодированного кодеком DivX – максимальный процент загрузки процессора оказался самым высоким среди участников теста. В процессе проигрывания минимальная загрузка составила 8%, что лучше, нежели 10-11% у GeForce 6/7, и хуже 2%, достигнутых на RADEON X850 XT Platinum Edition.


Напротив, с проигрыванием стандартного DVD-диска новинки справились великолепно, не оставим ни единого шанса остальным решениям, принявшим участие в тестировании.

Итак, судя по полученным данным, технология ATI Avivo работает отлично, особенно хорошо разгружая CPU системы при работе с HD и DVD-контентом. Более того, результат, полученный для ролика формата 1080p, без преувеличения можно назвать революционным – до появления RADEON X1000 ни один видеоадаптер не справлялся так хорошо со столь ресурсоемким форматом. В некоторых случаях, как, например, в первых версиях GeForce 6800 Ultra с отключенным видеопроцессором, уровень загрузки CPU доходил до 100%. Теперь же результат на уровне 20%-30% больше не кажется недостижимым, благодаря технологии Avivo. В то же время, по неизвестной причине, загрузка процессора при проигрывании DivX, оказалсь выше, нежели у конкурирующих решений, но все же не настолько, чтобы это создавало какие-либо неудобства. Не исключено, что в финальной версии CATALYST, поддерживающей RADEON X1000, этот недостаток будет исправлен.

Любопытно, что все модели RADEON X1000 продемонстрировали одинаковый уровень производительности при проигрывании видео. Вероятно, процессор Avivo работает на своей частоте, эта частота одинакова для всех представителей нового семейства, и не зависит от основной частоты GPU.
Заключение

С архитектурной точки зрения, без каких-либо сомнений, ATI RADEON X1000 является на сегодняшней день наиболее продвинутой графической архитектурой для ПК. RADEON X1800 – новый флагман от ATI – не только поддерживает шейдеры 3.0 (Shader Model 3.0), представление цвета в динамическом диапазоне (HDR, High Dynamic Range), а также возможности по увеличению качества изображения – такие как новый алгоритм анизотропной фильтрации и адаптивное сглаживание – но также предоставляет запас на будущее благодаря поддержке аппаратного декодинга видеопотоков в формате H.264, действительно быстрого выполнение ветвлений в пиксельных шейдерах 3.0, а также эффективный и перепрограммируемый Ring Bus контроллер памяти.

Проектируя RADEON X1000 вообще и флагманский продукт в частности, ATI уделила максимум внимания практической стороне использования каждой из внедренных возможностей. Представители компании утверждают, что разработчики уделяют максимум внимания наиболее эффективному внедрению возможностей, с прицелом на то, что каждая из них будет действительно задействована. Так, сегодня мы могли убедиться на практике в том, что внедрение Shader Model 3.0 было произведено не для галочки, а для реального использования – достаточно посмотреть как продукт RADEON X1600 XT умудряется оставлять позади в пару раз более дорого GeForce 7800 GTX при использовании динамических ветвлений пиксельных шейдеров 3.0. В дополнение, ATI семейство RADEON X1000 замечательно справляется с мультипроходным рендерингом, а также, судя по предварительной информации, с полноэкранным сглаживанием.

Принимая во внимание чрезвучайно эффективную архитектуру, а именно, наличие Ultra-Threading Dispatch Processor, перепрограммируемого контроллера памяти, высоких тактовых частот и большое количество исполнительных устройств (ALU), мы ожидаем, что RADEON X1800, RADEON X1600 и RADEON X1300 покажут достойную и конкурентноспособную производительность в играх.

Однако, не всё столь хорошо. Самый быстрый продукт в линейке – RADEON X1800 XT – имеет чрезмерное энергопотребление и при этом, подчас не опережает конкурента в сложных пиксельных шейдерах 2.0 по причине большего количества пиксельных процессоров у GeForce 7800 GTX.

Как RADEON X1800 XT, так и RADEON X1800 XL используют допольно длинные печатные платы и мощные системы охлаждения, что нельзя назвать преимуществом. Впрочем, и конкуренты не могут быть названы компактными графическими картами. Более того, в последние годы размеры корпусов увеличились, а потому, недостатком можно назвать разве только двухслотовую систему охлаждения на старшей моделе. Продукты RADEON X1600 XT и RADEON X1300 PRO построены на базе более компактных печатных плат, однако, к сожалению, эталонные системы охлаждения последних явно оставляют желать лучшего по части тишины.

Пока мы попридержимся говорить о рыночных перспективах новых графических решений, поскольку об этом можно будет говорить только после того, как мы ознакомимся с производительностью новинок от ATI в реальных игровых приложениях