"Быстрее, выше, сильнее". Обзор ATI RADEON 9700 PRO.

Автор: Tim
Дата: 07.10.2002
Все фото статьи

Введение


7-го августа 2002 года компания ATI объявила новый чип - ATI RADEON 9700 PRO (внутреннее название - R300), предназначенный для сектора "high-end" игровых видеокарт. Главное качество нового чипа - полная аппаратная поддержка требований, диктуемых спецификациями DirectX9 от Microsoft.
Что характерно, чип был объявлен задолго до появления финальной версии DirectX9, и на момент написания обзора ситуация не изменилась - первый в мире игровой чип с поддержкой DirectX9 есть, видеокарты на его основе продаются в массовых количествах, а самого DirectX9 до сих пор нет :).
Новый чип от ATI значительно превосходит остальные существующие на данный момент игровые 3D-чипы, как по сложности, так и по техническим характеристикам, и, пока NVIDIA разбирается с новым технологическим процессом и подготавливает выход NV30, имеет все шансы стать единоличным лидером в мире игровой графики.
Поэтому неудивительно, что, как только в нашей тестовой лаборатории появилась первая плата на базе ATI RADEON 9700 PRO, мы приступили к исследованиям производительности и возможностей нового чипа от ATI.

Возможности и особенности ATI RADEON 9700 PRO (R300)


Перечислим ключевые характеристики нового чипа от ATI:
Общие сведения:

Технология изготовления - 0.15 мкм;
Число транзисторов - ~110 млн.;
Тип корпуса - FCPGA;
Тактовая частота - 325 МГц в варианте ATI RADEON 9700 PRO;
Шина памяти - 256 бит DDR SDRAM;
Максимальный объем видеопамяти - 256 МБ;
Тактовая частота видеопамяти - 620(310 DDR) МГц в варианте ATI RADEON 9700 PRO;
Поддержка AGP 2X (3.3v), 4X (1.5V), 8X (0.8v) и Universal AGP 3.0 (2X/4X/8X);
Поддержка спецификаций PC2002.

3D-часть:

Восемь пиксельных конвейеров, удовлетворяющих требованиям спецификации пиксельных шейдеров DirectX 9 версии 2.0 (технология SMARTSHADER 2.0 от ATI);
По одному блоку выборки текстур в каждом пиксельном процессоре;
Поддержка билинейной, трилинейной, анизотропной и сочетания трилинейной и анизотропной фильтрации текстур;
Четыре вершинных конвейера, удовлетворяющих требованиям спецификации вершинных шейдеров DirectX 9 версии 2.0 (технология SMARTSHADER 2.0 от ATI);
Поддержка полноэкранного сглаживания методом мультисэмплинга с числом субпикселов 2, 4 и 6 (технология SMOOTHVISION 2.0 от ATI);
Поддержка тесселляции полигонов, непрерывной и адаптивной тесселляции, N-патчей, карт смещения (технология TRUFORM 2.0 от ATI);
Поддержка технологии повышения эффективности использования пропускной способности памяти (технология HyperZ III от ATI).

2D-часть:

Задействование блоков пиксельных шейдеров для обработки видео (технология VIDEOSHADER от ATI);
Фильтрация артефактов компрессии MPEG4/DivX (технология FULLSTREAM от ATI);
Аппаратная декомпрессия DVD, адаптивный деинтерлейсинг, компенсация движения;
Вывод изображения в компонентном формате YPrPb;
Два CRT-контроллера;
Два встроенных RAMDAC с частотой 400 МГц;
Встроенный TMDS-трансивер с частотой преобразования 165 МГц;

Блок-схема:

Характеристики нового чипа от ATI внушают уважение - это настоящий "монстр": больше 100 миллионов транзисторов, тактовая частота за 300 МГц, 256-битная шина памяти, 8 пиксельных и 4 вершинных конвейеров, совместимость с DirectX9...
Поговорим подробнее о возможностях нового чипа от ATI:

Пиксельные конвейеры.

В первую очередь бросается в глаза то, что для "урезанного" RV250 является нормой, но, кажется, никак не может считаться нормальным для игрового ускорителя класса "high-end" - пиксельные конвейеры ATI RADEON 9700 имеют всего по одному текстурному модулю.
На первый взгляд, такое решение инженеров ATI кажется спорным - R300 будет "буксовать" из-за недостаточной скорости текстурирования. Однако, такое построение пиксельных конвейеров ATI R300 вполне оправдано.
Во-первых, ATI RADEON 9700 имеет вдвое большее по сравнению с нынешними видеокартами количество пиксельных конвейеров, что снижает остроту вопроса о недостаточной скорости текстурирования - лошадиных сил для того, чтобы достойно показать себя, у восьмицилиндрового движка R300 будет достаточно :).
Во-вторых, текстурные модули R300 способны за один такт выполнять выборку восьми текстурных сэмплов - по 4 сэмпла с двух соседних MIP-уровней, и производить трилинейную фильтрацию "бесплатно" в плане расхода тактов чипа.
В-третьих, наличие двух или более текстурных модулей в пиксельном конвейере вызвало бы увеличение количества данных, читаемых из текстур за такт, в два или более раза, и потребовало бы увеличения объема кэшей. В противном случае R300 оказалось бы недостаточно даже его 256-битной шины памяти - уже в существующем виде каждый из пиксельных конвейеров R300, скажем, при наложении 32-битной текстуры за такт запрашивает до 256 бит данных (8 текстурных сэмплов по 32 бита), все восемь конвейеров в сумме - 2048 бит.
Как итог - вполне возможно, что инженеры компании ATI просто отказались от размещения в пиксельных конвейерах дополнительных блоков выборки текстур - чип, изготавливаемый по технологии 0.15 мкм, и без того оказался невероятно сложным.

HyperZ III

Для того, чтобы претендовать на лидерство среди игровых ускорителей класса "high-end", иметь высокую скорость заполнения и широкую шину памяти недостаточно. Необходимо эффективно использовать ресурсы графического чипа и шины памяти.
В ATI RADEON 9700 реализована фирменная технология от ATI, HyperZ III. Задача этой технологии - избежать ненужной обработки пикселов, заведомо не подлежащих отрисовке, то есть, находящихся от наблюдателя дальше, чем уже прорисованные. Например, в том случае, когда какой-нибудь из полигонов частично или полностью закрывается другим, то часть пикселов дальнего полигона, закрываемую ближним полигоном, можно не прорисовывать. Таким образом графический чип избавляется от значительного объема ненужной работы, вместе с тем повышается и эффективность использования доступной пропускной способности видеопамяти.
HyperZ III - развитие идеи иерархического тайлового Z-буфера, реализованной ATI еще в чипе RADEON 256.
Технология HyperZ III, воплощенная в R300, складывается из нескольких составляющих:

Hierarchical Z - Упрощенная реализация иерархического Z-буфера.
Идея иерархического Z-буфера достаточно проста: помимо самого Z-буфера организуется пирамида "Z-буферов пониженного разрешения", организованных наподобие MIP-уровней текстур.
Каждый из этих новых буферов имеет размеры, вдвое уменьшенные по горизонтали и вертикали по сравнению с предыдущим Z-буфером. При этом в каждое значение Z из буфера более низкого разрешения должно быть записано наибольшее из 4 соответствующих значений Z предыдущего буфера, имеющего более высокое разрешение.
ATI RADEON 9700, судя по всему, использует пирамиду из трех уровней Z-буферов - привычный Z-буфер, служащий основанием этой пирамиды, и еще два уровня, имеющих размеры по горизонтали и вертикали, уменьшенные относительно стандартного Z-буфера, соответственно, в четыре и в восемь раз:

Таким образом, в то время, как каждое значение стандартного Z-буфера соответствует одному пикселу изображения, значения из следующих уровней пирамиды хранят наибольшие величины Z из участков, содержащих, соответственно, 4х4 и 8х8 пикселов.

Для дальнейшего хода рассуждений придется вспомнить, что непосредственно отрисовку полигонов на экране любой графический ускоритель производит построчно - имея координаты треугольника, уже спроецированные на плоскость экрана с учетом перспективы, специальный блок, называемый Triangle Setup Engine, определяет набор строк из пикселов, подлежащих закрашиванию:

Каждая строка пикселов в пространстве представляет собой линию, пересекающую отрисовываемый в данный момент полигон:

Зная значения Z пикселов, лежащих в начале и конце строки, можно быть абсолютно уверенным в том, что значения Z всех промежуточных пикселов этой строки лежат между ними.
В этом утверждении, вероятнее всего, и содержится суть реализации Hierarchical Z от ATI.

Попробуем построить предполагаемый алгоритм отрисовки пикселов на ATI RADEON 9700:

Каждая из линий перед отрисовкой делится на отрезки длиной 8 пикселов (для простоты случай с "огрызками" длиной менее 8 пикселов, которые могут появиться на концах линии, не рассмариваем).
Эти отрезки как раз укладываются в участки изображения 8х8, которым соответствует Z-буфер низкого разрешения, лежащий на самой вершине пирамиды:

Каждое значение Z из этого буфера хранит максимальную удаленность пикселов из фрагмента 8х8 пикселов изображения. Кстати, использование разбиения на отрезки длиной именно 8 пикселов очень удобно для ATI RADEON 9700 из-за того, что чип имеет 8 пиксельных конвейеров и способен отрисовывать все 8 пикселов отрезка одновременно.

Для пикселов, лежащих на концах текущего отрезка, проверяются значения Z. Возможны два результата проверки:
1. Если ближайшее из двух значений Z на концах отрезка больше, чем значение Z, сохраненное для текущего фрагмента 8х8 в Z-буфере низкого разрешения, то весь отрезок гарантированно является невидимым, и пикселы этого отрезка далее не обрабатываются.
Для поддержания пирамиды Z-буферов в актуальном состоянии значение Z более удаленного конца отрезка записывается в Z-буфер низкого разрешения. Таким образом, в этом случае мы имеем 8 отброшенных пикселов и по одной операции чтения и записи в Z-буфер низкого разрешения.
Отрезок обработан, можно переходить к следующему отрезку длиной 8 пикселов.
2. Если ближайшее значение Z на концах отрезка меньше, чем значение, сохраненное в Z-буфере низкого разрешения, то какая-то часть пикселов отрезка подлежит отрисовке.
В этом случае отрезок делится на фрагменты длиной 4 пиксела, и с ними производятся те же операции, что и с исходным отрезком длиной 8 пикселов. Но на этот раз для сравнения берутся и в случае удачного отбрасывания пикселов обновляются значения из первого Z-буфера низкого разрешения, соответствующего фрагментам размером 4х4 пиксела.

Продолжать разбиение отрезков на еще более мелкие части не имеет смысла - у отрезка длиной два пиксела нет промежуточных пикселов, на проверке которых можно сэкономить :). Однако, сравнить величины Z единичных пикселов со значениями из "обычного" Z-буфера, лежащего в основании пирамиды, нужно (Early Z Test) - по результату сравнения можно будет либо отбросить единичные пикселы, либо отрисовать их и обновить значения Z в буферах для поддержания пирамиды Z-буферов в актуальном состоянии.

Итак, такова, вероятно, реализация Hierarchical Z в ATI RADEON 9700. Именно вероятно, поскольку точная информация о механизме работы HyperZ III от ATI, естественно не разглашается. Поэтому все эти рассуждения на тему Hierarchical Z можно рассматривать только как "рассуждения на тему" :).
Тем не менее, описанная схема работы выглядит весьма правдоподобно, и из нее, как следствие, прекрасно вырисовываются детали работы Fast Z Clear и Z Compression.

Fast Z Clear - быстрая очистка Z-буфера.
После построения и вывода на экран изображения, та информация, что содержится в Z-буфере, уже не актуальна и подлежит стиранию. Проще говоря - между кадрами нужно обнулить Z-буфер.
RADEON 9700, по заявлениям ATI, обнуляет Z-буфер, записывая не отдельные значения, а блоки 8х8 - по 64 значения сразу.
Такое обнуление Z-буфера можно напрямую реализовать, имея на вооружении иерархический Z-буфер. Для инициализации всей пирамиды Z-буферов достаточно записать начальные значения лишь в Z-буфер самого низкого разрешения - дальше, при построении кадра, пирамида Z-буферов автоматически будет поддерживаться в актуальном состоянии. Таким образом, кстати, косвенно подтверждается высказанное ранее предположение о том, что "верхний" Z-буфер пирамиды Z-буферов пониженного разрешения на ATI RADEON 9700 соответствует блокам 8х8 пикселей.

Z Compression - сжатие данных, читаемых из Z-буфера или записываемых в Z-буфер. Эффект сжатия данных, относящихся к Z-буферу, без потерь - результат действия Hierarchical Z. Помимо отбрасывания пикселей, не подлежащих обработке, Hierarchical Z эффективно снижает количество операций чтения и записи значений Z-буфера, составляющих немалую долю в общем потоке данных, передаваемых по шине памяти.

Новый контроллер памяти:

На ATI RADEON 9700 установлен "расщепленный" на 4 канала контроллер памяти - это знакомо нам еще со времен NVIDIA GeForce3:

По сути, в этом случае контроллер памяти представляет собой 4 независимых контроллера с шириной шины 64 бит у каждого. При этом суммарная ширина шины памяти составляет 256 бит.
Весьма непривычно видеть в чипе от ATI технологию, свойственную графическим чипам от NVIDIA, однако контроллер памяти, построенный таким образом, уже доказал свою эффективность на примере чипов GeForce3 Ti/GeForce4 Ti.
Впрочем, и ATI уже имеет опыт создания подобных контроллеров - чипы ATI RADEON 8500 и ATI RADEON 9000/PRO (R200 и RV250) используют 128-битный контроллер DDR SDRAM, разделенный на два 64-битных канала. Но в ATI RADEON 9700 (R300) используется разделение контроллера уже на 4 канала, что позволяет сделать нагрузку на память еще более равномерной и повысить эффективность использования пропускной способности шины памяти - при передаче маленьких блоков данных широкий 256-битный контроллер памяти использовался бы неэффективно.

Новый алгоритм анизотропной фильтрации текстур

При разработке нового чипа команда инженеров ATI учла все замечания, предъявляемые к качеству анизотропной фильтрации текстур на предыдущих чипах - это невозможность сочетать её с трилинейной фильтрацией текстур и неважное качество работы алгоритма на наклонных поверхностях.
Новый алгоритм анизотропной фильтрации текстур, являясь усовершенствованной версией старого, "быстрого" алгоритма от ATI, гораздо лучше работает на наклонных поверхностях и, наконец-то, позволяет задействовать сочетание трилинейной и анизотропной фильтрации.
Несмотря на приведение анизотропной фильтрации текстур на новом чипе гораздо ближе к идеалу, задействование этой функции, как и на ATI RADEON 8500/9000 PRO, по-прежнему, не приводит к столь значительным величинам падения скорости, как на NVIDIA GeForce3 Ti / GeForce4 Ti.

Новый метод полноэкранного сглаживания - SMOOTHVISION 2.0

Новая технология полноэкранного сглаживания, SMOOTHVISION 2.0, реализованная в ATI RADEON 9700 PRO, является одной из разновидностей мультисэмплинга. В отличие от SMOOTHVISION на ATI RADEON 8500, 9000 / PRO, суперсэмплинга с расположением субпикселов на упорядоченной сетке (Ordered Grid Super Sampling, OGSS), ATI RADEON 9700 PRO при включении SMOOTHVISION 2.0 рассчитывает субпикселы только на границах полигонов, не выполняя дополнительной ненужной работы для пикселов, находящихся во "внутренностях" треугольников. То есть, теперь, наконец, и в чипе от ATI оказалась реализованной идея мультисэмплинга, впервые появившаяся еще в NVIDIA GeForce3.
Однако, в отличие от чипов компании NVIDIA, способных рассчитывать 2 или 4 субпиксела для пикселов, лежащих на границах полигонов, R300, как и R200 или RV250, "по привычке" поддерживает разбиение пиксела на 2, 4 или 6 субпикселов. Нетрудно догадаться, что качество сглаживания "ступенек" на границах полигонов в этом случае будет как минимум не хуже, чем у чипов от NVIDIA. А вот скорость - уже другой вопрос...
Качество и скорость работы новых алгоритмов анизотропной фильтрации и антиалиасинга от ATI мы подробно рассмотрим во второй и третьей частях статьи. Не проходите мимо, сюрпризы гарантирую :).

VIDEOSHADER:

Возможность задействования пиксельных шейдеров для обработки видеопотока компанией ATI была названа громким именем VIDEOSHADER.
Благодаря поддержке VIDEOSHADER, ATI RADEON 9700 избавляется (а значит, становится чуть проще, надежнее и дешевле) от некоторых блоков, предназначенных специально для работы с видео, и вместо них использует пиксельные шейдеры:


Как показано на блок-схеме, с помощью пиксельных шейдеров может выполняться деинтерлейсинг, подавление шумов, конверсия цветовых пространств и "сглаживание" изображения, избавляющее его от артефактов, характерных для аглоритмов компрессии MPEG4 / DivX.

HYDRAVISION:

Это слово знакомо нам еще с момента появления ATI RADEON VE. Технологией HYDRAVISION ATI называет поддержку мультимониторных конфигураций.
В этом плане ATI RADEON 9700 не имеет никаких революционных изменений - как и предыдущие чипы, R300 поддерживает вывод изображения на два аналоговых монитора, один аналоговый + один цифровой, аналоговый монитор + телевизор, цифровой монитор + телевизор.
За вывод изображения на аналоговые мониторы отвечают два встроенных RAMDAC с рабочей частотой 400 МГц, вывод на цифровые мониторы обеспечивает встроенный TMDS-трансмиттер с частотой преобразования 165МГц и, наконец, вывод картинки на TV обеспечивает встроенный блок формирования телевизионного сигнала:

При установке на плату внешнего TMDS-трансмиттера сторонних производителей возможно подключение двух мониторов по цифровому интерфейсу.

Итак, настала пора поговорить о тех возможностях ATI RADEON 9700, которые будут задействованы только при появлении Microsoft DirectX9 и приложений, использующих функции графических ускорителей, совместимых с новым стандартом от Microsoft.
Пиксельные и вершинные процессоры ATI RADEON 9700, удовлетворяющие требования DirectX9, компания ATI назвала технологией SMARTSHADER 2.0.

DirectX9 - "Уже скоро..."


Для начала хочу сразу сказать о том, чего до сих пор нет...
Во-первых, новая версия API от Microsoft, DirectX 9, до сих пор не вышла в свет, поэтому, разумеется, пока нет и демонстрационных программ, тестов и, уж тем более, игр, использующих возможности DirectX9-совместимых ускорителей. Во-вторых, как следствие, у ATI нет публично доступного DirectX9-драйвера для ATI RADEON 9700. Наконец, у ATI RADEON 9700, как DirectX9-совместимого ускорителя, нет даже конкурентов - NV30 от NVIDIA, по предварительным неофициальным данным, не уступающий R300 ни по скорости, ни по возможностям, появится позже - вероятно, ближе к концу года.
Принимая во внимание всё вышеперечисленное, я считаю, что на данный момент нет никакого смысла в подробном рассмотрении всех тонкостей нового API и его воплощения от ATI "в железе". Когда появится DirectX9, тесты или хотя бы демонстрационные программы, можно будет говорить о выходе DirectX9 как о состоявшемся событии.
Пока же стоит рассмотреть лишь принципиальные нововведения, содержащиеся в спецификациях пиксельных и вершинных шейдеров DirectX9.

Пиксельные конвейеры ATI RADEON 9700, пиксельные шейдеры версии 2.0

Наибольшие изменения при переходе от DirectX8 к DirectX9 коснулись пиксельных шейдеров. Давайте остановимся на ключевых моментах:

Превращение блоков пиксельных шейдеров в пиксельные процессоры:

Если раньше пиксельный шейдер просто переводился в набор настроек текстурных стадий пиксельного конвейера, то теперь пиксельный шейдер - настоящая программа, которую пиксельный конвейер, а точнее, теперь уже настоящий пиксельный процессор выполняет последовательно, команду за командой. То есть, новые спецификации определяют изменение архитектуры блоков, исполняющих пиксельных шейдеры - теперь это полноценные процессоры.

Больше данных, больше команд:

Пиксельные шейдеры DirectX9 версии 2.0 стали намного сложнее. Новые спецификации диктуют следующие требования к аппаратной части:
Использование в ходе выполнения шейдера данных из 16 текстур;
32 операции адресации;
64 арифметические операции;
16 регистров общего назначения;
16 регистров для хранения констант.

ATI RADEON 9700, как и положено DirectX9-совместимому ускорителю, этим требованиям полностью соответствует.
Для сравнения - спецификации пиксельных шейдеров версии 1.4, чья аппаратная поддержка реализована в ATI RADEON 8500, 9000/PRO (R200, RV250):
Использование в ходе выполнения шейдера данных из 6 текстур;
2*6 операций адресации;
2*8 арифметических операций;
6 регистров общего назначения;
8 регистров для хранения констант.

Очевидно, пиксельные шейдеры DirectX9 являются намного более гибкими в сравнении с DirectX8.1.

Представление данных в формате с плавающей точкой и вычисления в формате с плавающей точкой:

Спецификации пиксельных шейдеров версии 2.0 вводят новые форматы представления данных - помимо стандартных целочисленных форматов и формата с фиксированной точкой, теперь доступно хранение данных векторами (наборами) по 1, 2 и 4 значения в 16-битном формате с плавающей точкой и 32-битном формате с плавающей точкой.
Соответственно, пиксельный процессор должен поддерживать вычисления в формате с плавающей точкой.

ATI RADEON 9700 имеет по одному пиксельному процессору в каждом из восьми параллельно работающих пиксельных конвейеров - всего восемь пиксельных процессоров:

Пиксельные процессоры ATI RADEON 9700, в соответствии с требованиями DirectX9, поддерживают вычисления в формате с плавающей точкой:


Несмотря на то, что блоки пиксельных шейдеров у ATI RADEON 9700 имеют новую архитектуру, возможность исполнения пиксельных шейдеров DirectX8.1, разумеется, сохранена.

Вершинные конвейеры ATI RADEON 9700, вершинные шейдеры версии 2.0

Вершинные шейдеры новой версии также значительно отличаются от спецификации вершинных шейдеров 1.1:

Управление потоком команд:

Программы, выполняющиеся вершинными конвейерами Direct9-совместимого ускорителя - вершинные шейдеры - стали еще более близкими к привычному пониманию программами: в них появилась возможность управления потоком команд: циклы, условные и безусловные переходы, вызовы подпрограмм.

Больше команд, больше регистров:

В новой спецификации вершинных шейдеров длина программы увеличилась со 128 до 256 команд, количество регистров общего назначения - с 8 до 16, количество регистров для хранения констант - с 96 до 256.

В то время, как NVIDIA GeForce4 Ti и ATI RADEON 8500 имеют по два блока вершинных шейдеров, новый чип от ATI имеет 4 четыре вершинных процессора, работающих параллельно:

Каждый из процессоров имеет два блока, работающих параллельно - блок скалярных вычислений и блок векторных вычислений:


Адаптивная тесселляция, карты смещения:

Еще одним новшеством, введенным в спецификации DirectX9, является обязательная поддержка тесселляции полигонов и карт смещения (подробно о тесселляции полигонов и картах смещения написано в нашем обзоре Matrox Parhelia).
ATI RADEON 9700, как и Matrox Parhelia-512, поддерживает тесселляцию треугольников с поддержкой не только целочисленных, но и дробных уровней тесселляции - то есть, с поддержкой непрерывной тесселляции. Так же, как и Matrox Parhelia, новый чип поддерживает адаптивную тесселляцию треугольников - плавное изменение уровня тесселляции при изменении расстояния от полигона до наблюдателя.

Свой метод тесселляции полигонов, "выросший" из TruForm, в совокупности с поддержкой карт смещения (Displacement Maps) компания ATI назвала технологией Truform 2.0.
При использовании N-патчей полигоны разбиваются на более мелкие так же, как при действии TruForm, только с единственным дополнением - поддерживаются не только целочисленные значения уровня тесселляции:

При использовании карт смещения полигоны разбиваются точно так же. Однако, вершины образованных полигонов выстраиваются не на сплайне, заданном нормалями в вершинах исходного треугольника, а в соответствии со значениями смещений, выбранных из карты смещения:



Итак, когда же мы сможем увидеть всё это торжество новых технологий в деле?
Если вспомнить, сколько времени прошло с момента DirectX8 и DirectX8-совместимых ускорителей, пересчитать игры, полноценно использующие возможности DirectX8 и "примерить" эту ситуацию на DirectX9, то причин для оптимизма остается мало.
Тем не менее, уже сейчас можно полюбоваться на скриншоты, полученные компанией ATI на чипе RADEON 9700:


Скриншот, иллюстрирующий результат HDR (High Dynamic Range) Rendering - построения изображения с большой точностью цветов и большим диапазоном яркостей. Используется представление данных в формате с плавающей точкой.




Имитация рисования сцен "от руки".






Спортивный автомобиль. Двухтоновая ("хамелеон") окраска типа "металлик" - базовый цвет, освещенность, отражение света от металлической пудры и отражение окружающего интерьера на глянцевой поверхности лака смоделированы с помощью единственного пиксельного шейдера, соответствующего спецификациям DirectX9. Используется представление данных в формате с плавающей точкой.


Имитация объемной структуры дерева с помощью пиксельного шейдера, соответствующего спецификациям DirectX9.

Плата PowerColor Evil Commando 2 на базе ATI RADEON 9700 PRO


Первой из плат на базе ATI RADEON 9700 PRO в нашей тестовой лаборатории оказалась видеокарта Evil Commando 2 от PowerColor.
Плата упакована в симпатичную картонную коробку, на которой, вероятно как раз и изображен этот "Evil Commando":

Не знаю, не знаю... В моём представлении злобный коммандо должен выглядеть немного не так. Во-первых, что это за прическа? Правильный коммандо прически не имеет вообще, но должен обладать квадратной головой небольших размеров (чтобы в неё было труднее попасть из пистолетов - пулеметов - неуправляемых противотанковых ракетных снарядов), оснащенной в её нижней части квадратной челюстью, в верхней части одним или двумя маленькими, но недобро смотрящими глазами, и где-нибудь посередине - сломанным носом. Вся эта конструкция обязательно должна быть измазана гуталином (или что там еще используют гримеры на съемках), обязательно, потом и, по желанию, кровью врагов. Синяки и царапины - по вкусу, но не слишком много, чтобы сохранился товарный вид.
Модные железные доспехи настоящему герою не нужны, иначе не будет видно бицепсов, трицепсов и прочих архитектурных элементов загорелого корпуса тренированного убийцы. Ну, и, напоследок, в руках - двухсоткилограммовая шестиствольная пушка, с мясом вырванная из вертолетной турели.
А это что? С таким "Евил Коммандо" каши не сваришь :).

Итак, будем считать, что об оформлении коробки я написал. Однако, что это? Оказывается, картонка - это только "фантик", а уже под ним - пластиковая коробка, в которой хранится видеокарта и всё прилагающееся к ней добро:

Упаковка имеет откидывающиеся ручки, которые позволяют ей прикидываться и обычной пластиковой коробкой, и этаким "чемоданчиком":

Открывам. В комплект поставки входит, помимо видеокарты, компакт-диск с драйверами и утилитами, руководство пользователя и комплект кабелей и переходников (DVI-I -> D-SUB, S-Video -> RCA, кабель S-Video и кабель RCA):

Также в комплект поставки PowerColor Evil Commando 2 входит специальный кабель для подачи на плату дополнительного питания:

Когда я попробовал включить систему, не подав на видеокарту дополнительное питание...:

...из системного динамика раздался недовольный писк, а на экране появилось сообщение с требованием подключить этот кабель:

Cистема стала загружаться только после того, как к видеокарте был подключен требуемый кабель:

Все видеокарты на базе ATI RADEON 9700 PRO, или, по крайней мере, те, что выпускаются на данный момент, выполнены по референс-дизайну от ATI и выглядят совершенно одинаково. PowerColor Evil Commando 2 на базе ATI RADEON 9700 PRO - не исключение:

Видеокарта выглядит весьма внушительно из-за приличных размеров кулера, установленного на графическое ядро, и большого количества конденсаторов, сглаживающих пульсации напряжения в стабилизаторах питания графического ядра и видеопамяти. Кстати, один из стабилизаторов, выполненный на обратной стороне платы, для лучшего отвода тепла накрыт алюминиевой пластинкой.
Потребление нового чипа от ATI и микросхем видеопамяти, установленных на плате, оказалось настолько большим, что инжененры из ATI решили не перегружать стабилизаторы материнской платы, обеспечивающие питание слота AGP, а брать дополнительное питание прямо от блока питания системы:

Чип ATI RADEON 9700 PRO, как мы уже говорили, выполнен в форм-факторе FCPGA. По внешнему виду он сильно напоминает старые-добрые Intel Pentium III, но отличается от них поистине грандиозными размерами кристалла и установленной прямо на подложке металлической рамкой, защищающей ядро от сколов:

Ядро промаркировано кодовым именем ATI RADEON 9700 PRO - R300:

Тактовая частота работы ATI RADEON 9700 PRO на плате PowerColor Evil Commando 2 точно соответствует рекомендациям ATI и составляет 325 МГц.
Под стать ядру и кулер, отводящий тепло от этого "монстра". Если вспомнить, что видеокарты на чипах от ATI, в принципе, никогда не выделялись огромными кулерами, чаще демонстрируя нечто скромное и "тихоходное", а то и вовсе пассивные радиаторы, то такой солидный кулер уже о многом говорит:

В качестве термоинтерфейса применен двухфазный материал "Thermagon", часто используемый на кулерах для процессоров:

При нагреве графического ядра плёнка этого материала размягчается, и его лишний объем выдавливается по бокам от ядра.

На плате PowerColor EvilCommando 2 установлено 128 МБ видеопамяти 256 бит DDR SDRAM в микросхемах от SAMSUNG с временем цикла 2.8 нс:

Тактовая частота видеопамяти составляет 620 (310 DDR) МГц.

Последнее, что остается рассказать о PowerColor Evil Commando 2 - то, что плата оснащена разъемами D-SUB, DVI-I и комбинированным разъемом S-Video и поддерживает подключение мониторов по цифровому и аналоговому интерфейсам, а также, телевизора - по композитному или S-Video кабелю:



Итак, PowerColor Evil Commando 2 - стандартная видеокарта на базе ATI RADEON 9700 PRO, укомплектованная всем необходимым для работы и весьма интересно оформленная. Мои замечания насчет оформления картонного "фантика" можно не принимать близко к сердцу - это сугубо личное мнение человека со слишком богатым воображением :).

В следующей части статьи мы исследуем новые методы антиалиасинга и анизотропной фильтрации, реализованные в ATI RADEON 9700.


Далее: Часть 2 - новые методы антиалиасинга и анизотропной фильтрации.