Обзор графической архитектуры ATI Radeon HD 4800: долгожданный реванш?

Автор: Vader
Дата: 13.08.2008
Все фото статьи

Введение


Широко известно, что до недавнего времени дела ATI, графического подразделения Advanced Micro Devices, шли не лучшим образом. Компания так и не смогла представить графической архитектуры, способной на равных конкурировать с Nvidia GeForce 8/9, особенно в секторе производительных решений. ATI Radeon HD 2900, хотя и не стал полным провалом, но успешным его назвать было нельзя ни при каких обстоятельствах – горячий и чрезвычайно неэкономичный графический процессор заметно уступал тогдашним решениям Nvidia, построенным на базе ядра G80. Главной причиной этому были неоднозначные архитектурные решения, в частности, ставка на суперскалярную архитектуру вычислительного блока и неудачный дизайн текстурных модулей вкупе с недостаточным их количеством.

В результате, доходы ATI серьёзно упали, а выпуск нового графического процессора RV670, легшего в основу семейства ATI Radeon HD 3800, хотя и в существенной мере сгладил ситуацию, но так и не стал долгожданным откровением. Последнее неудивительно, поскольку новый чип являлся всего лишь «работой над ошибками», допущенными в R600. Единственным прорывом стало использование 55-нм техпроцесса, в остальном же новинка сохранила архитектуру R600, обретя поддержку UVD, DirectX 10.1, а также утратив 512-битную внешнюю шину памяти. ATI Radeon HD 3870 и 3850 вполне закономерно стали настоящими хитами среди любителей современных игр, не готовых тратить свыше 5-7 тысяч рублей на покупку графического адаптера, поскольку смогли предложить им приемлемый уровень производительности по приемлемой цене, а ведь ни для кого не является секретом, что основной объем продаж приходится именно на недорогие графические карты, а вовсе не на продукты с ценой, превышающей десять тысяч рублей.

Впоследствии семейство ATI Radeon HD 3000 пополнилось уникальным продуктом – двухпроцессорным ATI Radeon HD 3870 X2. Пусть ненадолго, ATI всё же смогла показать, что она всё ещё в состоянии быть технологическим лидером, но после появления Nvidia GeForce 9800 GX2 окончательно стало ясно, что потенциал архитектур ATI Radeon HD 2000/3000 исчерпан, и многого выжать из него не удастся. Однако, вместе с тем, становилось всё очевиднее, что эра монолитных чипов-монстров подходит к концу: в погоне за производительностью их площадь, сложность и уровень энергопотребления быстро растут, но вместе с тем, выход годных кристаллов такой сложности существенно снижается, а себестоимость, соответственно, растёт. В результате, сделать хотя бы сравнительно недорогим видеоадаптер на базе такого мегачипа в какой-то момент не удастся.

Имея за плечами опыт разработки ATI Radeon HD 3870 X2, AMD с самого начала решила не ввязываться в очередной круг гонки за количеством исполнительных блоков и площадь графического процессора. Компания не ставила перед собой задачи сделать самый большой, мощный и дорогой графический процессор в мире, хотя вполне могла бы так поступить, располагая соответствующими ресурсами в сфере разработки и проектирования новых решений, вопреки ряду скандальных заявлений, сделанных Nvidia. Вместо этого, RV770 изначально проектировался в рамках новой стратегической концепции, становым хребтом которой является сравнительно недорогой, но достаточно производительный графический процессор, удовлетворяющий требованиям основной массы игроков. Стоимость решений на базе одного такого чипа должна составлять около 300 долларов, а запросы энтузиастов, готовых выложить любую сумму за максимально возможную производительность в данной концепции удовлетворяются путём выпуска многочиповых решений, конструктивно подобных ATI Radeon HD 3870 X2.

Как было упомянуто в обзоре ATI Radeon HD 3870 X2, у данного подхода есть определённые недостатки, но и преимуществ на данный момент немало. В первую очередь, это ориентация на наиболее многочисленную аудиторию игроков, а также возможность быстрого выпуска более производительных решений. Последнее легко объяснимо: создание двухчиповой графической карты, хотя и является сложным предприятием, всё же значительно уступает по сложности и временным затратам разработке нового, более производительного монолитного графического ядра и решений на его основе с нуля. При этом очевидно, что новая рабочая лошадка ATI должна обеспечивать производительность на уровне лучших одночиповых решений предыдущего поколения – лишь в этом случае стратегия окажется удачной.

Данный обзор как раз и призван ответить на вопрос о том, насколько высок потенциал новых графических решений ATI Technologies. С этой целью архитектура графического ядра RV770 будет детально рассмотрена и подвергнута всестороннему анализу. Но сначала следует рассказать о характеристиках серийных графических карт, использующих новый GPU.

ATI Radeon HD 4800: новейший графический процессор ATI


Если в случае с RV670 (Radeon HD 38x0) правомерность присвоения следующей цифры, обозначающей поколение, можно было поставить под сомнение, так как этот GPU мало чем отличался от ядра предыдущего поколения, R600 (Radeon HD 2900), то с RV770 таких сомнений не возникает – это действительно новый продукт, пусть и унаследовавший большинство черт своих предшественников. Новое семейство получило название ATI Radeon HD 4800, причём, схема наименования разных моделей графических карт, впервые использованная ATI в семействе ATI Radeon HD 3800, сохранена: первая цифра означает поколение графической архитектуры, вторая – семейство, а две последние – модель конкретного видеоадаптера.


На момент анонса новой графической архитектуры представлено две модели: ATI Radeon HD 4850, с официальной ценой 199 долларов, и ATI Radeon HD 4870, оснащенный высокоскоростной памятью GDDR5 и имеющей официальную стоимость 299 долларов. В московской рознице на момент публикации статьи эти карты стоили немного дороже:пять тысяч и девять тысяч рублей, соответственно.


Ядро RV770 состоит из 956 миллионов транзисторов, что довольно внушительно на первый взгляд, однако, не является абсолютным рекордом в индустрии; пальма первенства в этой области принадлежит Nvidia с её чипом GT200, насчитывающим 1.4 миллиарда транзисторов. Первенство можно назвать сомнительным, поскольку конкурент ATI использует менее совершенный 65-нм техпроцесс, что при огромной площади и сложности такого ядра автоматически означает меньшее количество ядер на подложке и меньший выход годных, а, следовательно, значительно более высокую себестоимость производства, однако, подобный подход является типичной тактикой Nvidia в последние годы. Карты на базе GT200 едва ли станут дешёвыми с течением времени, в отличие от новых решений ATI, использующих RV770. Таким образом, стратегия, избранная ATI Technologies, на первый взгляд, вполне оправдывает себя.

Следует отметить, что частоты GPU были заметно понижены по сравнению с картами на базе GPU предыдущего поколения, RV670, что вполне объяснимо существенно возросшей сложности нового ядра. С учётом усиленной вычислительной и текстурной мощности это не должно составлять какой-либо проблемы. Ещё одна любопытная деталь, заслуживающая внимания: применение в старшей модели ATI Radeon HD 4800 быстрой памяти GDDR5 позволило добиться высокой пропускной способности, не прибегая к расширению внешней шины доступа, как это сделала ATI в прошлом году и делает Nvidia сейчас. Увеличение разрядности шины памяти свыше традиционных 256 бит приводит к значительному усложнению печатной платы, а, следовательно, и к её удорожании. Разумеется, память GDDR5 стоит дороже, чем широко распространённая GDDR3, но, по-видимому, эта разница с лихвой компенсируется более простым дизайном PCB. Во всяком случае, об этом прямо свидетельствует сравнительно низкая рекомендуемая цена ATI Radeon HD 4870, составляющая всего 299 долларов, что на 100 долларов ниже рекомендуемой цены Nvidia GeForce GTX 260 и на 350 долларов – цены Nvidia GeForce GTX 280. С другой стороны, поскольку развёртывание производства GDDR5 находится пока на начальном этапе, использование нового типа памяти может повлечь нехватку графических карт по причине недостаточных поставок. На практике же – то есть в розничной продаже – цены на Radeon HD 4870 и GeForce GTX 260 на момент подготовки статьи были приблизительно равными с небольшим преимуществом видеокарт на чипах ATI, за GTX 280 же пришлось бы отдать на пять тысяч рублей больше.

Из приведённой сравнительной таблицы технических характеристик можно также увидеть, что в RV770 серьёзно наращена как вычислительная мощность, так и мощность текстурных процессоров, причём, последнее нововведение представляется более важным, так как именно текстурные процессоры были самым слабым местом RV670. Увеличение количества TMU с 16 до 40 гарантирует, что больше «бутылочным горлышком» они не будут, даже если их архитектура и осталась прежней. Для сравнения, ядро Nvidia GT200 в максимальной конфигурации содержит 80 TMU, однако, в реальных условиях их производительность примерно в два раза ниже, так что можно говорить о паритете с RV770, даже без учёта того, что ATI Radeon HD 4870 не является прямым конкурентом Nvidia GeForce GTX 280/260. Конечно, для полноты картины необходимы результаты тестов, но им будет посвящена отдельная глава обзора.

Хорошо известно, что суперскалярная архитектура ATI Radeon HD очень чувствительна к оптимизации шейдерного кода, несмотря на то, что в состав всех графических процессов этого поколения входит специализированный диспетчер распределения задач. Увеличение общего количества ALU с 320 до 800 позволяет уменьшить потери производительности в том случае, если драйвер плохо оптимизирован под какое-либо 3D-приложение. В худшем случае, задействованным окажется одно ALU из пяти, но даже в этом случае работать будут 160 ALU, а не 64, как в RV670, что позволяет ожидать от новинки эффективности, сопоставимой с Nvidia GeForce 9800 GTX. В благоприятном же случае вычислительная мощность ATI Radeon HD 4850 может достигать 1 терафлопа. По этому показателю скромная карта может потягаться с практически втрое более дорогим Nvidia GeForce GTX 280, для которого разработчиком также заявлена вычислительная мощность порядка 1 терафлопа (который включает в себя специфические задачи, вроде текстурной адресации).

Улучшения претерпели и растровые процессоры. Хотя их количество осталось прежним, но эффективность работы с Z-буфером была увеличена в 2 раза, что позволило RV770 обрабатывать 64 значения Z за такт, против 32 значений у RV670.

Итак, новинка действительно обладает внушительным потенциалом и выглядит весьма многообещающе. Но прежде чем перейти к практическим тестам, следует рассмотреть все нововведения подробнее.

ATI Radeon HD 4850: кольцу сказали «нет»


Ядро RV770 под микроскопом выглядит следующим образом:


Хорошо видно, что топология подсистемы доступа к памяти в целом сохранена, хотя теперь её нельзя назвать кольцевой: почти каждый контроллер памяти соединен двунаправленным интерфейсом с другим, однако, само «кольцо» более не является замкнутым. Интерфейс доступа к памяти по-прежнему расположен по периметру кристалла, и рядом с ним расположены функциональные блоки, наиболее критичные к пропускной способности:


Вместе с тем, в составе ядра появился коммутатор, связывающий между собой блоки, менее требовательные к пропускной способности – интерфейс шины PCI Express, интерфейс CrossFireX, видеопроцессор UVD2, контроллеры дисплеев и т.д. Эффективность использования ресурсов подсистемы памяти в предыдущих поколениях ATI Radeon HD и без того достигала 85 % по данным ATI, а оптимизация топологии RV770 позволила довести её практически до максимума. Вместе с возможностью применения быстрой памяти GDDR5 это избавило разработчиков от необходимости использования внешней шины разрядностью более 256 бит, что положительно сказалось на простоте дизайна печатных плат ATI Radeon HD 4800.

ATI Radeon HD 4800: Ultra Threaded Dispatch Processor 3.0?


Ключевой частью любого графического ядра с современной архитектурой является блок диспетчера задач, на плечи которого возложена работа по распределению доступных ресурсов процессора таким образом, чтобы все его части были максимально загружены, и, следовательно, производительность стремилась к максимально возможной.

Блок диспетчера задач впервые появился ещё в составе семейства ATI Radeon X1000, где он мог управлять 512 ветвями кода по 16 пикселей каждая. Вторая версия процессора распределения задач была представлена в составе ATI Radeon HD 2000. Новый обработчик не только мог обрабатывать больше ветвей кода, но и делать это точнее и эффективнее – минимальный размер ветви был уменьшен с 16 до 5 пикселей.


К сожалению, точная информация об усовершенствованиях в этой части RV770 отсутствует, но очевидно, что количество блоков арбитража (arbiter) и синхронизации (sequencer) было увеличено вместе с увеличением количества SIMD-массивов. Кроме того, благодаря улучшениям, каждый SIMD массив теперь может использовать данные другого, что требовало определенных модификаций алгоритма работы диспетчера задач. В дополнение, а архитектуру графического процессора Radeon 4800 был внесём ряд оптимизаций для GPGPU, что также может означать изменение модели работы диспетчера задач.

ATI Radeon HD 4800: когда 160=800


Вычислительная часть R600 и RV670 состояла из 64 универсальных модулей, каждый из которых включал в себя пять ALU, блок управления потоком и массива регистров общего назначения. Четыре ALU из пяти были достаточно простыми устройствами, способными исполнять за такт одну инструкцию FP MAD, а четвёртый – комплексным, умеющим работать со сложными инструкциями SIN, COS, LOG, EXP и т.д. По сути, каждый вычислительный модуль являлся процессором с пятистадийным конвейером.

В теории, такая организация позволяла говорить о наличии 320 исполнительных устройств, но на самом деле, это было справедливо только для случая полной загрузки всех 64 конвейеров, что на практике обеспечивалось далеко не всегда: в трёхмерных приложениях многие операции зависят от результатов выполнения предыдущих операций, поэтому последовательной работы конвейера добиться непросто. Это требует значительных оптимизаций под конкретное приложение на уровне драйверов Catalyst, но получить доступ к программной «начинке» игры не всегда возможно, по крайней мере, до её официального выпуска.

Как следствие, на практике нередко оказывалось, что выполнением полезной работы занято только одно ALU в каждом вычислительном модуле, что значительно снижало потенциал архитектуры ATI Radeon HD и приводило к отставанию в играх от решений на базе Nvidia G80/G92. Последние не только имели больше независимых вычислительных блоков, но и блоки эти функционировали на более высоких тактовых частотах. Создавая RV770, группа разработчиков ATI решила проблему с возможной неэффективностью суперскалярной архитектуры, что называется, прямым путём, а именно – увеличив количество вычислительных модулей с 64 до 160. Конечно, это увеличило количество транзисторов на ядре, однако, использование 55-нм техпроцесса позволило удержать его площадь в разумных пределах.

Сама архитектура модулей заметных изменений не претерпела, и они по-прежнему состоят из 5 ALU, блока управления потоком и набора регистров общего назначения:


Если верить заявлениям ATI, то эффективность вычислительных модулей была увеличена на 40 %, но даже простое наращивание их количества с 64 до 160 способно сделать Radeon HD 4800 конкурентоспособным решением даже в не слишком благоприятных для данной архитектуры условиях. И это ещё не всё; как уже упоминалось выше, изменения присутствуют и на более глобальном уровне – уровне топологии ядра. При частичном сохранении кольцевой топологии расположение функциональных блоков было оптимизировано. Вычислительные модули RV770 объединены в 10 SIMD-ядер (раньше таких ядер было 4), по 16 модулей (80 ALU) в каждом:


Каждое такое вычислительное ядро обслуживается выделенной управляющей логикой, имеет в своём распоряжении 4 TMU и кэш первого уровня. Ядра могут общаться между собой как на локальном, так и на глобальном уровне.

Отметим, что соотношение вычислительных и текстурных мощностей осталось прежним и составляет 4 к 1. ATI считает его оптимальным, и с этим можно поспорить, однако, такой спор лишен смысла, поскольку RV770, в отличие от своего предшественника, явно не испытывает недостатка ни в той, ни в другой мощностях. Разумеется, возможности DirectX 10.1 поддерживаются в полной мере.

ATI Radeon HD 4800: текстурные процессоры и кэши


Основным узким местом графических ядер ATI R600 и RV670 являлась подсистема текстурных процессоров.

Во-первых, их было всего 16 (4 больших блока), чего было явно недостаточно, даже, несмотря на тенденцию преобладания математических спецэффектов над использованием сложных текстур высокого разрешения, обусловленную ориентацией разработчиков игр на мультиплатформенность. Во-вторых, на каждые два блока адресации текстур приходился всего один блок фильтрации, что существенно снижало эффективность текстурных блоков при выполнении текстурной фильтрации, особенно анизотропной, которая сегодня используется повсеместно, и нет никаких оснований предполагать, что от её использования откажутся в будущем.

При разработке RV770 эти недостатки были учтены, и новое ядро получило новые текстурные процессоры:


Их дизайн был полностью переработан, и теперь каждый TMU содержит 16 блоков выборки текстур FP32, 4 блока адресации и 4 блока фильтрации. Казалось бы, эффективность выборки должна упасть, однако, это компенсируется вдвое увеличенной пропускной способность шины, связывающей TMU и текстурные кэши. ATI удалось добиться 2.5-кратного увеличения скорости фильтрации 32-битных текстур и 1.5-кратного – 64 битных, что в теории выглядит очень неплохо, и, наверняка, крайне положительно скажется на производительности нового GPU в реальных условиях.

Текстурные процессоры по-прежнему объединены в большие модули по 4 TMU, и каждый такой модуль обслуживает одно из 10 SIMD-ядер. Оптимизация, выразившаяся в отказе от лишних блоков, позволила сократить количество транзисторов, составляющих TMU, и, соответственно, разместить большее их количество на кристалле сравнительно малой кровью, удержав сложность и площадь ядра в разумных пределах.

Подсистема кэшей является важной частью текстурной подсистемы графического процессора, и в RV770 она также подверглась существенной модернизации:


Во-первых, надо отметить возросшую пропускную способность: теперь скорость выборки текстур из кэшей первого уровня составляет внушительные 480 ГБ/сек., а кэши первого и второго уровней могут общаться на скорости 384 ГБ/сек. Во-вторых, каждое SIMD-ядро теперь имеет свой кэш первого уровня, что благотворно сказывается на эффективности хранения данных. В-третьих, кэши второго уровня согласованы с контроллерами памяти, и, наконец, в-четвёртых, в составе RV770 появился отдельный кэш для хранения вершинных данных. Улучшения не так очевидны, как в случае с архитектурой текстурных процессоров, однако, они, наверняка внесут существенную лепту в прирост производительности ATI Radeon HD 4800 в играх. Можно с уверенностью сказать, что новый графический процессор ATI полностью избавлен от главного узкого места архитектуры ATI Radeon HD и теперь может поспорить на равных с решениями Nvidia там, где последние были традиционно сильны, а именно, на операциях с текстурами. Здесь наиболее ярко проявляется подход ATI к проектированию графических процессоров – оптимизация вместо прямого наращивания мощностей.

ATI Radeon HD 4800: процессоры растровых операций


Растровые процессоры, в терминологии ATI именуемые render back-ends, никогда не были драматически узким местом архитектуры ATI Radeon HD, однако, в RV770 улучшения коснулись и их, хотя общее количество этих модулей не изменилось: их в составе ядра по-прежнему четыре, что позволяет говорить об эквиваленте 16 классических ROP.


Главной целью, поставленной разработчиками, было увеличение производительности при выполнении полноэкранного сглаживания и повышение эффективности работы с Z-буфером/буфером шаблонов. В последнем случае количество соответствующих блоков было увеличено вдвое.


В результате модернизации скорость заполнения сцены при включенном сглаживании возросла вдвое как для 32-битного, так и для 64-битного цвета, а количество обрабатываемых за такт значений Z/stencil повысилось с 32 до 64, что превышает возможности G92 при использовании FSAA. Иными словами, ATI вышла в лидеры даже в той области, в которой всегда была в аутсайдерах!

Растровые процессоры RV770 поддерживают классические фиксированные режимы мультисэммплинга, но не программируемые, в число которых входит очень интересный режим, сочетающий классический MSAA и краевое сглаживание, и позволяющий получить качество сглаживания, эквивалентное 12-24х MSAA. Поддержка этого режима была заявлена уже в ATI Radeon HD 2000.

Представленные ранее режимы CFAA, использующие фильтры wide и narrow tent осуществляли выборку субсэмплов за пределами пикселя без учёта граней полигонов, что, хотя и позволяло улучшить качество сглаживания в целом, приводило к изрядному «замыливанию» изображения. Режим CFAA edge detect позволяет этого избежать:


Программируемый фильтр выборки в случае использования этого режима настраивается таким образом, чтобы осуществлять выборку субсэмплов только в районе грани полигона. Это повышает качество сглаживания, что особенно хорошо заметно на мелких деталях, вроде висящих проводов, но, вместе с тем, позволяет избежать излишнего «замыливиания», свойственного менее «умным» алгоритмам CFAA. Расход видеопамяти остаётся таким же, как в случае использования обычных режимов MSAA 4x/8x. Отметим, что новый режим CFAA стал доступен также и владельцам предыдущих поколений ATI Radeon HD.

ATI Radeon HD 4800: эволюция блока тесселяции


Аппаратный блок тесселяции, входивший в состав графических процессоров ATI Radeon HD 2000 и HD 3000, вызывал едва ли не больше всего споров. Тесселятор использовал часть транзисторного бюджета, но не предоставлял никаких видимых преимуществ, по крайней мере, на тот момент. Более того, в то же самое время ATI/AMD приняла довольно противоречивое решение, сделав ставку на программную обработку MSAA, что было вполне справедливо расценено многими в качестве одного из главных факторов, ограничивающих производительность упомянутых семейств GPU. Но прошёл год, и блок тесселяции эволюционировал.

Тогда, в мае 2007 года, решение разработчика программировать блок тесселяции с помощью вершинных шейдеров вместо геометрических шейдеров DirectX 10 стало для нас большим сюрпризом. ATI объясняла это тем, что тесселятор, вошедший в состав R600, был позаимствован из графического ядра класса DirectX 9, разработанного компанией специально для игровой консоли Microsoft Xbox 360. Новый блок тесселяции в составе RV770 может программироваться с помощью обоих типов шейдеров, как вершинных, так и геометрических, что обеспечивает ему полную обратную совместимость.


без тесселяцииc тесселяцией

Если верить заявлениям официальных лиц, входящих в состав графического подразделения AMD, существует некоторое количество игр, использующих преимущества программируемого тесселятора ATI, и все эти игры были разработаны с использованием ATI Radeon HD 2000/3000. Это означает, что многие конечные пользователи будут наделены возможностью насладиться улучшенным качеством изображения, и, возможно даже порадуются, что предпочли ATI Radeon решениям Nvidia GeForce.

Пока настоящие игры находятся на своём пути к пользователям, владельцы ATI Radeon HD 3000 или HD 4000 уже могут насладиться технической демонстрацией под названием The Froblins, использующей технику глобального освещения DirectX 10.1, HDR вкупе с тесселяцией пейзажа и моделей жабогоблинов. Более того, в этом демо на плечи ATI Radeon HD возложены расчеты модели искусственного интеллекта – нечто новое для графических процессоров, не так ли?

DirectX 10.1: поддержка со стороны Electronic Arts, Sega и других…


Без сомнения, DirectX 10.1 нельзя назвать мгновенно обретшим популярность, но новая версия этого API уже прокладывает себе дорогу в ряд проектов, что является хорошей новостью для графического подразделения AMD.

Как правило, любое подмножество DirectX не имеет существенных шансов обрести популярность среди разработчиков игр, если оно не поддерживается всеми разработчиками графического аппаратного обеспечения. Так было с DirectX 8.1 и пиксельными шейдерами 1.4 в 2001 году, это же произошло с Shader Model 2.0a и 2.0b, являвшимися подмножеством DirectX 9.0 в 2003 – 2004 годах, а Shader Model 3.0 сумела обрести заметную популярность лишь 2 года спустя после своего появления, а точнее, после анонса семейства ATI Radeon X1000 и консоли Microsoft Xbox 360.

Судьба DirectX 10.1, похоже, имеет шансы разделить участь DirectX 8.1 и 9.0с: разработчики игр вряд ли возьмут на вооружение технологию, поддерживаемую лишь одним независимым поставщиком аппаратного обеспечения, если только AMD каким-то образом не окажет им поддержки. Первый проект, получивший поддержку возможностей DirectX 10.1, Assasin’s Creed, создававшийся Ubisof Montreal, быстро её лишился; широко распространено мнение, что это следствие давления со стороны Nvidia, поскольку данный разработчик является участником программы The Way It’s Meant to Be Played. Следует отметить, что Nvidia поддержит DirectX 10.1, как только выпустит первый DirectX 11-соместимый графический процессор, так как тот автоматически получит все возможности DirectX 10.1.

К счастью для ATI, не все игры имеют отношение к вышеупомянутой программе Nvidia, и, как минимум, две игры, планируемые к выходу в течение следующих 6-9 месяцев, будут поддерживать DirectX 10.1: BattleForge, разрабатываемая Phenomic/Electronic Arts, а также некий проект Sega, название которого пока неизвестно.


BattleForge представляет собой RTS в жанре «фэнтези» (видеоролик), одновременно задействующей множество боевых единиц. Качество графики в игре весьма впечатляет: каждая модель использует сложную геометрию, пейзаж и растительность выглядят вполне реалистично, а спецэффекты радуют глаз. Согласно официальным заявлениям Phenomic Studio, с использованием аппаратного обеспечения, поддерживающего DirectX 10.1, игра демонстрирует на 30 % большую производительность благодаря уменьшению количества требуемых проходов рендеринга (вероятно, не во всех сценах). Официальный анонс игры запланирован на текущий год, но точная дата пока остаётся неизвестной.


О втором проекте, который Sega планирует анонсировать в начале следующего года известно немного. По словам технического директора Sega Europe, игра будет поддерживать исключительно режимы рендеринга DirectX 10 и DirectX 10.1, поэтому не будет работать на DirectX 9-совместимом аппаратном обеспечении, равно как и под управлением операционной системы Windows XP. Что самое важное, этот безымянный проект является эксклюзивным для платформы ПК. Согласно заявлениям Sega, DirecX 10.1 облегчает труд разработчиков и ускоряет их работу, одновременно позволяя сделать проект «красивее». Более детальных данных на этот счёт опубликовано не было.

Очевидно, две-три игры не могут сделать API по-настоящему популярным, и пройдет много месяцев, прежде чем поддержка DirectX 10.1 станет действительно необходимой для того, чтобы играть в игры при наивысшем качестве графики с приемлемо производительностью. Тем не менее, поддержка DirectX 10.1 всё же является неоспоримым преимуществом семейств ATI Radeon HD 3000 и HD 4000.

ATI Radeon HD 4800: новый видеопроцессор


Помимо прочих инноваций, вошедших в состав ATI RV770, следует отметить новые возможности видеодвижка, в частности, новый звуковой контроллер и некоторые программные улучшения.

Главным улучшением по части работы с HD-контентом стал восьмиканальный звуковой контроллер Realtek, поддерживающий аудиопотоки с битрэйтом до 6.144 Мб/сек., и частотой дискретизации до 192 КГц в форматах AC3, DTS, Dolby True-HD и DTS-HD. Расширенные возможности нового аудиоядра представляют огромную важность для тех, кто планирует использовать ATI Radeon HD 4000 в составе домашнего мультимедийного центра. Более того, на данный момент ATI Radeon HD 4800 являются единственными в мире графическими картами, обладающими «родной» поддержкой восьмиканального HD-звука, с возможностью его вывода через HDMI – существенное преимущество над конкурирующими решениями Nvidia.


Видеодвижок ATI Radeon HD 4800 представляет собой вторую версию универсального видеодекодера ATI (UVD 2), поддерживающую одновременное декодирование двух потоков (что полезно при просмотре фильмов Blu-ray или HD-DVD с функцией Picture-in-Picture), причем, поддержка bitstream processing обеспечивается для всех современных кодеков: VC-1, H.264 and MPEG-2 HD. Мы не уверены, имеет ли нововведения аппаратный характер или являются следствием улучшений в программном обеспечении, но это будет проверено нами при первой возможности.


Интересной возможностью, рекламируемой ATI, является поддержка высококачественного масштабирования DVD-контента в разрешения, соответствующие HD-видео или более высокие. Компания хранит молчание относительно используемых для этого алгоритмов и техник, поэтому, для того, чтобы выяснить реальный потенциал этой технологии и сделать выводы, необходимо её практическое тестирование.


Отметим, что ATI вслед за Nvidia также наделила свой видеодвижок возможностями динамического улучшения контрастности, что, впрочем, вряд ли найдёт отклик у истинных любителей кино. Материал, предназначенный для фильма, снимается в соответствии с режиссёрскими решениями и требованиями, и использование таких технологий может существенно исказить оригинальный замысел, поэтому, целесообразность их использования находится под большим вопросом.

Наконец, ATI Radeon HD 4800 может кодировать видео высокого разрешения в форматы H.264 или MPEG2-HD с помощью Cyberlink PowerDirector. Согласно официальным данным, новое графическое ядро может транскодировать час видео в формате 1080р за 32 минуты, в то время как аналогичная задача, запущенная на Intel Core 2 Duo E8500 выполняется за 9 часов 54 минуты. 19-кратное преимущество выглядит весьма впечатляюще.

Мы рассмотрели теоретические аспекты работы ATI Radeon HD 4800, а сейчас пора познакомиться с материальным воплощением семейства: c графической картой ATI Radeon HD 4850 в исполнении Power Color.

Power Color ATI Radeon HD 4850 512MB GDDR3: упаковка и комплектация


Tul Corp., которой принадлежит брэнд Power Color, в течение многих лет была эксклюзивным партнёром ATI, поэтому, ничего неожиданного в том, что именно эта компания одной из первых представила линейку ATI Radeon HD 4800, нет. К сожалению, реалии сегодняшнего дня в графическом бизнесе таковы, что даже наиболее доверенные партнёры компаний-разработчиков не имеют возможности выпустить действительно уникальные продукты, по крайней мере, на момент анонса новинок. Тем не менее, модифицированные версии карт Power Color готовятся к выпуску и по возможности будут рассмотрены нами в будущем.

Power Color HD 4850 512MB (модель AX4850 512MD3-H) поставляется в вертикальной коробке средних размеров, напоминающей упаковки других продуктов этой компании, рассмотренных нами за последний год. Помимо красочной картинки, лицевая сторона содержит информацию о модели карты, объеме видеопамяти и поддержке dual-link DVI и HDMI.

Новое кредо Power Color звучит следующий образом: «Очаровывающая 3D-графика для Истинных Игроков», однако, хотя архитектура ATI Radeon HD 4800 и произвела на нас серьёзное впечатление, но девушка с мечом, изображённая на коробке, не слишком-то очаровывает. Слишком многие производители используют такие изображения для своих продуктов, так что в наши дни все эти роботы, монстры и воины уже успели примелькаться и практически перестали привлекать внимание.


В коробке находится картонный поддон, в различных отсеках которого размещается содержимое. Помимо видеоадаптера, в коробке обнаружились следующие компоненты:

Переходник DVI-I → D-Sub
Переходник DVI-I → HDMI
Переходник Mini-DIN → Composite/S-Video
Переходник Mini-DIN → YPbPr
Мостик ATI CrossFire
Переходник питания PCI Express
Краткое руководство пользователя (на английском языке)
Диск с драйверами

Такой набор довольно обычен для продуктов данного класса, он включает в себя практически всё необходимое для использования графической карты, однако, в нём нет никаких приятных сюрпризов, вроде бесплатных игр или программного обеспечения.

Особенно печалит, что в комплекте поставки отсутствует ПО для проигрывания HD-видео, умеющее использовать продвинутые возможности ATI Radeon HD 4800 по части декодирования и постпроцессинга. Обычно, такие проигрыватели стоят порядка 50 долларов, но это розничная цена, тогда как для производителей графических карт цена значительно ниже, поэтому, решение Power Color не включать программный видеопроигрыватель в комплект поставки карт нового поколения нас изрядно удивило, и нельзя сказать, чтобы это было приятное удивление.

Тем не менее, упаковка и комплектация Power Color HD 4850 512MB произвела на нас благоприятное впечатление: продукт поставляется в коробке средних размеров, а значит, производитель не накладывает на покупателей обязанность оплачивать лишние складские расходы и не заставляет их думать о том, что они приобретают нечто экстраординарное. Комплект поставки включает в себя практически всё необходимое, и не включает некоторые устаревшие на текущий момент компоненты – к примеру, никому не нужен кабель YPbPr, если используется подключение HDMI. Тем не менее, отсутствие программного видеопроигрывателя, поддерживающего HD-форматы, вызывает сожаление.

ATI Radeon HD 4850: дизайн печатной платы и технические характеристики


К сожалению, на момент анонса новой графической архитектуры ATI старшая модель видеоадаптера, ATI Radeon HD 4870, оказалась недоступна, поэтому придётся ограничиться рассмотрением младшей модели, ATI Radeon HD 4850. Так как все видеокарты среднего и высшего класса, выпущенные в день официального объявления чипа, изготовлены по референсному дизайну ATI, далее мы будем называть «Power Color HD 4850» просто «ATI Radeon HD 4850».

С технической точки зрения ATI Radeon HD 4850 представляет меньший интерес, поскольку использует обычную широко распространённую память GDDR3, но с точки зрения покупателя эта графическая карта более интересна, так как более доступна из-за низкой рекомендуемой цены – всего 199 долларов.

Благодаря тщательной оптимизации графической архитектуры ATI Radeon HD 4800, разработчикам удалось создать видеоадаптер нового поколения, теоретически способный конкурировать с Nvidia GeForce 9800 GTX, но не превосходящий по габаритам ATI Radeon HD 3850. На первый взгляд, ATI Radeon HD 4850 не производит впечатления серьёзности – просто не верится, что столь скромная с виду карта, явно относящаяся к классу массовых решений, может скрывать в себе столь внушительный потенциал.


Новый ATI Radeon HD 4850 компактен, его печатная плата не длиннее платы ATI Radeon HD 3850; вообще, внешних отличий между этими картами крайне немного, и сразу в глаза бросается лишь вентилятор с большим количеством лопастей. Разумеется, самое интересное скрывается под системой охлаждения, и с целью максимально подробного изучения нового графического решения ATI она была демонтирована.

На удивление, система питания ATI Radeon HD 4850 оказалась очень простой, несмотря на заявленный разработчиком уровень энергопотребления в районе 110 Вт. Как и у предшественника, стабилизатор питания графического процессора построен на базе хорошо известного по другим продуктам ATI двухфазного ШИМ-контроллера uPI Semiconductor uP6201. Силовая часть состоит из восьми мощных транзисторов Infineon серии OptiMOS 3, по четыре транзистора в каждой фазе, то есть, по сути, здесь отличий от ATI Radeon HD 3850 также не наблюдается. Несмотря на наличие всего двух фаз, беспокоиться о потенциале системы питания не приходится – как показали эксперимент с экстремальным разгоном ATI Radeon HD 3870, она легко справляется с нагрузками, существенно превышающими 150 Вт. За питание памяти отвечает отдельный стабилизатор на базе чипа uPI UP6101, нагруженный двумя силовыми транзисторами. Использование знакомых компонентов облегчает энтузиастам модернизацию системы питания с целью постановки рекордов разгона. Не исключено, что один из будущих наших обзоров будет посвящён как раз экстремальному разгону ATI Radeon HD 4850.

Система питания оснащена всего одним внешним шестиконтактным разъемом PCI Express 1.0. Объединённой нагрузочной способности слота PCIe и внешнего разъема вполне достаточно для энергоснабжения ATI Radeon HD 4850, а вот его старший собрат, ATI Radeon HD 4870, обладающий большими аппетитами по этой части, оснащён двумя внешними разъемами питания и имеет более мощную многофазную систему питания.

Самое интересное, а именно высокоскоростная память GDDR5 пока остаётся за кадром, поскольку ATI Radeon HD 4850 оснащён привычной и распространённой памятью GDDR3. Восемь чипов Qimonda HYB18H512321BF-10 ёмкостью 512 Мб (16Мх32) каждый образуют банк локальной видеопамяти объемом 512 МБ, что на сегодня уже можно считать минимально приемлемым. По счастью, решения ATI не испытывают проблем с эффективным использованием имеющегося объема видеопамяти, в отличие от решений Nvidia, так что существенного падения производительности в ряде особенно требовательных игр можно не опасаться. Любопытно, что в новом семействе ATI отказалась от расположения чипов памяти полукругом вокруг GPU и вернулась к более простому L-образному расположению.

Напряжение питания памяти составляет 2,0 В, а суффикс «-10» означает время доступа 1,0 нс и номинальную частоту 1000 (2000) МГц. На этой частоте память и функционирует, точнее, из-за особенностей тактового генератора, её точная частота несколько ниже и составляет 993 (1986) МГц. Это даёт пропускную способность в районе 64 ГБ/сек. Казалось бы, немного на фоне новых решений Nvidia, однако, мало иметь широкую внешнюю шину памяти – надо ещё уметь её использовать. Это уже было доказано ATI Radeon HD 3800, не уступившим ATI Radeon HD 2900, несмотря на вдвое более узкую шину памяти, а ведь по сравнению с RV670, в RV770 эффективность использования доступной пропускной способности подсистемы памяти была повышена. Иными словами, страдать от нехватки пропускной способности ATI Radeon HD 4850, скорее всего, не будет.

На первый взгляд, кристалл RV770 довольно велик, что естественно – всё-таки, ядро, состоящее из 956 миллионов транзисторов, нельзя назвать простым. Но, с другой стороны, его площадь составляет 260 квадратных миллиметров, что всего на 37 % больше площади ядра ATI предыдущего поколения, RV670, составляющей 190 кв.мм. Более того, по площади кристалла ATI RV770 уступает 55-нм Nvidia G92b при существенно большей сложности! Оптимизация архитектуры вкупе с использованием 55-нм техпроцесса приносит свои плоды; можно себе представить, насколько ATI RV770 меньше Nvidia GT200, который не только состоит из 1,4 миллиарда транзисторов, но и производится с использованием более грубого 65-нм техпроцесса.

В отличие от RV670, упаковка RV770 снабжена металлической защитной рамкой, призванной предотвратить перекос подошвы системы охлаждения, могущий привести к фатальному сколу хрупкого кристалла. Маркировка ядра, как обычно, невразумительна; большую его часть занимает логотип ATI Radeon, а остальная маркировка представляет собой не несущий понятной простому пользователю информации набор символов, за исключением даты изготовления.

Существования усечённых версий ATI Radeon HD 4800 не предполагается, по крайней мере, на данный момент, так что ядро работает в полной конфигурации: 160 суперскалярных вычислительных модулей по 5 ALU в каждом, 10 больших текстурных процессоров, эквивалентных 40 TMU и 4 модуля растровых операций, являющихся эквивалентом 16 классическим ROP. Частота, на которой работает графический процессор, составляет 625 МГц – заметно меньше, чем у ATI Radeon HD 3850, но это отставание с лихвой перекрывается большим количеством TMU и шейдерных процессоров, а также архитектурными улучшениями.

Помимо этого, в состав ядра входит логика интерфейса CrossFireX, обеспечивающая объединение в мультипроцессорную графическую систему до четырёх карт ATI Radeon HD 4800, дисплейные контроллеры CRT/DVI/HDMI/DisplayPort и видеопроцессор UVD 2. Последний поддерживает возможности, описываемые профилями BD 1.1 и 2.0, в частности, одновременное декодирование двух видеопотоков, необходимое для реализации таких функций, как «Picture-in-Picture». Для наложения одной картинки на другую задействуются возможности вычислительной части RV770. Кроме того, возможности встроенного звукового ядра значительно расширены, и теперь оно обеспечивает вывод восьмиканального звука в формате 24 бита/192 кГц, а также поддерживает режимы Dolby TrueHD и DTS-HD, что позволяет говорить о полном соответствии спецификациям HDMI 1.3. Решения Nvidia не могут похвастаться этим до сих пор.

Левая часть печатной платы ATI Radeon HD 4850 не представляет существенного интереса, так как практически пустует. Отметим лишь стандартный набор коммутационных разъемов, включающий в себя два двухканальных порта DVI-I, поддерживающих разрешения до 2560х1600, стандартный семиконтактный порт mini-DIN и пару «гребёнок» интерфейса CrossFireX.

ATI Radeon HD 4850: конструкция системы охлаждения


Конструкция системы охлаждения, который укомплектован эталонный экземпляр ATI Radeon HD 4850, вызывает справедливые сомнения, поскольку она слабо отличается от системы, устанавливаемой на ATI Radeon HD 3850, притом, что ATI Radeon HD 4850 должен обладать существенно большее высоким уровнем энергопотребления. Широко известен промах Nvidia, снабдившей первые версии Nvidia GeForce 8800 GT 512MB слишком слабым кулером, не справлявшимся со своими обязанностями; не ждёт ли нечто подобное ATI Radeon HD 4850? О температурном режиме речь ещё пойдёт, а пока имеет смысл рассмотреть конструкцию системы охлаждения нового графического адаптера в деталях.


По сути, единственными отличиями от системы охлаждения ATI Radeon HD 3850 действительно являеются вентилятор с большим количеством лопастей и несколько иная конфигурация радиатора. В остальном, это всё та однослотовая конструкция, медная на первый взгляд, но на самом деле, по большей части, выполненная из анодированного алюминия: достаточно процарапать основание, чтобы в этом убедиться. Медными являются лишь сердечник, непосредственно соприкасающийся с кристаллом графического процессора, а также впрессованная в основание тепловая трубка, обеспечивающая равномерное распределение теплового потока по радиатору. Сам радиатор набран из тонких алюминиевых пластинок и имеет достаточно большую площадь, однако, ему предстоит отводить до 110 Вт тепла, и ещё неизвестно, насколько успешно он будет справляться с такой нагрузкой, по крайней мере, при сохранении комфортных шумовых характеристик системы в целом. Помочь ему в этом призвана изменённая ориентация ребёр – теперь они направлены в сторону от крепёжной планки, так что нагретый воздух выбрасывается в направлении боковой крышки корпуса системы, на которой в этом месте вполне может быть вентиляционная решётка.

Система укомплектована новым вентилятором с увеличенным с 13 до 19 количеством лопастей, что должно увеличить развиваемое им статическое давление и тем самым повысить эффективность продувки радиатора. Подключение вентилятора четырёхпроводное, с таходатчиком и широтно-импульсным управлением скоростью вращения, что уже традиционно для всех современных графических карт. О шумовых характеристиках будет рассказано в следующей главе обзора, посвященной тепловым, шумовым, и электрическим характеристикам ATI Radeon HD 4850.

Обратная сторона основания системы охлаждения не преподнесла никаких сюрпризов: по сравнению с ATI Radeon HD 3850 было изменено лишь расположение прокладок, обеспечивающих тепловой контакт с микросхемами памяти. Сами эластичные прокладки бежевого цвета остались прежними. Аналогичные прокладки имеются в местах расположения силовых транзисторов и индукторов системы питания. С лицевой стороны в этом месте основание образует небольшой игольчатый радиатор. Надёжный тепловой контакт графического процессора с медным сердечником теплообменника обеспечивается с помощью классической тёмно-серой густой термопасты.

Крепление системы весьма надёжно: помимо чётырех стоек с подпружиненными винтами и металлической крестообразной рамкой с обратной стороны PCB, она привинчена к плате восемью дополнительными винтами, так что малейший люфт исключён. Дополнительным средством защиты кристалла GPU, как уже упоминалось, является металлическая ограничительная рамка на его упаковке.

В целом, систему охлаждения ATI Radeon HD 4850 можно было бы назвать удачной и многообещающей конструкцией, но при уровне энергопотребления в районе 110 Вт её возможностей может оказаться недостаточно. Впрочем, сейчас это предположение будет проверено на практике.

ATI Radeon HD 4850: уровень энергопотребления, тепловой режим, шумность и разгон


Разумеется, пройти мимо такой важной характеристики ATI Radeon HD 4850, как уровень энергопотребления, было невозможно. Согласно официальным данным, он заявлен на уровне 110 Вт. Для подтверждения или опровержения этих данных была проведена стандартная процедура замеров, для чего использовался специально оборудованный стенд, имевший следующую конфигурацию:

Процессор AMD Athlon 64 FX-55 (2,6 ГГц)
Системная плата EPoX EP9-NPA+ SLI (Nvidia nForce4 SLI)
Память PC3200 (2x512 ГБ, 200 МГц)
Жесткий диск Western Digital Raptor WD360ADFD (36 ГБ, SATA-150, буфер 16 МБ)
Блок питания Chieftec ATX-410-212 (номинальная мощность 410 Вт)
Microsoft Windows Vista Ultimate 32-bit
Futuremark PCMark05 Build 1.2.0
Futuremark 3DMark06 Build 1.1.0

Была также сделана попытка использовать для создания нагрузки в режиме 3D пакет 3DMark Vantage, как более соответствующий современным реалиям, однако, как показали измерения, он нагружает карту меньше, нежели первый тест SM3.0/HDR пакета 3DMark06, в результате чего, решено было вернуться к проверенной временем методике. Как обычно, использовалось разрешение 1600х1200 с форсированием FSAA 4x и AF 16x.
Режим peak 2D эмулировался с помощью теста PCMark05 2D Transparent Windows.

В результате проведённых измерений были получены следующие данные:




Результат, полученный в режиме 3D, идеально совпал с цифрами, опубликованными ATI Technologies. С одной стороны, 110 Вт – достаточно серьёзный показатель, однако, если вспомнить, что RV770 состоит из 956 миллионов транзисторов, становится очевидно, насколько ATI Radeon HD 4850 экономичен. По этому параметру он не уступает Nvidia GeForce 9800 GTX, видеоадаптеру, использующему менее сложный чип с более скромными техническими характеристиками, а о сравнении с ATI Radeon HD 3870 Х2 или, тем более, решениями Nvidia, использующими GT200, не может быть и речи. Уровень энергопотребления в режимах 2D и Peak 2D достаточно высок, в сравнении с ATI Radeon HD 3870, но находится в разумных пределах и примерно соответствует аналогичным показателям Nvidia GeForce 9800 GTX.

Раскладка энергопотребления по отдельным шинам закономерна – наибольшая нагрузка приходится на внешний разъем PCI Express 1.0, на котором в режиме 3D она практически достигает предельно допустимого значения, установленного стандартом – 75 Вт. Не исключено, что разогнанные версии ATI Radeon HD 4850 будут оснащаться либо восьмиконтактным разъемом питания, либо обретут второй шестиконтактный, как у ATI Radeon HD 4870.

Несмотря на скромные габариты системы охлаждения, тепловой режим карты достаточно благоприятен: по данным Catalyst Control Center, температура графического процессора в режиме простоя колебалась в районе 62 °C, а под нагрузкой в режиме 3D не превысила 86 градусов. Последнее значение, впрочем, низким назвать нельзя, тем более что тестирование проводилось при открытой боковой крышке корпуса. Это подтверждается субъективными ощущениями – на ощупь карта была настолько горячей, что прикосновение к ней можно было выдержать с большим трудом.

В тесном корпусе или при более высокой температуре окружающей среды температура графического ядра ATI Radeon HD 4870 легко может перевалить за это значение. Ясно, что для серьёзного разгона эталонная система охлаждения ATI Radeon HD 4850 не годится, но с её заменой на что-то более совершенное в техническом плане не должно возникнуть проблем: благодаря совпадающим крепёжным отверстиям, для этой цели прекрасно подойдут все графические кулеры, рассчитанные на установку на ATI Radeon HD 3870/3850.

Шумовые характеристики системы охлаждения ATI Radeon HD 4850 были измерены с помощью цифрового шумомера Velleman DVM1326, работающего в режиме взвешенной кривой А. За точку отсчета было принято значение 43 дБА, равное уровню шума на расстоянии одного метра от работающего тестового стенда, оснащённого графической картой с пассивным охлаждением. Столь высокий уровень шума обусловлен не самым тихим нравом блока питания Enermax Galaxy DXX EGX1000EWL. Замеры, проведённые дважды – на расстоянии 5 сантиметров и 1 метра от работающего стенда, показали следующее:




Использование нового 19-лопастного вентилятора сказывается на шумовых характеристиках системы охлаждения ATI Radeon HD 4850, особенно при замерах на близком расстоянии, однако, на фоне шума, издаваемого другими компонентами работающего стенда карту едва слышно, причём, здесь следует учитывать открытую крышку корпуса. Впрочем, с другой конфигурацией игровой системы положение дел может оказаться иным, и для достижения акустического комфорта потребуется заменить эталонную систему охлаждения ATI Radeon HD 4850 на что-то более совершенное, например, Zalman VF1000.

Предпринятую попытку разгона едва ли можно считать полноценной, поскольку она была ограничена возможностями соответствующей секции Calayst Control Center. Тем не менее, частоту графического ядра удалось успешно поднять до максимально разрешённого ССС значения – 700 МГц. Память разогналась до 1100 (2200) МГц, дальнейшее повышение её частоты приводило к потере стабильности. С учётом довольно скромного результата и временных ограничений карту было решено не тестировать в разогнанном режиме.

Что касается совместимости, то с ней никаких проблем не возникло, благодаря «умной» логике распознавания версии шины PCI Express. ATI Radeon HD 4850 успешно стартовал как на тестовых системных платах, поддерживающих стандарт PCI Express 1.0a, так и на более современной плате на базе чипсета Intel X38, поддерживающей версию 2.0 шины PCI Express.

Конфигурация тестовых платформ и методология тестирования


Для исследования теоретического потенциала ATI Radeon HD 4850 и его сравнения с возможностями графических карт ATI и Nvidia предыдущего поколения были использованы тестовые платформы со следующей конфигурацией:

Процессор Intel Core 2 Extreme X6800 (3,0 ГГц, FSB 333 МГц x 9)
Системная плата DFI LANParty UT ICFX3200-T2R/G (ATI CrossFire Xpress 3200) для ATI Radeon HD
Системная плата Asus P5N32-E SLI (Nvidia nForce 680i SLI) для Nvidia GeForce
Память Corsair TWIN2X2048-8500C5 (2x1 ГБ, 1066 МГц, 5-5-5-15, 2T)
Жесткий диск Maxtor MaXLine III 7B250S0 (250 ГБ, SATA-150, буфер 16МБ)
Блок питания Enermax Galaxy DXX EGX1000EWL (Номинальная мощность 1000 Вт)
Монитор Dell 3007WFP (30”, максимальное разрешение 2560x1600@60 Гц)
Microsoft Windows Vista Ultimate 32-bit
Nvidia GeForce 175.19 WHQL для GeForce 9
ATI Catalyst 8.5/8.6 для ATI Radeon HD 3000
ATI Catalyst beta для Radeon HD 4000 (sample_vista32-64_HD_4800_Series_5.exe)

Драйверы были настроены согласно стандартной процедуре, таким образом, чтобы обеспечивать максимально возможное качество текстурной фильтрации при минимальном влиянии программных оптимизаций, используемых по умолчанию. Сглаживание прозрачных текстур также было включено. В результате, настройки выглядели следующим образом:

ATI Catalyst:

Catalyst A.I.: Standard
Mipmap Detail Level: High Quality
High Quality AF: On
Wait for vertical refresh: Always Off
Enable Adaptive Anti-Aliasing: On/Quality
Method: Multi-sampling
Temporal Anti-Aliasing: Off
Остальные настройки: по умолчанию

Nvidia GeForce:

Texture filtering – Quality: High quality
Texture filtering – Trilinear optimization: Off
Texture filtering – Anisotropic sample optimization: Off
Vertical sync: Force off
Antialiasing – Gamma correction: On
Antialiasing – Transparency: Multisampling
Остальные настройки: по умолчанию

Для исследования теоретической производительности использовался следующий набор синтетических тестов:

Marko Dolenc’s Fillrate and Pixel Shader Tester
Xbitmark version 0.65
Теоретические тесты Futuremark 3DMark06
Теоретические тесты Futuremark 3DMark Vantage

Скорость заполнения сцены



«Чистая» скорость заполнения сцены у ATI Radeon HD 4850 меньше, нежели у ATI Radeon HD 3870, что объясняется меньшей частотой, на которой функционирует графическое ядро, а значит, и блоки RBE/ROP, а также меньшей пропускной способностью памяти.

В случае работы с Z-буфером налицо заметный прирост скорости, хотя и не двукратный, как, по идее, должно быть, учитывая вдвое большее количество блоков обработки значений Z в составе RV770. Выигрыш составляет примерно 13 %, и это не совсем то, что ожидалось от новинки; впрочем, принимая во внимание менее высокие частоты ядра модели 4850 против модели 3870, скромность прироста можно считать закономерной.

Начиная с двух текстур ATI Radeon HD 4850 начинает демонстрировать преимущества, сказывается проделанная инженерами ATI оптимизация. Лишь в случае с четырьмя текстурами модель 4850 немного уступает Nvidia GeForce 9800 GTX, но даже в этом случае отставание составляет менее 10 %.

Очевидно, что процессоры растровых операций не являются узким местом графической архитектуры ATI Radeon HD 4800 – даже младшая модель нового семейства может поспорить на равных с Nvidia GeForce 9800 GTX, несмотря на меньшую частоту ядра.

Производительность при исполнении пиксельных шейдеров и физики


Тест Marko Dolenc’s Fillrate Tester не поддерживает даже Shader Model 3.0, но хорошо подходит для оценки производительности графической архитектуры при выполнении старых версий шейдерного кода. Получаемые с его помощью данные могут оказаться небесполезными для тех, кто играет в старые игры, и, кроме того, они всё-таки позволяют примерно оценить потенциал того или иного GPU.


В случае с простыми шейдерами ситуация не очень радужная – ATI Radeon HD 4850 уступил не только Nvidia GeForce 9800 GTX, но и ATI Radeon HD 3870. Впрочем, учитывая тот факт, что скорость исполнения простых 1.1 и 2.0 шейдеров уже некоторое время упирается в производительность блоков растровых операций (в случае с данным тестом), едва ли результаты вызывают удивление, принимая во внимание результаты измерения скорости заполнения. Крайне маловероятно, что относительно низкие результаты, показанные ATI Radeon HD 4850 в данном наборе шейдеров, отразятся на реальной игровой производительности новинки.

Что касается шейдера попиксельного освещения, то здесь результат вполне закономерен, принимая во внимание возросшую математическую мощность чипа ATI RV770.


Тест shader particles из пакета 3DMark06 не является в полной мере графическим тестом, поскольку он симулирует физическую модель поведения массивных систем частиц. Расчеты столкновения выполняются с помощью пиксельных шейдеров, полученный результат выводится на экран с помощью выборки текстур из вершинных шейдеров. Тем не менее, данный тест вполне годится для измерения математической производительности GPU.

Как видно, налицо 50-% превосходство ATI Radeon HD 4850 над Nvidia GeForce 9800 GTX и практически на 70 % более высокая скорость, чем у ATI Radeon HD 3870, математическая мощность которого ровно в два раза ниже ATI Radeon HD 4850.


Аналогичный тест, входящий в состав 3DMark Vantage, почему-то не показывает столь существенного превосходства новой графической архитектуры ATI, однако, ATI Radeon HD 4850, как минимум, не уступает Nvidia GeForce 9800 GTX. По всей видимости, в этом тесте действительно работает только каждый пятый ALU RV770, но этого оказывается достаточно для достижения паритета.


Perlin noise из пакета 3DMark06 хорошо известен нашим читателям как «предельный» тест для Shader Model 3.0 аппаратного обеспечения. Данный тест генерирует процедурную текстуру, используя при этом 48 текстурных выборок и 447 математических инструкций, что является максимум для SM 3.0 аппаратного обеспечения.

Благодаря восьмистам потоковым процессорам, ATI RV770 не разочаровывает: результат ATI Radeon HD 4850 почти вдвое выше результата ATI Radeon HD 3870 и на 70-75 % выше показателей Nvidia GeForce 9800 GTX.


Тест 3DMark Vantage POM демонстрирует стабильное превосходство ATI Radeon HD 4850 над однопроцессорными графическими картами предыдущего поколения. На операции отрисовки сложного ландшафта с помощью техники parallax occlusion mapping новое решение ATI почти вдвое превосходит своего предшественника и на 50 % – Nvidia GeForce 9800 GTX.


Тест Shader Math представляет собой несколько усложнённую версию теста Perlin Noise из состава 3DMark06, поэтому, ничего удивительного, что в нём ATI Radeon HD 4850 также лидирует с большим отрывом.


Тест X-bit Mark во многих случаях по-прежнему является показательным примером как математической производительности графических процессоров, так и удачности их архитектуры.

Как видно, во всех случаях, где раньше продукция ATI не могла и приблизиться к Nvidia GeForce 9800 GTX, Radeon HD 4850 демонстрирует полную и безоговорочную победу.

Превосходство над Nvidia GeForce 9800 GTX наблюдается абсолютно во всех тестах, включая двукратный выигрыш на шейдере NPR с 10 текстурными выборками и более чем двукратный на шейдерах, использующих комплексные вычисления с циклами, ветвлениями и условными переходами. Во внушительных вычислительных мощностях RV770 сомневаться не приходилось с самого начала, но теперь очевидно, что бывшее давним проклятием архитектуры ATI Radeon HD «бутылочное горлышко» в виде недостаточной производительности текстурных процессоров, наконец, бесследно исчезло. Как следствие, новое поколение ATI Radeon HD показывает великолепные результаты не только там, где требуется чистая математика, но и повергает решения Nvidia на их поле.

Производительность при обработке геометрии



Тест «простой вершинный шейдер» из состава 3DMark06 слишком прост, но в то же время может показать некую пиковую геометрическую производительность. Тест едва ли очень хорошо подходит для оценки масштабируемости графических архитектур, но в нём ATI Radeon HD 4850 занимает первое место.


По мере роста разрешения ATI Radeon HD 3870 заметно теряет в скорости, а вот ATI Radeon HD берёт сравнительно низкий старт с самого начала, и в разрешении 1280х1024 существенно уступает своему предшественнику, хотя в разрешении 1920х1200 их результаты практически сравниваются. Причина подобного поведения карты на базе RV670 по сей день остаётся неизвестной.


Этот тест оценивает потенциал графической архитектуры при обработке вершинных и геометрических шейдеров, и он же становится первым тестом, где ATI Radeon HD 4850 серьёзно уступает Nvidia GeForce 9800 GTX, хотя и существенно превосходит предыдущее поколение ATI Radeon HD. Это довольно странно, даже если предположить, что из-за плохой программной оптимизации драйверов или самого 3DMark Vantage у ATI Radeon HD 4850 простаивает четыре пятых всех вычислительных мощностей – 160 активных шейдерных процессоров должно быть вполне достаточно для успешного соперничества с Nvidia GeForce 9800 GTX.

В целом, результаты, показанные ATI Radeon HD 4850, закономерны и говорят сами за себя. Говорят они, в первую очередь, о том, что новая архитектура ATI практически лишена узких мест, если не считать отдельных сомнительных результатов в некоторых тестах. Существуют ли такие узкие места на самом деле, могут показать лишь результаты, полученные в реальных игровых условиях, что является темой для отдельного обзора.


Несмотря на существенно возросшие вычислительные возможности RV770, в тесте Xbitmark на скорость обработки геометрии и работы с освещением ATI Radeon HD 4850 повёл себя странно, неожиданно уступив ATI Radeon HD 3870, и особенно сильно – в случае наличия в сцене восьми источников света. Но даже в этом случае он оказался быстрее, нежели Nvidia GeForce 9800 GTX.

Исследование качества и производительности FSAA


Как уже было отмечено в обзоре, посвящённому теоретическому исследованию графической архитектуры ATI Radeon HD 2000, новые техники сглаживания, использующие пост-фильтры narrow tent и wide tent, хотя и улучшают качество сглаживания мелких деталей, но, вместе с тем, способствуют общему замыливанию картинки. В ряде случаев это приводит к неудовлетворительному результату с точки зрения качества изображения. Использование нового алгоритма edge detect CFAA, по замыслу ATI, позволяет избежать замыливания при сохранении великолепного качества сглаживания мелких деталей.

С целью выяснения того, насколько данное заявление соответствует истинному положению дел, нами было проведено блиц-исследование качества сглаживания, обеспечиваемого современными продуктами ATI и Nvidia. В первом случае использовались как традиционные режимы MSAA, так и режим мультисэмплинга с edge-detect фильтром, а в случае с Nvidia GeForce 9800 GTX скриншоты были получены для всех режимов MSAA и CSAA, включая 16xQ.




ATI Radeon HD 4850 MSAA 4xNvidia GeForce 9800 MSAA 4xNvidia GeForce 9800 MSAA 4x
+ CSAA (CSAA 8x)

Качества мультисэмплинга 4х, обеспечиваемого обеими картами, будет достаточно большинству игроков, хотя в сглаживании мелких деталей, если приглядеться, всё-таки видны мелкие огрехи.

Стоит отметить, что режим CSAA 8х, поддерживаемый решениями Nvidia, не является полноценным мультисэмплингом, а представляет собой один из режимов CSAA (coverage sampled anti-aliasing), использующий восемь выборок на сетке покрытия, но лишь четыре выборки цвета и глубины. Как видно на скриншоте, по качеству этот режим практически не отличается от обычного MSAA 4x, во всяком случае, невооружённым глазом заметить отличия чрезвычайно трудно даже в идеальных условиях, не говоря уж об игровой ситуации.




ATI Radeon HD 4850 MSAA 4xNvidia GeForce 9800 MSAA 4x
+ edge detect filter (FSAA 12x)+ CSAA (CSAA 16x)

Режим ATI edge detect CFAA 12x, показывает великолепные результаты, значительно превосходя MSAA 4x по качеству сглаживания, что особенно хорошо заметно на колоннах, присутствующих на скришоте, сделанном в TES IV: Oblivion. Адаптивный фильтр делает своё дело, и грани действительно выглядят намного аккуратнее, причём, без замыливания картинки. Осталось выяснить, насколько этот режим ресурсоёмок и возможно ли его применение в играх без потери комфортной производительности.

Между тем, режим CSAA 16x оказывается ближе к классическому MSAA 4x, нежели к MSAA 8x, поскольку цифра 16 в его названии, как и в случае с CSAA 8x, относится лишь к разрешению сетки покрытия. Это улучшает точность детектирования граней полигонов, однако, финальное значение цвета пикселя точнее рассчитывается при полноценном MSAA 8x, в результате чего, качество сглаживания в последнем случае оказывается заметно выше.




ATI Radeon HD 4850 MSAA 8xNvidia GeForce 9800 MSAA 8x
(CSAA 8xQ)

В режиме MSAA 8x качество сглаживания значительно выше, хотя заметить это сразу довольно сложно, особенно в реальных игровых условиях, а не при изучении неподвижных скриншотов.

Режим Nvidia с маркетинговым названием 8xQ, являющийся классическим MSAA 8x обеспечивает столь же высокое качество сглаживания, как и аналогичный режим, поддерживаемый ATI Radeon HD.




ATI Radeon HD 4850 MSAA 8xNvidia GeForce 9800 MSAA 8x
+ edge detect filter (FSAA 24x)+ CSAA (CSAA 16xQ)

Режим ATI edge detect 24x, несмотря на то, что использует такое же количество выборок цвета и глубины, демонстрирует заметно лучшее качество сглаживания, нежели режим CSAA 16xQ у Nvidia GeForce. За счёт применения «умного» пост-фильтра первый обеспечивает практически идеальное качество сглаживания, но какую цену за это придётся заплатить?


Увы, расплата за качество тяжела – включение режима edge detect FSAA 12х приводит к двукратному падению производительности ATI Radeon HD 4850, а активация режима 24х снизит скорость уже в четыре раза. В то же время, наличие сверхкачественного режима FSAA будет оценено владельцами multi-GPU систем на базе ATI Radeon HD 4850/4870. Скорость при использовании трёх-четырёх GPU возрастёт до достойного уровня, при этом качество изображения будет непревзойдённым.

Тем не менее, использование MSAA 8x на ATI Radeon HD 4850 выглядит вполне оправданно даже в 1920х1200 разрешении (во всяком случае, это действительно для Half-Life 2 Episode 2), в то время как включение аналогичного режима на Nvidia GeForce 9800 GTX приводит к тому, что средняя производительность оказывается на грани минимально приемлемого.

Заключение


Третье поколение DirectX 10-совместимых графических ускорителей от ATI увидело свет.
Кто-то назовёт его очередным витком эволюции, кто-то скажет, что ряд инноваций вкупе с увеличением производительности катализируют революцию в качестве изображения и на рынке графических процессоров. Самое время подвести итог теоретическому исследованию ATI Radeon HD 4800 и сделать какие-то выводы на основе полученных данных.

ATI RV770 действительно является эволюционным развитием идей, частично заложенных ещё в R520/R580, в полной мере реализованных в R600 и RV670 и доведённых до почти совершенства в третьем поколении DirectX 10 процессоров ATI. Стоит понимать, что эволюция R600 → RV770 – это развитие, сочетающее в себе наращивание мощностей с тщательной оптимизацией архитектуры. Иными словами, ATI не просто нарастила мускулы своему новому графическому процессору, но и позаботилась об изящном виде и эффективности этих мускулов, так что ATI Radeon HD 4800 не выглядит жертвой чрезмерного увлечения стероидами.

Как показали результаты теоретических тестов, продуманный подход позволил ATI наделить ATI Radeon HD 4850 потенциалом, существенно превосходящим потенциал Nvidia GeForce 9800 GTX при аналогичном уровне энергопотребления, существенно более простом и компактном дизайне и, что немаловажно, изначально невысокой рекомендуемой цене, благодаря относительно небольшому размеру ядра, составляющей всего 199 долларов. Для сравнения, на момент анонса официальная стоимость Nvidia GeForce 9800 GTX составляла 349 долларов при значительно меньшем пространстве для ценового манёвра, и обвальное снижение цены на этот громоздкий и сложный видеоадаптер явно не пошло компании и её партнёрам на пользу.

Впрочем, 956 миллионов транзисторов у ATI RV770 против 754 миллионов у Nvidia G92 говорит и о том, что поддержка DirectX 10.1, аппаратного тесселлятора, встроенного аудио-контроллера и других нововведений не прошли даром для AMD и уровень сложности новинки даже выше, чем у непосредственного конкурента.

Ставка на массового покупателя, сделанная ATI/AMD, выглядит весьма разумной и стратегически дальновидной, поскольку статистика свидетельствует о снижении средней продажной стоимости графических адаптеров, несмотря на медленный рост объемов их поставок: на конец 2007 года этот показатель достиг 169 долларов, а на конец первого квартала и вовсе упал до 145. В свете этого, ценовая планка 199 долларов, установленная для ATI Radeon HD 4850, выглядит оптимальной, поскольку его простая конструкция и сравнительно низкая себестоимость могут обеспечить разработчику неплохое пространство для дальнейшего снижения цены. Надо заметить, что в московской рознице видеокарты на этом чипе стоят несколько выше: порядка 5-7 тысяч рублей, в зависимости от производителя и объема памяти.


Помимо сочетания серьёзного игрового потенциала, простой конструкции и низкой цены, видеоадаптеры ATI Radeon HD 4800 обладают и рядом уникальных качеств, которых лишены разработки главного конкурента графического подразделения Advanced Micro Devices. В частности, это полноценная поддержка декодирования VC-1, поддержка продвинутых профилей BD и наличие полноценного звукового ядра, способного выводить многоканальный HD-звук. Это делает ATI Radeon HD 4850 идеальным решением для цифрового центра развлечений, не только обладающего продвинутыми мультимедийными возможностями, но способного обеспечить высокую производительность в современных играх.

Итак, имеются все предпосылки для того, чтобы говорить о возможном возвращении былой ATI, равно как и её влияния на рынке настольной дискретной графики, однако окончательный вердикт будет вынесен лишь после тестирования новинок в популярных игровых приложениях. Только они могут дать объективную картину производительности ATI Radeon HD 4800.

Power Color Radeon HD 4850 512MB: достоинства и недостатки


В целом, Power Color HD 4850 (модель AX4850 512MD3-H) можно оценить как хороший продукт, являющийся отличным выбором за свою цену. Просуммируем его достоинства и недостатки.

Достоинства:

Широкий выбор режимов FSAA
Лучшее в индустрии качество сглаживания в режиме edge detect CFAA
Великолепное качество анизотропной фильтрации
Наличие 800 ALU, 40 текстурных и 16 растровых процессоров
Поддержка DirectX 10.1 и Shader Model 4.1
Полноценная аппаратная поддержка декодирования HD-видео
Высококачественный постпроцессинг HD-видео, включая масштабирование
Интегрированное 8-канальное звуковое ядро с поддержкой звуковых форматов HD
Поддержка вывода звука через HDMI
Низкий уровень шума
Отсутствие проблемы с совместимостью
Неплохая комплектация

Недостатки:

Комплект поставки не включает ПО для проигрывания HD-видео


Уточнить наличие и стоимость видеокарт на ATI Radeon HD4850
Уточнить наличие и стоимость видеокарт на ATI Radeon HD4870

Другие материалы по данной теме


Обзор графического адаптера Zotac GeForce 9800 GTX AMP!: быстрее, еще быстрее
Справочные таблицы по видеорешениям ATI и NVIDIA
Что в имени тебе моём: обзор видеокарты MSI Radeon HD 3650