Обзор NVIDIA GeForce4

Автор: Tim
Дата: 06.02.2002
Все фото статьи

Введение


6 февраля компания NVIDIA официально объявила новый чип - GeForce4, или, по внутренней классификации - NV25.
На базе NV25 будет построена новая серия видеокарт high-end уровня - NVIDIA GeForce4 Titanium. В этой линейке пока насчитывается два продукта:

NVIDIA GeForce4 Ti 4600 - 128МБ видеопамяти DDR SDRAM 128 бит, тактовые частоты - 300/650 МГц.
NVIDIA GeForce4 Ti 4400 - 128МБ видеопамяти DDR SDRAM 128 бит, тактовые частоты - 275/550 МГц.

Возможно, в скором времени после появления перечисленных модедей, появятся платы серии GeForce4 Ti4200, на которые будет устанавливаться более медленная видеопамять и чипы GeForce4 с пониженной тактовой частотой. Пока неизвестно, какими окажутся тактовые частоты GeForce4 Ti4200 - отбраковки еще мало :)

С выходом NV25 очень многие связывали большие надежды, ожидая если не новой революции в 3D-графике, то серьезного прорыва. Забегая вперед, скажу, что многим из этих ожиданий не суждено оправдаться. NVIDIA GeForce4 не имеет настолько же революционных нововведений, какие имел чип NVIDIA GeForce3 год назад.
Однако, то, что разработчики, добавив множество новых деталей, сотворили с архитектурой NVIDIA GeForce3, ставшей основой для NVIDIA GeForce4, не оставляет сомнений: перед нами - новый, быстрый и опасный монстр 3D-графики.

Соблюдая необходимые предосторожности, мы решили выяснить, чем грозит миру новое поколение этих зверей, заполучив для исследования экземпляр NVIDIA GeForce4 Ti4600 :)

Возможности и характеристики NVIDIA GeForce4


Итак, рассмотрим отличия серии GeForce4 Titanium от серии GeForce3 Titanium. Для удобства мы свели в таблицу основные характеристики NVIDIA GeForce4 Ti4600, GeForce3 Ti500 и RADEON 8500:
Основные характеристики
  NVIDIA GeForce4 Ti4600 NVIDIA GeForce3 Ti500 ATI RADEON 8500
 Технология производства 0.15 мкм 0.15 мкм 0.15 мкм
 Тактовая частота работы ядра (МГц) 300 240 275
 Число пиксельных конвейеров 4 4 4
 Число тестурных модулей в конвейере 2 2 2
 Максимальная скорость заполнения сцены (Мпикселей/сек) 1200 960 1100
 Максимальная скорость заполнения сцены (Мтекселей/сек) 2400 1920 2200
 Максимальное количество текстур, накладываемых за 1 проход 4 4 6
 Методы фильтрации текстур билинейная, трилинейная, анизотропная билинейная, трилинейная, анизотропная билинейная, трилинейная, анизотропная
 Методы имитации рельефности emboss, EMBM, Dot3 emboss, EMBM, Dot3 emboss, EMBM, Dot3
 Поддержка полноэкранного сглаживания Мультисэмплинг 2x, 4x, Quincunx, 4xS Мультисэмплинг 2x, 4x, Quincunx Мультисэмплинг Smoothvision 2x..6x
 Поддержка пиксельных шейдеров Да, до версии 1.3 Да, до версии 1.3 Да, до версии 1.4
 Поддержка вершинных шейдеров Да, до версии 1.1 Да, до версии 1.1 Да, до версии 1.1
 Поддержка поверхностей высокого порядка RT-Patches RT-Patches N-Patches
 Технологии оптимизации Z Occlusion Culling, Z Compression, Fast Z Clear,Memory Precharge Z Occlusion Culling, Z Compression HyperZ II
  Контроллер видеопамяти 4х32 бита сrossbar SDRAM/SGRAM, DDR SDRAM/SGRAM 4х32 бита сrossbar SDRAM/SGRAM, DDR SDRAM/SGRAM 128 бит SDRAM/SGRAM, DDR SDRAM/SGRAM
 Частота видеопамяти 650 (325 DDR) МГц  500 (250 DDR) МГц  550 (275 DDR) МГц
 Поддержка двухмониторных конфигураций Да Нет Да
 Аппаратная декомпрессия DVD Да Нет Да

Перечислим нововведения, то есть то, что, помимо тактовых частот, отличает NVIDIA GeForce4 от GeForce3:

Блок вершинных шейдеров:

В NVIDIA GeForce4 встроено 2 блока вершинных шейдеров, полностью аналогичных таковым в GeForce3. Блоки вершинных шейдеров NVIDIA GeForce4 работают параллельно, как в графическом ядре приставки XBOX от Microsoft, в результате, скорость обработки вершинных шейдеров увеличивается.
Проверим это с помощью синтетических тестов 3DMark2001:

Преимущество NVIDIA GeForce4 Ti4600 видно невооруженным глазом: сдвоенный T&L-блок нового чипа от NVIDIA оказывается быстрее даже при тактовых частотах 240/500 МГц, как у NVIDIA GeForce3 Ti500, не говоря уж о работе на номинальных частотах.

С вершинными шейдерами дело обстоит уже не так оптимистично: несмотря на сохранившееся преимущество над NVIDIA GeForce3 Ti500 в этом тесте, GeForce4 Ti4600 проигрывает ATI RADEON 8500. Высокая эффективность выполнения инструкций блоком вершинных шейдеров ATI RADEON 8500 позволила ему оказаться лидером, опередив GeForce4 Ti4600 с его двумя блоками вершинных шейдеров и более высокой тактовой частотой ядра.

Блок пиксельных шейдеров:

Как видно по таблице, в NVIDIA GeForce4 введена поддержка пиксельных шейдеров версии 1.2 и 1.3. Возможности пиксельных шейдеров версии 1.2 и 1.3, по идее, доступны и ядру NVIDIA GeForce3, однако, драйверы рапортуют о том, что GeForce3 поддерживает максимум лишь версию 1.1 пиксельных шейдеров.
Блок пиксельных шейдеров перешел в NVIDIA GeForce4 из GeForce3 без изменений в архитектуре, и это видно по конфигурации доступных регистров в версиях 1.1 - 1.3:

Регистры пиксельных шейдеров версии 1.0 - 1.4
 Версия пиксельных шейдеров 1.0 1.1 1.2 1.3 1.4
 Количество доступных регистров     
 Регистры констант - Cn 8 8 8 8 8
 Временные регистры - Rn 2 2 2 2 6
 Регистры текстур - Tn 4 4 4 4 6
 Регистры цвета - Vn 2 2 2 2 2
 Максимальное количество вхождений регистра данного типа в инструкцию     
 Регистры констант - Cn 2 2 2 2 2
 Временные регистры - Rn 2 2 2 2 3
 Регистры текстур - Tn 1 2 3 3 1
 Регистры цвета - Vn 1 2 2 2 2


Количество доступных регистров не изменилось, но увеличилось максимальное количество вхождений этих регистров в инструкции в качестве исходных данных. Также появилась поддержка нескольких новых инструкций:

Инструкции пиксельных шейдеров версии 1.0 - 1.4
 Версия пиксельных шейдеров 1.0 1.1 1.2 1.3 1.4
 Инструкции, определяющие версию пиксельных шейдеров     
 ps * * * * *
 Инструкции, определяющие константы     
 def * * * * *
 Инструкции, определяющие фазу выполнения шейдера     
 phase     *
 Математические инструкции     
 add * * * * *
 bem     *
 cmp   * * *
 cnd * * * * *
 dp3 * * * * *
 dp4   * * *
 lrp * * * * *
 mad * * * * *
 mov * * * * *
 mul * * * * *
 nop * * * * *
 sub * * * * *
 Инструкции адресации     
 tex * * * * 
 texbem * * * * 
 texbeml * * * * 
 texcoord * * * * 
 texcrd     *
 texdepth     *
 texdp3   * * 
 texdp3tex   * * 
 texkill * * * * *
 texld     *
 texm3x2depth    * 
 texm3x2pad * * * * 
 texm3x2tex * * * * 
 texm3x3   * * 
 texm3x3pad * * * * 
 texm3x3tex * * * * 
 texm3x3spec * * * * 
 texm3x3vspec * * * * 
 texreg2ar * * * * 
 texreg2gb * * * * 
 texreg2rgb   * * 


Новые инструкции позволяют производить более "продвинутые" векторные и скалярные вычисления, но самой, по-моему, интересной из новых инструкций является texm3x2depth (своего рода аналог texdepth для пиксельных шейдеров версии 1.4, поддерживаемых ATI RADEON 8500). На основе данных, полученных на предыдущих стадиях пиксельного шейдера, и исходного значения Z для обрабатываемого пиксела инструкция texm3x2depth позволяет получать новое значение Z для этого пиксела.
Такой инструмент для варьирования глубины каждого пиксела может использоваться совместно с методами имитации рельефности. При этом, например, линии пересечения "рельефных" полигонов уже не будут прямыми, разрушающими весь зрительный эффект от имитации рельефности, а станут более натуральными, искривленными - при проверке Z для пикселов "рельефных" полигонов будут учитываться уже модифицированные значения.
В общем, ждем новые демонстрации и поддержку более корректного рельефного текстурирования от NVIDIA и ATI в играх.

Что касается скорости блока пиксельных шейдеров NVIDIA GeForce4 Ti4600, то тут никаких сюрпризов нет: блоки пиксельных шейдеров NVIDIA GeForce4 Ti4600 и GeForce3 Ti500 имеют равную производительность на одинаковых частотах, а на номинальных частотах NVIDIA GeForce4 Ti4600 - лидер:

Accuview и полноэкранное сглаживание 4xS:

Вариации полноэкранного сглаживания по принципу мультисэмплинга - 2x, Quincunx, 4x, к числу которых добавился новый метод 4xS, вкупе с анизотропной фильтрацией текстур, на GeForce4 были названы новым звучным словом - Accuview.
Однако, "новым" здесь является лишь метод полноэкранного сглаживания 4xS.
Метод 4xS , который, кстати, был доступен и NVIDIA GeForce3, представляет собой комбинацию мультисэмплинга 2х и суперсэмплинга 1х2. Конечный цвет пиксела при 4xS определяется усреднением цвета двух стоящих друг под другом субпикселей, каждый из которых сам по себе является результатом мультисэмплинга 2x. В общем, для наглядности, представьте себе доминошную костяшку "2:2", стоящую вертикально...
Метод 4xS по своей сути обеспечивает наиболее качественное сглаживание "ступенек" на горизонтальных прямых и прямых с небольшим углом относительно горизонтали. Я проверил это на примере Serious Sam: The Second Encounter, сравнив качество методов 2x, Quincunx, 4x, 4xS от NVIDIA, а также добавив в сравнение SMOOTHVISION 6x Quality от ATI - для полноты картины:

Без сглаживания:Accuview 2x:Accuview Quincunx:






Accuview 4x:Accuview 4xS:Smoothvision 6x Quality:





Действительно, метод 4xS на близкой к горизонтали прямой дал неплохой результат, сравнимый по качеству с методом SMOOTHVISION 6x Quality от ATI, который я считаю лучшим на сегодняшний день по качеству. На других углах 4xS также показал хорошее качество, но, по моему мнению, не такое, как SMOOTHVISION 6x Quality. Впрочем, сколько людей - столько мнений...

Продолжая тему полноэкранного сглаживания, хотелось бы напомнить, что одной из особенностей мультисэмплинга является то, что для всех субпикселей (сэмплов) используется один и тот же цвет, то есть, несмотря на использование мультисэмплинга с любым количеством субпикселов (сэмплов), наложение текстуры или выполнение пиксельного шейдера выполняется для каждого пиксела ровно один раз за один проход. Поэтому ни о каком улучшении качества фильтрации текстур при включении мультисэмплинга говорить не приходится.
Метод 4xS кардинально отличается от остальных методов мультисэмплинга на NVIDIA GeForce3 / GeForce4 тем, что в 4xS применяется как мультисэмплинг, так и суперсэмплинг.
При использовании "старого доброго" суперсэмплинга каждый субпиксел имеет свой цвет, поэтому качество фильтрации текстур действительно может улучшиться, но, к сожалению, ценой больших потерь производительности. Вдобавок, элементы меню и всевозможных строк состояния и статуса, без которых не обходятся современные игры, могут быть пренеприятнейшим образом размыты.

Метод 4xS предлагает нам компромиссное решение? Хорошо, вот как раз и посмотрим, что дает его применение в том же Serious Sam: The Second Encounter при включении анизотропной фильтрации наивысшего доступного уровня:

Без сглаживания:Accuview 2x:Accuview Quincunx:






Accuview 4x:Accuview 4xS:Smoothvision 6x Quality:





Что ж, улучшения в качестве фильтрации текстур при использовании 4xS есть, но они настолько малы, что их приходится специально искать, а это не самое интересное занятие :)
А вот чем оборачивается использование полноэкранного сглаживания в плане производительности - интересно. Посмотрим, к каким потерям производительности приведет включение полноэкранного сглаживания в Serious Sam: The Second Encounter (режимы speed и quality, их описание - ниже):





Ничего неожиданного нет, все результаты оказываются такими, какими они должны были быть, лишь в режиме "Quality" метод 4xS оказывается медленнее, чем 4x.
Режим "quality" отличается от "speed", помимо всего прочего, наличием анизотропной фильтрации, а режим 4xS от 4x - наличием суперсэмплинга 2х1.
Из-за присутствия суперсэмплинга 2х1 в 4xS при включении анизотропной фильтрации удвоение затрат на вычисление цвета становится очень заметно. Причем, чем выше уровень анизотропной фильтрации, тем сильнее 4xS "отстает" от 4x. Для того, чтобы разобраться с падением производительности в режимах 4x и 4xS, я использовал тестовую сцену Lobby из 3DMark 2001:



Что ж, всё очевидно: увеличение вычислительных затрат на анизотропную фильтрацию приводит к такому же увеличению времени на отрисовку пиксела при 4x, и к двойному увеличению времени - при 4xS.

О качестве и производительности NVIDIA GeForce4 при анизотропной фильтрации я расскажу чуть ниже, чтобы не перегружать информацией этот раздел.

Lightspeed Memory Architecture II:

Lightspeed Memopy Architecture II - развитие архитектуры памяти Lightspeed Memopy Architecture чипа NVIDIA GeForce3.
LMA II объединяет в себе 128-битный контроллер памяти, разделенный на четыре 32-битных, как и у NVIDIA GeForce3 и другие технологии повышения эффективности использования видеопамяти:

Z-Occlusion Culling - этот метод, впервые введенный еще в NVIDIA GeForce3, позволяет перед текстурированием пиксела определить его видимость по его значению Z, и, в том в случае, если пиксел оказывается невидим, не обрабатывать его, сэкономив на обращении к буферу кадра, Z-буферу и текстурам.

Lossless Z Compression - сжатие Z-буфера без потерь. Есть и в NVIDIA GeForce3, и в NVIDIA GeForce4. Позволяет сэкономить на передаче и хранении данных Z-буфера благодаря его сжатию с сотношением 4:1.

Fast Z Clear - быстрая очистка Z-буфера. Позволяет избавиться от необходимости заполнять Z-буфер начальным значением Z в начале построения каждого кадра. Судя по заявлениям NVIDIA, эта функция появилась только в GeForce4.

Memory Auto Pre-Charge - подготовка банков микросхем видеопамяти к чтению и записи производится, по возможности, заранее, а не при возникновении необходимости их реинициализировать.
По заявлениям NVIDIA, это позволяет избежать вынужденных простоев GPU, которые могут длиться до 10 тактов, в течение которых GPU ожидает готовность видеопамяти. Время ожидания при использовании Auto Pre-Charge, по заявлениям NVIDIA, снижается до 2-3 тактов.

Quad Cache - в NVIDIA GeForce4 есть 4 раздельных кэша: примитивов, вершин, пикселей и текстур, причем, каждый из них оптимизирован под работу со своим форматом данных и типичным характером запросов.

Список технологий, призванных повысить эффективность работы нового ядра от NVIDIA, внушает. Посмотрим, как LMA II покажет себя в деле :) Для таких целей существует очень хороший тест, сделанный когда-то одной очень хорошей компанией для демонстрации преимуществ одного очень хорошего чипа.. :) Короче - VillageMark:

Выключение Z Occlusion Culling и Lossless Z Compression на NVIDIA GeForce4 Ti4600 не привело к заметному падению производительности, и это может означать 2 вещи: либо RivaTuner не умеет еще работать с NVIDIA GeForce4, либо, что маловероятно, выключение этих функций действительно не приводит к снижению производительности.
Не может не радовать то, что GeForce4 Ti4600 на равных с GeForce3 Ti500 частотах в любом режиме оказывается быстрее последней. Это значит, что новые функции архитектуры LMA II приносят реальный результат, обеспечивая еще более эффективное использование видеопамяти, чем LMA.

nView:

nView, развитие идей TwinView - пожалуй, самое долгожданное и интересное нововведение в NVIDIA GeForce4. Новый чип верхней ценовой категории от NVIDIA, наконец, имеет полноценную поддержку двухмониторных конфигураций! Ушла в прошлое неприятная ситуация, когда дорогие и быстрые 3D-чипы от NVIDIA не имели такой поддержки, а их удешевленные версии - NVIDIA GeForce2 MX/MX200/MX400 - могли работать с двумя мониторами, не обеспечивая высокой скорости в играх.
Разумеется, без влияния ATI тут не обошлось: если бы ATI RADEON 8500/7500 не имели поддержки двухмониторных конфигураций, то аналогичного предложения от NVIDIA мы могли бы не получить еще очень долго. Но уже сейчас, по сути, благодаря ATI, мы имеем поддержку двухмониторных конфигураций в NVIDIA GeForce4.
Чипы серии NVIDIA GeForce4 имеют 2 RAMDAC c частотой преобразования 350 МГц, поддержку вывода на ТВ и цифровые мониторы.

При подключении двух мониторов (точнее, двух устройств отображения, будь то монитор, цифровая панель или телевизор) nView позволяет работать в режимах Clone, Zoom, Horizontal Span и Vertical Span, причем, первичное и вторичное устройство можно менять местами совершенно безболезненно, как на всех последних видеокартах от ATI:

Можно управлять ориентацией изображения на экране:

При воспроизведении видео становится доступен еще один режим работы - Video Mirror, но особо останавливаться на нем не хочется - он работает аналогично одноименному режиму в TwinView.

Говоря о nView, не могу не обратить внимание на программную поддержку аппаратных возможностей NVIDIA GeForce4. Вот здесь nView Desktop Manager показывает себя с наилучшей стороны, обеспечивая высокую функциональность и удобство использования двухмониторных конфигураций с nView:

Создание и редактирование профайлов:

Управление окнами и диалогами:

Настройка эффектов, Zoom:

Настройка горячих клавиш:

Управление виртуальными десктопами:

По функциональности nView явно не уступает технологии HYDRAVISION от ATI. Единственное замечание по nView, которове появилось у меня после общения с сэмплом NVIDIA, касается TV-Out.
Судя по заявлениям NVIDIA, в чипы серии GeForce4 встроен продвинутый блок ТВ-вывода с поддержкой HDTV, однако, на протестированном нами сэмпле NVIDIA GeForce4 Ti4600 формирование ТВ-сигналов обеспечивал внешний чип CX 25871-13 от Conexant. При этом качество изображения на телевизоре оказалось неважным - TB-выход на видеокартах от ATI реализован на порядок качественнее.
В общем, ждем появления серийных карт на чипах NVIDIA GeForce4, в надежде, что ТВ-выход на них будет выполнен более качественно.

Video Processing Engine, аппаратное декодирование MPEG2

Video Processing Engine - так были названы функции ядра NVIDIA GeForce4, отвечающее за работу с оверлеями и видео.
NVIDIA GeForce4 поддерживает все стандартные функции по работе с оверлеями и видео, такие, как преобразрования цветовых пространств, компенсация движения, и т.д... Плюс ко всему, NVIDIA GeForce4 поддерживает качественное масштабирование (5-tap horizontal, 3-tap vertical), адаптивный деинтерлейсинг при воспроизведении видео с чересстрочной разверткой на мониторе с прогрессивной разверткой, аппаратную декомпрессию MPEG2 (обратное дискретное косинусное преобразование). Для оверлеев есть возможность отдельно настроить цветовую гамму, и вдобавок, для каждого устройства отображения есть возможность настроить цветовую гамму отдельно (технология Digital Vibrance Color). Поддерживается вывод изображения в формате HDTV.
В общем, VPE предоставляет все возможности для удобной работы с видео на компьютере и просмотра на мониторе или телевизоре. Вот только, к сожалению, качество ТВ-выхода на сэмпле NVIDIA GeForce4 Ti4600, как я написал выше, не впечатляет.

Итак, после ознакомления с значительными и незначительными нововведениями в чипе NVIDIA GeForce4, пора рассмотреть и плату - сэмпл NVIDIA GeForce4 Ti4600.

Плата NVIDIA GeForce4 Ti4600


Сэмпл имеет большие размеры, оборудован необычными микросхемами видеопамяти, солидным кулером, мощным стабилизатором питания - короче, производит впечатление:

На графическом ядре установлен кулер приличных габаритов с логотипом NVIDIA. Чип NV25, как и NV20, выполнен по технологии 0.15мкм, но имеет большее количество транзисторов и большую тактовую частоту, поэтому более эффективная система охлаждения ему просто необходима:

Сам чип NV25 внешне ничем необычным не выделяется, самого быстрого и опасного из нынешних графических монстров выдает в нем только маркировка :

Тактовая частота работы чипа - 300 МГц - самая высокая среди существующих игровых 3D-чипов.

На плате установлено 128 МБ видеопамяти DDR SDRAM от Samsung с временем цикла 2.8 нс. Чипы памяти имеют новый вариант упаковки - BGA:



Такой вид упаковки, по видимому, обусловлен очень высокими тактовыми частотами работы видеопамяти и необходимостью минимизировать влияние помех и наводок. На NVIDIA GeForce4 Ti4600 видеопамять работает на частоте 650 (325 DDR) МГц по умолчанию. Прежде таких частот работы видеопамяти нам удавалось достичь только при экстремальном разгоне ATI RADEON 8500. Честно говоря, уже не терпится выяснить, что удастся выжать при таком разгоне из NVIDIA GeForce4 Ti4600 :)..

Плата оборудована вывходами VGA, DVI-I и S-Video, формирование сигнала для цифровых мониторов обеспечивает чип Sil164ct64 от Silicon Image, часто устанавливаемый на видеокарты на базе чипов от NVIDIA:

За формирование телевизионного сигнала отвечает чип Conexant CX25871-13:

Тестовая система и условия тестирования


Конфигурация тестового стенда:

Процессор - AMD Athlon XP 2000+;
Материнская плата – MSI K7T266 Pro2 v2.0 (VIA KT266A);
Память - 2*128 МБ DDR SDRAM PC 2100 Nanya CL2;
Жесткий диск – Fujitsu MPF3153AH.


Программное обеспечение:

Драйвер версии 6.13.10.6011 под Windows XP для ATI RADEON 8500;
Драйвер Detonator 23.11 под Windows XP для платы VisionTek Xtasy 6964 ( NVIDIA GeForce3 Ti500);
Драйвер Detonator 27.20 под Windows XP для сэмпла NVIDIA GeForce3 Ti500;
Windows XP
VillageMark;
Max Payne;
Serious Sam: The Second Encounter;
3DMark 2001;
Quake3 Arena v1.27;

Настройки режимов тестирования:

VillageMark:

Глубина цвета текстур и буфера кадра - 32 бита. Остальные настройки - по умолчанию.

Max Payne:

Режим quality - настройки качества графики - максимальные. Полноэкранное сглаживание выключено, анизотропная фильтрация выключена, чтобы обеспечить равные условия для тестирования видеокарт от NVIDIA и ATI. Глубина цвета текстур и буфера кадра - 32 бита.
Режим speed - настройки качества графики - минимальные. Глубина цвета текстур и буфера кадра - 16 бит.
Для тестирования в Max Payne был использован benchmark mod и тестовая сцена PCGH's Final Scene No1, описание которых находится на немецком сайте 3DCenter.

Serious Sam: The Second Encounter:

Режим speed: настройки качества графики "Speed", графические режимы - 32-битные;
Режим quality: настройки качества графики "Quality", графические режимы - 32-битные;
Режим extreme quality: настройки качества графики "Quality", графические режимы - 32-битные, дополнительно запускался стандартный адд-он "Graphics: Extreme Quality", вдобавок, устанавливался максимальный уровень анизотропной фильтрации;
Тестирование было проведено на стандартной демо-записи "The Grand Cathedral".

При тестировании образца NVIDIA GeForce4 Ti4600 дополнительно пришлось добавить в файл автоинициализации графики Seriou Sam: The Second Encounter строки, заставляющие движок игры распознавать чип NVIDIA GeForce4 Ti4600 и использовать для него набор настроек, соответствующий NVIDIA GeForce3. Это, мне кажется, наиболее близкий "к истине" вариант, особенно если учесть практически полную идентичность 3D-части архитектуры чипов NVIDIA GeForce4 и GeForce3.
В противном случае игровой движок не распознавал видеокарту NVIDIA GeForce4 Ti4600 и работал с ней как со "стандартной", не используя преимущества архитектуры NVIDIA GeForce3/GeForce4, такие как возможность наложения до 4 текстур за 1 проход, и т.д.

Использование игровым движком технологии TRUFORM, по умолчанию включенное для ATI RADEON 8500, не выключалось.

3DMark 2001:

Все игровые тесты были проведены с использованием 32-битного буфера кадра, 32-битных текстур и 32(24)-битном Z-буфере, в режиме Pure Hardware T&L. В синтетически тестах изменения условия тестирования указаны на диаграммах.

Quake3 Arena v1.27:

Все тесты были проведены с максимальными настройками качества графики, трилинейная фильтрация - включена, компрессия текстур - включена. Глубина цвета текстур и буфера кадра - 32 бита.
Тестирование было проведено на стандартной демо-записи demo127, входящей в комплект Quake 3 Arena 1.27 Point Release Patch.

Скорость в 3D - синтетические тесты


Часть синтетических тестов 3DMark 2001 была уже приведена ранее, поэтому здесь я приведу лишь те тесты, которые до сих пор оставались без внимания:

Интересная ситуация: в 16 битах NVIDIA GeForce4 Ti4600 в этом тесте показывает результат, лишь на величину погрешности отличающийся от максимально возможного для этого чипа! При 32-битном качестве текстур и буфера кадра LMA II обеспечивает минимальные потери производительности, в результате чего даже на тактовых частотах 240/500 МГц скорость заполнения NVIDIA GeForce4 Ti4600 оказывается выше, чем GeForce3 Ti500.





В тестах на скорость рельефного текстурирования лидирует NVIDIA GeForce4 Ti4600, благодаря высочайшему значению fillrаte и набору технологий Lightspeed Memory Architecture II.

Скорость в 3D - игровые тесты



3DMark2001 - Dragothic:





Преимущество NVIDIA GeForce4 Ti4600 - просто подавляющее. В тесте Dragothic для анимации всех персонажей используются вершинные шейдеры, а количество полигонов в моделях велико. Неудивительно, что GeForce4 Ti4600 оказывается с таким отрывом лидером в этом тесте.
Обидно за ATI RADEON 8500: в предыдущий раз он показал более высокий результат, опередив NVIDIA GeForce3 Ti500. Однако, с того момента успели появиться новые драйверы как от NVIDIA, так и от ATI, и результат изменился не в пользу ATI RADEON 8500.

3DMark2001 - Lobby:





Здесь уже нет такой сложной геометрии, и всё определяется скоростью заполнения. Сэмпл NVIDIA GeForce4 Ti4600, имеющий самые высокие тактовые частоты и эффективную систему памяти - безоговорочный лидер.
Опять приходится отметить ухудшение позиций ATI RADEON 8500. Как показывает практика, хотя бы на примере этого теста, одной лишь высокой скорости заполнения сцены, а она у ATI RADEON 8500 выше, чем у NVIDIA GeForce3 Ti500, недостаточно, необходимы еще и как следует оптимизированные драйверы. У NVIDIA, в отличие от ATI, похоже, с этим проблем нет.

3DMark2001 - Nature:

В этом тесте, использующем пиксельные и вершинные шейдеры, NVIDIA GeForce4 Ti4600 опять лидирует, и это неудивительно: скорость выполнения пиксельных и вершинных шейдеров напрямую зависит от частоты работы ядра, тем более, GeForce4 Ti4600 имеет сдвоенный блок T&L и вершинных шейдеров. Впрочем, судя по результатам, скорость выполнения вершинных шейдеров тут никак не является ограничивающим фактором. Результат в этом тесте больше зависит от величины Fillrate и скорости выполнения пиксельных шейдеров.
За ATI RADEON 8500 хотя бы сейчас можно порадоваться: относительно результатов предыдущего тестирования наблюдается более чем двукратный прирост, который невозможно списать на то, что на сей раз использовался более мощный процессор - AMD Athlon XP 2000+ вместо Athlon XP 1600+.

Quake 3 Arena:

Результат в Quake3 Arena определяется скоростью заполнения и эффективностью HSR, поэтому то, что NVIDIA GeForce4 Ti4600 лидирует в этом тесте "всех времен и народов" - закономерно :)

Max Payne:

В обоих режимах MахРауne NVIDIA GeForce4 Ti4600 оказывается лидером.
ATI RADEON 8500, несмотря на более совершенный по сравнению с NVIDIA GeForce3 Ti500 блок T&L и более высокий показатель Fillrate, оказался аутсайдером.

Serious Sam: The Second Encounter:







Serious Sam: The Second Encounter - игра, способная в режиме extreme quality загрузить даже NVIDIA GeForce4 :)
Однако, во всех режимах NVIDIA GeForce4 опережает соперников, и увеличение сложноси графики приводит лишь к увеличению отрыва NVIDIA GeForce4 Ti4600 от GeForce3 Ti500. В режиме extreme quality, помимо увеличения затрат на текстурирование и отображение всевозможных спецэффектов, модели имеют наиболее высокую сложность даже на больших расстояниях, и это позволяет проявиться сдвоенному T&L-блоку NVIDIA GeForce4.
ATI RADEON 8500, благодаря быстрой реализации анизотропной фильтрации, при увеличении сложности графики показал себя очень неплохо, вплотную подобравшись к NVIDIA GeForce4 Ti4600 в самом "тяжелом" режиме.

Кстати, о качестве и скорости реализации анизотропной фильтрации как раз и пойдет речь в следующем разделе.

Качество в 3D - анизотропная фильтрация


Accuview, "новое слово" от NVIDIA, означает совокупность полноэкранного сглаживания и анизотропной фильтрации - основных методов улучшения качества изображения в современных 3D - играх. Полноэкранное сглаживание мы уже обсудили в предыдущих разделах, а анизотропную фильтрацию - нет.
NVIDIA GeForce4 , как и GeForce3, поддерживает анизотропную фильтрацию по 8, 16 и 32 сэмплам. При этом качество фильтрации текстур на обоих чипах совершенно одинаково. В качестве примера приведу скриншоты из Serious Sam: The second Encounter в режиме "extreme quality":

NVIDIA GeForce4 Ti4600:NVIDIA GeForce3 Ti500:ATI RADEON 8500:





Как видно, качество анизотропной фильтрации на NVIDIA GeForce4 и NVIDIA GeForce3 Ti500 одинаково.
Посмотрим, к каким потерям производительности приводит включение анизотропной фильтрации на NVIDIA GeForce4 Ti4600 в сравнении с GeForce3 Ti500 и ATI RADEON 8500:





Потери производительности при включении анизотропной фильтрации на NVIDIA GeForce4 Ti4600 оказались намного выше, чем на NVIDIA GeForce3 Ti500. Это не может не огорчать, учитывая то, что NVIDIA GeForce3 Ti500 и так теряет от включения анизотропной фильтрации высшего уровня почти половину производительности. Лишь то, что NVIDIA GeForce4 Ti4600 работает на более высоких частотах, спасло чип от сильного проигрыша GeForce3 Ti500 в этом тесте.

Разгон


Напомню, по умолчанию сэмпл NVIDIA GeForce4 Ti4600 работает на частотах 300 МГц у ядра и 650 (325 DDR) МГц у видеопамяти.
При разгоне нам удалось добиться устойчивой работы видеокарты на частотах 330/740 (370 DDR) МГц. Использование чипов видеопамяти с временем цикла 2.8 нс, упакованных в BGA-корпуса, позволяет надеяться, что серийные карты будут иметь такой же или даже более высокий разгонный потенциал.
Относительно разгона ядра на серийных видеокартах прогнозы делать сложно. С одной стороны, 300 МГц для видеочипа, выполненного по техпроцессу 0.15 мкм - уже очень много, с другой стороны, разгону-то он поддается: была достигнута частота 330 МГц. Так что, мне кажется, серийные платы на базе NV25 можно будет спокойно разгонять, как и все видеокарты на чипах предыдущих поколений :). Остается лишь вопрос охлаждения.
Система охлаждения, установленная на графический чип, имеет очень высокую эффективность: я бы не сказал что температура чипа NV25 на сэмпле оказалась сильно выше, чем чипов NVIDIA GeForce3 / GeForce3 Ti500. Однако, какие системы охлаждения будут устанавливаться на серийные видеокарты - пока неизвестно.

Заключение


Создается впечатление, что, выпуская чип GeForce4, компания NVIDIA четко выделила слабые места чипов поколения GeForce3 Ti500, и "усилила" именно те направления, которые затребованы в настоящий момент.
Сложившаяся с выходом ATI RADEON 8500 ситуация, при которой новейшие видеокарты от ATI по целому ряду параметров превосходят NVIDIA GeForce3 Ti500, совершенно не устроила компанию NVIDIA, и возможно, поэтому в NV25 мы видим не вестника новой революции в 3D-графике, а лишь ответ, но ответ жесткий и бескомпромиссный.
Судите сами:
ATI RADEON 8500, в отличие от NVIDIA GeForce3 имеет поддержку двухмониторных конфигураций - в GeForce4 она, наконец введена и реализована на должном уровне.
ATI RADEON 8500, способен производить аппаратную декомпрессию MPEG2 - аппаратная декомпрессия появляется и в GeForce4.
ATI RADEON 8500 имеет более эффективный блок вершинных шейдеров, чем NVIDIA GeForce3 - в GeForce4 устанавливается два таких блока.
ATI RADEON 8500 имеет поддержку более "продвинутых" пиксельных шейдеров,чем NVIDIA GeForce3 - версии 1.4 против 1.1 - в GeForce4 из старой архитектуры выжимается всё, что возможно, и объявляется поддержка пиксельных шейдеров версии 1.3.
ATI RADEON 8500 имеет систему HyperZ II, более эффективную, чем HSR на NVIDIA GeForce 3 - в GeForce4 появляется Lightspeed Memory Architecture II.
ATI RADEON 8500 наконец, имеет более высокие тактовые частоты ядра и видеопамяти по сравнению с NVIDIA GeForce3 Ti500 - NVIDIA GeForce4 Ti4600 работает на еще более высоких частотах.
В общем, можно с уверенностью сказать, что у NVIDIA GeForce4 практически нет слабых мест, а производительность его находится на уровне, недосягаемом для остальных нынешних чипов.

Кто-то пожалеет, что революция в 3D-графике не состоялась, но известно, что революции - не всегда во благо.
Во-первых, полноценная поддержка возможностей DirectX8 в играх до сих пор еще не стала массовой, и новая революция лишь навредит приходу DirectX8 и шейдеров "в массы".
В-вторых, выход новых видеокарт "уронит" цены существующих, что сделает платы с аппаратной поддержкой DirectX 8 более доступными для всех. И те, кто не пожелает тратиться на дорогие видеокарты на базе NVIDIA GeForce4, вполне могут успокоиться тем, что при покупке видеокарты на базе NVIDIA GeForce3 Ti500 / Ti200 или ATI RADEON 8500 они, по сути, ничего, кроме производительности, не теряют. А те, кто купит плату на NVIDIA GeForce4, могут быть уверены, что их видеокарта - вне конкуренции.

Выход чипов с аппаратной поддержкой DirectX9 пока откладывается на более поздний срок, и тогда обязательно начнутся новые войны - между NV30 и R300. Может быть, к тому времени случится чудо и появятся новые чипы от PowerVR/STM и S3Graphics, тогда борьба за место под солнцем будет еще более интересной...

Пока же нам остается ждать появления серийных видеокарт на базе NVIDIA GeForce4, а также предстоит выяснить, что собой представляет загадочный NVIDIA GeForce4 MX - недорогое решение для тех, кто не хочет отставать от жизни.