Обзор чипсета NVIDIA nForce. Часть I

Автор: Gavric
Дата: 03.12.2001
Все фото статьи
Активность производителей наборов логики в последнее время просто удивляет. Чипсеты выходят одним за другим и, честно говоря, мы с трудом успеваем доводить до наших читателей все подробности об архитектуре и производительности этих новинок. Действительно, если еще в недалеком прошлом вся конкурентная борьба на рынке чипсетов происходила по большей части только между VIA и Intel, то за последнее время к ним присоединились AMD, SiS и ALi, которые начали выпуск вполне конкурентоспособных продуктов. Однако, похоже, это еще далеко не все. На рынок системных чипсетов теперь пытаются выйти совсем новые игроки. Например, весной этого года о выпуске своего первого чипсета для материнских плат объявила компания NVIDIA, до сих пор производившая исключительно графические чипсеты.
По заявлению представителей NVIDIA, настроенных крайне оптимистично, для компании разрабатывающей 3D ускорители, в состав которых входит подчас несколько десятков миллионов транзисторов, проектирование системной логики – задача крайне простоя. Тем более, что NVIDIA была разработчиком базового набора микросхем для игровой приставки от Microsoft, X-BOX, являющейся почти что полноценным PC. Однако, как оказалось, не все так просто. Несмотря на то, что NVIDIA обещала начало поставок материнских плат и систем на базе набора логики собственного изготовления еще в августе, только сейчас эти платы стали появляться в продаже. Ну а раз так, пришла пора провести всестороннее тестирование этого нового чипсета.
Первый чипсет от NVIDIA, названный nForce и поддерживающий Socket A процессоры от AMD, представляет собой интегрированный набор логики со встроенным графическим ядром GeForce2 MX. Однако и как дискретный набор логики nForce представляет значительный интерес, так как в нем реализовано несколько интересных технологий, в первую очередь относящихся к контроллеру памяти, поддерживающему DDR SDRAM. Поэтому, мы построим рассмотрение nForce следующим образом: сначала поговорим об особенностях nForce, как обычного чипсета, а затем отдельно исследуем его графическое ядро, звуковой контроллер и другие подобные возможности.

Основы


Семейство новых чипсетов от NVIDIA, nForce включает в себя два продукта, отличающихся реализацией шины памяти. Одной из ключевых особенностей nForce является так называемая TwinBank архитектура: nForce в общем случае имеет два независимых контроллера памяти, работающих с DDR SDRAM. Соответственно, в зависимости от числа задействованных контроллеров памяти, nForce позволяет организовать либо 64-битный доступ к памяти, либо двухканальный 128-битный.
Набор логики NVIDIA nForce состоит из двух микросхем, называемых в терминологии производителя «процессорами». Северный мост, Integrated Graphics Processor (IGP), объединяет в себе контроллер памяти, интегрированное графическое ядро GeForce2 MX, поддерживающий процессоры семейства Athlon/Duron интерфейс и AGP 4x интерфейс для подключения внешних видеокарт. Для того, чтобы отличать северные мосты с 64-битной шиной памяти и двухканальной 128-битной шиной, NVIDIA использует для них различную маркировку, IGP-128 и IGP-64 соответственно.
Южный мост, Media and Communication Processor (MCP) содержит аппаратный звуковой контроллер Audio Processor Unit (APU) с аппаратной поддержкой Dolby Digital, встроенный сетевой контроллер, PCI-контроллер, а также поддерживает типичные для современных южных мостов возможности: USB 1.1 порты, ATA-100 интерфейс, AC’97 интерфейс и т.п. Аналогично северным мостам, NVIDIA прелагает также и две версии южного моста: MCP-D с Dolby Digital 5.1 кодером и MCP – без него.
Северный и южный мосты в nForce соединяются последовательной шиной HyperTransport с топологией точка-точка.
Для лучшего понимания сравним возможности nForce с возможностями других современных DDR - наборов логики (возможности встроенной графики в рассмотрение пока не берутся).
* Версия южного моста, поддерживающего ATA-133 поставляется производителям материнских плат опционально.

Итак, глядя на представленную таблицу, можно отметить, что основными инновациями, реализованными в nForce являются:

Контроллер памяти, реализующий технологию TwinBank, позволяющую организацию двухканального 128-битного доступа к памяти. Отдельно следует отметить еще одну уникальную особенность этого контроллера, наличие Dynamic Adaptive Speculative Pre-Processor (DASP).
Использование шины HyperTransport для связи северного и южного моста.
Высокопроизводительное интегрированное графическое ядро GeForce2 MX.
Встроенный Audio Processing Unit (APU), аппаратный звуковой процессор совместимый с DirectX 8.0 и имеющий встроенный Dolby Digital 5.1 кодер.

В зависимости от того, в какой комбинации используются северные и южные мосты nForce, версия чипсета может иметь различные наименования:
Теоретически, как уже говорилось, nForce во многом повторяет набор системной логики, который NVIDIA спроектировала по заказу Microsoft для игровой приставки XBOX. Однако, необходимо понимать, что чипсет, используемый в игровой приставке поддерживает процессоры с архитектурой P3 и, соответственно, имеет отличную от nForce процессорную шину. Intel не предоставил NVIDIA лицензии на использование своих процессорных шин в наборах системной логики, поэтому, NVIDIA свой первый чипсет ориентировала под Socket A процессоры от AMD. Однако, не исключено что данная ситуация может измениться, и компания будет предлагать также и чипсеты под платформу Pentium 4: тут все в конечном итоге зависит от желания Intel.

Подробности: контролер памяти


Одной из главных особенностей nForce, выделяющей его по сравнению с другими наборами логики, является инновационный контроллер DDR памяти, позволяющий организацию двух независимых каналов передачи данных с суммарной шириной шины 128 бит. С учетом того, что набор микросхем nForce поддерживает память типа PC2100/PC1600 DDR SDRAM, пиковая пропускная способность подсистемы памяти у этого чипсета может достигать 4.2 Гбайт в секунду. То есть, среди всех сегодняшних наборов логики, ориентированных на применение в настольных PC, nForce обеспечивает наибольшую пропускную способность памяти, так как все остальные чипсеты имеют 64-битную шину памяти.
Посмотрим на то, как все это работает. nForce реализует так называемую TwinBank архитектуру. Это означает, что контроллер памяти, примененный в этом наборе логики, по сути напоминает Croosbar контроллер видеочипсета GeForce3 и попросту является расщепленным на два независимых контроллера MC0 и MC1.
То есть, для получения высокой пропускной способности подсистемы памяти NVIDIA не стала изобретать для своего набора логики новые типы памяти, а просто добавила в свой чипсет еще один контроллер DDR SDRAM. Следует отметить, что контроллеры MC0 и MC1 являются равноправными и полностью независимыми, поэтому они способны обрабатывать запросы одновременно. В результате, суммарная ширина шины памяти достигла 128 бит, однако в целом подсистема памяти nForce, благодаря наличию двух контроллеров памяти, осталась оптимизирована для работы с 64-битными пакетами данных. Это немаловажный факт, поскольку процессорная шина, используемая в Socket A системах, также имеет ширину 64 бита.
Благодаря равноправности и полной независимости MC0 и MC1, nForce позволяет работу с ассиметричными конфигурациями памяти, устанавливаемой на разные каналы. Например, модули DIMM, работающие с MC0 и MC1 могут иметь разную скорость, разную конфигурацию и разный объем. Более того, можно вообще не задействовать один из каналов, оставив второй контроллер памяти неиспользуемым. Как раз именно благодаря этому, NVIDIA с легкостью предлагает производителям материнских плат два варианта своего северного моста: IGP-128 с двумя контроллерами памяти и IGP-64 с одним незадействованным контроллером.
Преимущество TwinBank архитектуры nForce кажется очевидным. Значительный рост пропускной способности, казалось бы, должен обеспечить значительное превосходство в производительности этого набора логики над конкурентами. Однако, не все тут так просто, как кажется. Пиковая пропускная способность подсистемы памяти nForce составляет 4.2 Гбайт/с и в два раза превосходит пропускную способность процессорной шины 2.1 Гбайт/с. А это значит, что процессор сам по себе оказывается не в состоянии задействовать весь потенциал шины памяти nForce. Как мы видели на примере набора логики VIA Apollo Pro266, подобный перекос в пропускных способностях шин ни к чему хорошему не приводит: производительность по сравнению с системами, где пропускные способности шин памяти и процессора уравновешены, практически не возрастает.
Но инженеры NVIDIA оснастили nForce двумя контроллерами памяти все-таки неспроста. Не следует забывать о том, что nForce – это все же в первую очередь интегрированный чипсет, и высокие требования к пропускной способности памяти в системах на его основе будет предъявлять не только CPU, но и встроенное графическое ядро. Благодаря TwinBank архитектуре, подразумевающей наличие двух независимых 64-битных контроллеров памяти, графическое ядро и процессор могут работать с памятью независимо. А учитывая то, что графическое ядро, основанное на архитектуре GeForce2 MX, обладает сравнительно высоким быстродействием, необходимость производительной шины памяти становится очевидной.
Тем не менее, говорить о том, что 128-битная шина памяти nForce может быть задействована только лишь при использовании интегрированной графики не совсем верно. Теоретически, напрямую к памяти, минуя процессор, могут обращаться и некоторые другие устройства. Например, AGP-видеокарты или контроллеры, встроенные в южный мост чипсета. Для этих устройств, хотя они и не столь требовательны к пропускной способности памяти, архитектура TwinBank также может принести определенные дивиденды. Таким образом, если рассматривать nForce, как обычный неинтегрированный набор логики, наличие двух контроллеров памяти может позволить получить выигрыш в производительности в некоторых приложениях, интенсивно работающих с AGP графикой или использующих потоковые операции ввода-вывода с данными большого объема. В остальных случаях TwinBank архитектура, рассматриваемая отдельно от встроенного графического ядра, ряд ли может оказаться полезной.
Более того, если наличие двух независимых каналов памяти теоретически позволяет увеличить скорость записи данных в память, благодаря использованию техники чередования каналов, то операции чтения из памяти ускорятся далеко не всегда. Наоборот, из-за необходимости при каждом обращении «искать» данные в обоих банках, латентность подсистемы памяти, по сравнению с одноканальными системами, возрастает. О том, какое значение имеет латентность подсистемы памяти, говорилось уже не раз. Нередко более низкая латентность имеет для производительности в реальных приложениях даже большее значение, чем высокая пропускная способность памяти. А это значит, что nForce 220, в котором используется северный мост IGP-64 с одним каналом памяти, теоретически даже может превзойти по быстродействию nForce 420 с IGP-128 и двумя каналами.
Понятно, что подобные принципы распространяются не только на наборы логики от NVIDIA. И, если бы не некоторые дополнительные технологии, о которых пойдет речь ниже, двухканальный nForce вполне мог бы отставать не только от своего одноканального собрата, но и от DDR-чипсетов других производителей. Естественно, NVIDIA, привыкшую быть лидером во всем, такой расклад совершенно не устраивал. Поэтому, перед инженерами компании была поставлена задача найти путь к уменьшению латентности подсистемы памяти при операциях чтения.
И это решение было найдено. В NVIDIA nForce был добавлен дополнительный блок, имеющий название DASP – Dynamic Adaptive Speculative Pre-Processor. Задача DASP состоит в мониторинге обращений процессора к памяти и предсказанию, какие данные могут потребоваться CPU впоследствии. Используя возможности 128-битной шины памяти с двумя независимыми контроллерами, DASP параллельно с работой процессора извлекает эти данные из памяти и размещает их в специальном буфере, находящемся в северном мосту чипсета. В результате, в случае правильного предсказания, процессору при обращении к этим данным не приходится осуществлять доступ к памяти с относительно большой латентностью: необходимые данные уже находятся в чипсете. Поэтому, DASP существенно снижает латентность подсистемы памяти.
Как можно заметить, DASP представляет собой некий аналог технологии Data Prefetch, реализованной в современных процессорах. Однако DASP по сравнению с Data Prefetch имеет важное преимущество – его работа не сопряжена с дополнительной загрузкой процессорной шины. А поскольку шина памяти, которую загружает DASP, у nForce узким местом не является, работа этого блока не вызывает никаких коллизий, связанных с чрезмерной загрузкой каких-либо каналов передачи данных в чипсете.
Важно понимать, что DASP в nForce обрабатывает исключительно обращения процессора, а данные, которые могут требоваться, например, графическому ядру или внешней AGP-видеокарте в буфер не попадают. Этим устройствам, поскольку они гораздо менее критичны к высокой латентности памяти, нежели CPU, приходится работать с памятью напрямую.
Именно DASP, а не TwinBank архитектура является главной технологией, влияющей на производительность nForce. При использовании с nForce внешней графической карты высокая пропускная способность шины памяти оказывается практически бесполезной, потому что процессор задействовать ее в полную силу не может из-за ограничений, накладываемых пропускной способностью процессорной шины. Современные же AGP-видеокарты используют для хранения текстур локальную видеопамять, поэтому с системной памятью они взаимодействуют не активно. DASP же позволяет уменьшить латентность подсистемы памяти независимо ни от чего. И единственное, о чем приходится жалеть – это о небольшом размере буфера, используемого DASP. В современной версии nForce его объем составляет всего 64 Кбайта, но и этого оказывается вполне достаточно для того, чтобы nForce показывал великолепную производительность.

Подробности: Hypertransport


На настоящий момент практически все производители наборов логики отказались от использования шины PCI для организации связи между северным и южным мостом. Исключение составляет разве что компания ALi, но и в ее ближайших планах – отказ от применения для этой цели PCI. Что же побуждает производителей чипсетов искать альтернативные решения? Ответ, как всегда, несложен. Пропускной способности шины PCI, 133 Мбайт в секунду, перестает хватать для того, чтобы все контроллеры, сосредоточенные в южном мосту могли беспрепятственно связываться с северным мостом. Посмотрим, например, чем нашпиговала свой южный мост (или, в терминологии компании, MCP) NVIDIA.
Помимо традиционных для южных мостов PCI моста, двухканального ATA-100 контроллера, пары USB-хабов, интегрированного программного модема, 6-канального AC’97 кодека и LPC-устройств, MCP содержит и пару относительно уникальных вещей. Во-первых, это сетевой контроллер для 10/100 Mбит Ethernet и HomePNA 2.0, а во-вторых, APU (Audio Processor Unit). Именно наличие этих двух блоков в южном мосту заставило NVIDIA искать для соединения мостов своего nForce решение, гарантирующее более высокую, чем у PCI, пропускную способность.
Имея в виду, что APU – это полноценный совместимый с DirectX 8.0 аппаратный звуковой контроллер, поддерживающий позиционное 3D аудио и имеющий Dolby Digital 5.1 кодер, можно считать, что это устройство способно «отъесть» от пропускной способности шины до 150 Мбайт в секунду. В свете этого NVIDIA сразу обратила внимание на высокоскоростные шины. Ну и поскольку NVIDIA принимала активное участие в разработке технологии Hypertransport, совершенно неудивительно, что в nForce для связи мостов была выбрана именно эта шина.
Вообще, Hypertransport – это двухпортовая последовательная шина с шириной от 2 до 32 бит, предназначенная для организации соединения типа точка-точка. В nForce для связи мостов используется Hypertransport с шириной 8 бит и частотой 200 МГц. Учитывая, что протокол Hypertransport предполагает передачу данных по обоим фронтам сигнала, получаем, что пропускная способность шины при передаче данных в одном направлении – 400 Мбайт в секунду. NVIDIA же оперирует более крупным числом, 800 Мбайт/с, однако это всего-навсего означает, что пропускная способность соединения между мостами в nForce 400 Мбайт/с в обоих направлениях.

Подробности: референс-плата


Также, как и при создании видеочипсетов, вместе с набором логики nForce, NVIDIA разработала и референс-дизайн материнской платы на его основе. Отметим, что этот референс-дизайн будет использоваться рядом производителей плат для выпуска своих продуктов, использующих nForce, и поэтому референс-плата от NVIDIA заслуживает подробного рассмотрения.
Референс-дизайн материнской платы на базе чипсета nForce выполнен в MicroATX форм-факторе. И это сразу говорит о многом. NVIDIA видит основное применение своего nForce в первую очередь как удобного решения для сборщиков компьютеров, потому и выбрала именно MicroATX формат. Впрочем, отчасти компания права. Собирать компьютеры на платах с чипсетом nForce действительно удобно: одна материнская плата сразу исключает необходимость и в видеокарте с неплохой производительностью, и в качественной звуковой карте, и даже в сетевом контроллере и модеме. Поэтому, несмотря на относительно высокую стоимость, сборщики PC должны будут полюбить nForce, как хорошую платформу для домашних компьютеров средней стоимости.
Однако, использование Micro ATX форм-фактора неотвратимо влечет за собой урезание возможностей для расширения. Действительно, на референс-плате помимо слотов для памяти и AGP 4x слота поместилось всего два слота PCI и один слот ACR. Впрочем, для материнской платы, на которой интегрированы все мыслимые устройства, такого количества слотов расширения может быть вполне достаточно.
Референс плата использует северный мост IGP-128.
Как следует из названия, эта версия северного моста поддерживает 128-битную шину памяти и TwinBank архитектуру. Три имеющихся на плате 184-контактных слота DDR DIMM делятся между контроллерами следующим образом: к первому контроллеру памяти MC0 относится первый слот DIMM, а ко второму контроллеру памяти MC1 – второй и третий слоты. Легким намеком на это является, кстати, несколько обособленное расположение на плате первого слота DIMM. Таким образом, при установке модулей памяти в первый и во второй или третий слоты DIMM, плата будет использовать 128-битный доступ к памяти. Если же используется только один модуль DDR DIMM, или же два модуля, установленные во второй и третий слоты – шина памяти имеет ширину 64 бита, как у классических наборов логики, и второй контроллер памяти северного моста отключается.
Заметим, что на северном мосту на референс-плате нет никакого радиатора, и, в принципе, несмотря на это плата работает стабильно. Однако, чип при этом раскаляется до такой температуры, что его дальнейшая судьба невольно начинает вызывать беспокойство. Поэтому, на серийных платах северный мост будет снабжаться чипсетным кулером.
В качестве южного моста для референс платы NVIDIA выбрала чип MCP-D, обладающий встроенным Dolby Digital 5.1 кодером, о чем свидетельствует литера «D» в названии моста.
Несмотря на то, что южный мост поддерживает шестиканальный 3D звук, цифровой выход для усилителя с Dolby Digital декодером, 10/100 Мбит Ethernet и программный модем, на самой референс-плате нет никаких разъемов для реализации работы всех этих устройств. Все необходимые коннекторы располагаются на дополнительной райзер-карте, входящей в комплект и устанавливаемой в слот ACR.
Здесь можно видеть место для монтажа цифрового аудиовыхода, два аналоговых аудиовыхода для подключения задних колонок, центральной колонки и сабвуфера, разъем для присоединения телефонной линии и сетевой RJ45 коннектор.
Плата использует Phoenix BIOS, обладающий только лишь самым необходимым минимумом настроек: о разгоне можно забыть.

Как мы тестировали


Поскольку данный материал посвящен рассмотрению NVIDIA nForce в качестве дискретного решения, все тесты выполнялись со внешней видеокартой и отключенным интегрированным графическим ядром. Мы протестировали референс-плату на базе nForce в двух режимах: при 128-битном доступе к памяти, когда задействованы оба контроллера памяти, и при 64-битном доступа к памяти, когда один из контроллеров памяти отключен. Таким образом, мы получим возможность судить о производительности как nForce 420, так и nForce 220, поскольку эти два варианта набора логики от NVIDIA отличаются лишь шириной шины памяти.
Производительность NVIDIA nForce сравнивалась с быстродействием других современных DDR Socket A наборов логики: VIA KT266A, SiS 735 и Ali MAGiK 1 ревизии C.
Тестовые системы были сконфигурированы следующим образом:
На тестовых системах была установлена операционная система Microsoft Windows XP.
Результаты тестов встроенного в nForce графического ядра, звукового и IDE контроллеров будут приведены во второй части данного обзора.

Производительность


Теория - теорией, пора переходить к практике. В первую очередь, как и всегда, - синтетические тесты производительности подсистемы памяти.
В первую очередь отметим, что даже синтетический тест, такой как SiSoft Sandra, не показывает значительного превосходства пропускной способности двухканальной памяти nForce 420 над другими чипсетами, работающими с 64-битной шиной памяти. Как мы видим, процессор в одиночку не может задействовать всю пропускную способность шины памяти nForce 420. Таким образом, все прелести TwinBank архитектуры могут быть раскрыты только при использовании встроенного графического ядра nForce, которое, наряду с процессором, является одним из самых активно использующих память компонентов. Когда же встроенное графическое ядро не используется, как, например, в нашем случае, даже синтетический тест показывает всего лишь 5-процентное превосходство практической пропускной способности чипсета с 128-битной шиной над аналогичным чипсетом с шиной шириной 64 бита.
Также, немаловажно отметить, что оба nForce, и 420, и 220, ощутимо обгоняют остальных участников тестирования. И дело тут уже не в ширине шины памяти. Разрыв в 10% между показателями nForce 220 и VIA KT266A можно списать лишь на DASP, поскольку эта модификация чипсета от NVIDIA не имеет 128-битной шины памяти. Как показывают результаты, эффективность DASP чрезвычайно высока: применение этой технологии позволило NVIDIA создать Socket A чипсет с самой быстродействующей подсистемой памяти.
Однако, лидерство в пропускной способности подсистемы памяти, измеряемой тестом SiSoft Sandra 2001 – еще не ключ к победе. Как мы неоднократно отмечали, наряду с пропускной способностью на производительность системы оказывает значительное влияние и латентность памяти. Посмотрим, как обстоит дело у nForce с ней.
И тут nForce просто нет равных. Направленный в первую очередь на уменьшение латентности DASP попадает точно в цель.
Также заметим, что как это не кажется странным на первый взгляд, набор логики nForce 220 с одним контроллером памяти и 64-битной шиной имеет меньшую латентность, чем nForce 420 с двумя контроллерами памяти и 128-битной шиной. Однако, ничего удивительного в этом нет. Поскольку NVIDIA ставила перед собой задачу создать такую подсистему памяти, которая была бы способна обеспечивать данными несколько «потребителей» одновременно (например, CPU и GPU), компания не стала применять в своем наборе логики классическую технику чередования каналов (interleaving). Контроллеры памяти в nForce 420 полностью независимы и, в отличие например от того же i850, позволяют установку модулей DIMM разной конфигурации в разные банки памяти. Поэтому, перед тем, как извлечь данные из памяти в случае использования двух каналов, специальному арбитру приходится решать, какой из контроллеров должен обрабатывать пришедший запрос. На это как раз и уходят дополнительные такты. Поэтому, в ряде случаев nForce 220 с более узкой шиной памяти может оказаться быстрее nForce 420 с более широкой шиной.
В синтетических тестах nForce смотрится неплохо. Посмотрим, как же он себя поведет в реальных приложениях.
Тест SYSmark 2001, показывающий средневзвешенную производительность систем в типичных офисных задачах и приложениях создания контента, подтверждает результаты синтетических тестов. nForce, хоть и не так значительно, превосходит по скорости другие чипсеты. Однако следует понимать, что для тех приложений, которые используются в SYSmark 2001, важна не только скорость памяти, также немалое влияние на результат оказывает, например, и производительность дисковой подсистемы. Плюс к этому, преимущества более быстрой системы памяти видны только при операциях с большими объемами данных, не умещающихся в кеше CPU.
Например, в Internet Content Creation части теста, где приложения используют большие объемы последовательно хранящихся данных, nForce не так уж и быстр, поскольку влияние латентности в задачах такого класса сведено к минимуму, а реализоваться высокой пропускной шине памяти nForce 420 не дает ограничение, налагаемое пропускной способностью процессорной шины.
В офисной же части того же теста наоборот, оба nForce опережают обоих соперников более существенно: тут уже играет свою роль низкая латентность подсистемы памяти этого чипсета. В частности, превосходство nForce 420 над прошлым лидером наших тестирований, VIA KT266A, составляет 4%.
Для составления полной картины соотношения сил в офисных задачах мы также измерили скорость архивации большого количества информации (директории с установленной игрой Unreal Tournament) популярным архиватором WinZIP при обычном уровне компрессии. Смысл этого теста заключается в том, что помимо постоянных обращений к памяти архиватор также постоянно работает с дисковой подсистемой. Поэтому, результаты, показанные системами здесь, позволяют оценить в том числе и качество IDE Bus Master драйверов. На диаграмме выше отображено время выполнения архивации, поэтому меньший результат соответствует лучшей производительности.
Также, нами была замерена производительность при кодировании DVD видеопотока в формат DivX MPEG-4. Этот тест замечателен тем, что модификация nForce 220 с 64-битной шиной памяти в нем оказалась быстрее своего 128-битного аналога nForce 420. Хотя эта разница очень мала, факт остается фактом: такое возможно не только в теории, но и на практике.
Следующим этапом наших испытаний является измерение быстродействия систем в играх.
Обратите внимание, результаты nForce 420 и nForce 220 в этом тесте практически одинаковы. То есть даже Quake3, производительность в котором сильно зависит от быстродействия подсистемы памяти, не может использовать преимущества, предоставляемые архитектурой TwinBank, при условии, что в системе используется внешняя видеокарта. DASP же, присутствующий в обоих nForce, придает им неплохое ускорение: оба nForce опережают ближайшего конкурента, VIA KT266A на 4.5%.
При увеличении разрешения и доведения его до обычно используемого среднестатистическими игроками, разница в производительности нивелируется. Два контроллера памяти не помогают nForce 420 и в этом случае.
Картина в Unreal Tournament повторяет результаты, которые мы уже видели в Quake3. Правда, теперь преимущество nForce220 над nForce 420 немного увеличилось и уже не может быть списано на тривиальную погрешность измерений.
Мы любим использовать игру DroneZ при тестировании чипсетов в первую очередь потому, что она очень чутко реагирует на скорость работы памяти. Поэтому, неудивительно, что DASP дает обоим nForce возможность обогнать VIA KT266A на целых 7%, что для наборов системной логики является достаточно крупной победой. Также, отметим, что в очередной раз nForce 220 удалось обойти своего старшего брата, nForce 420 примерно на 2 fps.
Увеличение разрешения в DroneZ приводит к тому, что модели nForce начинают демонстрировать скорость сообразно пропускной способности их шины памяти. Правда, при этом семейство nForce теряет традиционное первенство и уступает первые места. Видимо, AGP GART драйвер для nForce еще окончательно не оптимизирован.
Ничего неожиданного на этой диаграмме нет. Лишь снова хочется подчеркнуть, что оба nForce показывают одинаковые результаты.
Посмотрим теперь, чего же следует ожидать от nForce в научных и профессиональных приложениях.
Результаты в этом научном тесте, несмотря на то, что он не задействует возможностей 3D-графики, очень похожи на соотношение сил в играх.
Профессиональный OpenGL бенчмарк SPECviewperf 6.2.1 является тестом, производительность в котором сильно зависит от пропускной способности памяти. Поэтому, никого не должно удивлять, что во всех задачах, входящих в этот тест, nForce 420 обгоняет nForce 220. Однако, следует отметить, что при этом результаты nForce 420 оказываются не такими уж и выдающимися, несмотря на вдвое более широкую, чем у других наборов логики, шину памяти. В Awadvs-04 и DRV-07 nForce 420 отстает от VIA KT266A. Что же касается младшей версии, nForce 220, то ее производительность в первых трех подтестах вообще чуть ли не самая худшая. Думается, причина такого результата кроется в том, что 64-килобайтный буфер, используемый DASP, оказывается совершенно бесполезен при передаче большого объема информации, хранящейся в памяти последовательно.

Выводы


Подобьем бабки. Как показало наше исследование, nForce, пока рассматриваемый отдельно от своего графического ядра как дискретный набор логики, чрезвычайно продвинутый и самый производительный Socket A чипсет среди присутствующих сегодня на рынке. Хотя он и оказался лидером благодаря прогрессивным технологиям, примененным NVIDIA, следует отметить следующее. Главным элементом nForce, из-за которого этот чипсет показал высокое быстродействие, является DASP. Единственное «но», которое можно сказать в адрес этого блока – недостаточный размер буфера, которого не хватает для профессиональных OpenGL приложений. Twinbank архитектура же, как показали тесты, оказалась совершенно бесполезна в случаях, когда не используется встроенное графическое ядро.
Таким образом, для применения в системах со внешними графическими ускорителями версия nForce 220 подходит больше, чем nForce 420. Производительность nForce 220 в большинстве тестов практически такая же, как у nForce 420, а в ряде задач nForce 220 даже обгоняет своего старшего собрата. При этом, стоимость плат, основанных на nForce 220 должна быть ниже из-за отсутствия второго контроллера памяти и сопутствующей разводки. nForce 420 же стоит воспринимать в таком случае как, в первую очередь, интегрированное решение.
Что касается рыночных перспектив nForce вообще, то тут остается масса неясностей. Если вы готовы ради дополнительных 3-7% производительности выложить в полтора раза большую сумму за материнскую плату, а потом не пользоваться «оплаченной» встроенной видеокартой, то nForce – набор логики для вас. Если же вы ищите подходящее решение с точки зрения соотношения цена-производительность, то nForce тут вам не товарищ.
И в заключение еще раз напомню, что все вышесказанное относится к nForce, как дискретному набору логики. Интегрированные возможности этого чипсета, такие как видео, звук и пр. мы рассмотрим позднее, в следующей части этого материала.