Введение
Чип NVIDIA GeForce3 на данный момент является самым производительным игровым 3D-чипом, и его производительности, по идее, должно хватить на то, чтобы в любых существующих и выходящих в ближайшее время играх скорость не падала ниже показателя играбельности.
Однако, человек всегда хочет большего, и 3D-игры – не исключение. Всегда приятнее играть в большем разрешении или при включенном антиалиасинге, анизотропной фильтрации, и т.д. При задействовании всех этих функций или для получения сумасшедшего количества кадров в секунду в высоких разрешениях производительности даже GeForce3 может оказаться недостаточно.
В этом случае может помочь разгон видеокарты. Но, обладая успешным опытом модификации и экстремального разгона плат на базе NVIDIA GeForce2 GTS, GeForce2 MX и PowerVR/STM Kyro2, я не ограничился "простым" разгоном, а решил подвергнуть модификации и платы на базе чипа NVIDIA GeForce3 - ASUS V8200 и VisionTek GeForce3, полностью использовав их “разгонный” потенциал.
Экстремальный разгон
Начнем с платы VisionTek GeForce3, выполненной по референс-дизайну NVIDIA:
На плате установлены стабилизаторы SC1175CSW производства
SEMTECH, которые представляют собой сдвоенные широтно-импульсные контроллеры, главным образом предназначенные для применения в стабилизаторах питания памяти на видеокартах и периферийных устройствах. Два независимых управляемых контроллера этих микросхем могут работать в двух режимах: независимо друг от друга и в режиме «разделения тока» (current sharing).
Для получения стабилизированного напряжения питания ядра GeForce3 используется режим «разделения тока», в этом режиме выходное напряжение первого контроллера задается соотношением сопротивлений в делителе (R1,R12 на типовой схеме включения), второй контроллер использует выходное напряжение первого как эталон, а его выход соединен с выходом первого, то есть два встроенных стабилизатора работают параллельно, отсюда и название – режим «разделения тока».
Типовая схема включения стабилизатора в этом режиме:
На VisionTek GeForce3 сопротивления резисторов R12 и R1 (R832 и R810 на плате, на фото ниже показаны стрелками) составляют 130 и 770 Ом соответственно, при этом выходное напряжение, вычисляемое по формуле Vout = 1.25x(1 + R12/R1), составляет 1.45В. Когда я зашунтировал R1 резистором на 510 Ом, подпаяв его прямо к ножкам 18 и 20 микросхемы SC1175CSW, результирующее сопротивление R1’ составило 303 Ом, а выходное напряжение стало равным 1.78В:
Благодаря тому, что для питания видеопамяти на плате установлена еще одна микросхема SC1175CSW, у меня появилась возможность приподнять и напряжение питания видеопамяти.
Каналы микросхемы в этом случае работают независимо, и выходное напряжение каждого задается делителем индивидуально. Типовая схема включения микросхемы в режиме с двумя независимыми каналами:
Микросхемы DDR SDRAM, используемые совместно с GeForce3, согласно спецификации, питаются двумя напряжениями: 3.3В для всех внутренних цепей и 2.5В - для буферов ввода-вывода. Один канал микросхемы SC1175CSW как раз и обеспечивает питание внутренних цепей микросхем видеопамяти, а второй – буферов ввода- вывода. Выходные напряжения каналов задаются соотношением резисторов R15,R14 для канала, обеспечивающего 3.3В, и R13,R11 – для 2.5В.
Резисторы, установленные на плате (R822, R824 – для 3.3В; R825, R829 – для 2.5В), имея сопротивление 170, 100, 110 и 100 Ом соответственно, обеспечивают выходные напряжения 3.37В и 2.63В соответственно, то есть напряжения питания видеопамяти являются уже немного повышенными относительно номинальных. Для того, чтобы еще слегка их приподнять, я зашунтировал R14 и R11, использовав резисторы сопротивлением 820Ом, подпаяв к ножкам 3, 18 и 20, как показано на фото:
В результате «новые» сопротивления R14 и R11 составили по 89Ом, а выходные напряжения каналов микросхемы, рассчитываемые по той же формуле – 3.64В и 2.8В.
Повышение напряжения на ядре и видеопамяти серьезно увеличивает нагрузку на чипы и повышает их тепловыделение, поэтому пришлось позаботиться об эффективном отводе тепла. На микросхемы памяти я установил специально для этого предназначенные радиаторы, которые предлагает фирма Thermaltake, а на ядро установил радиатор от стандартного процессорного кулера ND3, установив на него пропеллер от ThermalTake Volcano, обладающий большей эффективностью обдува:
Однако, такого охлаждения показалось недостаточно, и я попробовал установить элемент Пельтье. Благодаря высокой эффективности такой системы охлаждения чип GeForce3 устойчиво работал на частотах 280-290 МГц. Но после того, как капля конденсата стекла с элемента в слот AGP, и лишь благодаря огромному везению ни плата, ни видеокарта не вышли из строя, от применения элемента Пельтье пришлось отказаться. Без него уже при частоте в 270МГц чип перегревался и система зависала. Вообще, повехность чипов GeForce3 вогнута, обеспечить нормальный отвод тепла от вогнутого металлического “пятачка” трудно, поэтому я просто решил отполировать поверхность чипа:
Добившись того, что поверхность чипа GeForce3 стала плоской и отполировав подошву радиатора, я, наконец, добился устойчивой работы платы на высоких частотах.
В результате такой модификации плата VisionTek GeForce3 устойчиво работала на чаcтотах 270МГц у ядра и 600(300DDR)МГц видеопамяти. Напомню, что все платы на базе NVIDIA GeForce3 комплектуются 3.8нс микросхемами DDR SDRAM, и такая частота работы видеопамяти является просто прекрасным результатом.
Плата ASUS V8200 выполнена на PCB с дизайном, отличающимся от эталонного, однако стабилизаторы питания ядра и видеопамяти на этой применены точно такие же, разница лишь в расположении элементов:
Резисторы, задающие напряжение на ядре (R134 и R138 на плате), находятся на обратной стороне платы, их сопротивления составляют 140 и 780Ом. Напряжение питания чипа NVIDIA GeForce3 на этой плате составляет 1.48В. После установки дополнительного резистора сопротивлением 820 Ом параллельно R1 (R138 на плате), я получил “новое” значение R1, равное 400Ом:
Напряжение на выходе стабилизатора составило 1.68В. При таком напряжении нагрев ядра, благодаря применению хорошей системы охлаждения на ASUS V8200, увеличился не столь значительно, как на плате от VisionTek, поэтому я не стал применять дополнительные методы охлаждения ядра.
Напряжение питания видеопамяти я повысил таким же образом, как и на VisionTek GeForce3, ипользовав 2 резистора сопротивлением 820Ом:
После такой модификации плата от ASUS заработала на частоте 260МГц у ядра и 580(290)МГц у видеопамяти.
Тестовая система
Для тестирования плат был использован стенд в следующей конфигурации:
Процессор – AMD Athlon 1200МГц (133МГц FSB)
Память – 256Мб NCP PC133
Материнская плата – ABIT KT7A (VIA KT133A)
Жесткий диск – Fujitsu MPE3084AE 8,4 Гб
Программное обеспечение:
Windows 98 SE build 4.10.2222 A
DirectX8.1a
Quake 3 Arena v1.27g
Платы тестировались на драйвере Detonator 12.41.
Для установки тактовых частот ядра и видеопамяти использовалась утилита RivaTuner.
Условия и методика тестирования
Сначала стоит рассказать об условиях, в которых работали видеокарты. Стенд был собран не в корпусе, поэтому не было проблем с отводом теплого воздуха, свойственных для закрытого корпуса. Напротив видеокарты, в 5-10 сантиметрах от нее, стоял стандартный 80-мм вентилятор, обеспечивавший обдув радиаторов видеопамяти. Температура в помещении колебалась в пределах 20-23 градусов.
В предыдущем обзоре платы на базе чипа NVIDIA GeForce3, видеокарты от VisionTek, я уже рассмотрел производительность в разных играх при разгоне, поэтому здесь будет рассматриваться только производительность в Quake3 Arena.
Тестирование производилось на плате VisionTek GeForce3, устойчиво работавшей на более высоких частотах, чем ASUS V8200. Для повышения точности измерений все тесты производились по 5 раз, и из результатов выбирался максимальный.
Тестирование в Quake3 Arena
В Quake3 Arena видеокарта VisionTek GeForce3 была протестирована при следующих настройках: для режимов с глубиной цвета экрана 16 бит были выбраны 16-битные тектуры, для 32-битных режимов – 32-битные текстуры. Ползунки качества текстур и деталей геометрии – в положении максимального качества. Трилинейная фильтрация текстур включена, компрессия – выключена.
Тестирование в различных разрешениях я произвел на номинальных частотах, при максимальном разгоне видеопамяти и ядре на номинальной частоте, при максимальном разгоне ядра и видеопамяти на номинальной частоте, и при совместном максимальном разгоне видеопамяти и ядра:
Для того, чтобы нагляднее показать прирост производительности при экстремальном разгоне, приведу графики, где показан прирост производительности в процентах относительно результатов на номинальных частотах:
По графикам видно, что в разрешениях 800х600 и 1024х768 производительность ограничивается скоростью процессора и системы с целом, и прирост при экстремальном разгоне не превышает 10%, однако в более высоких разрешениях производительность увеличивается более чем на 30%.
В 16-битных режимах разгон ядра обеспечивает гораздо больший прирост производительности, чем разгон видеопамяти.
В 32-битных режимах выигрыш при разгоне видеопамяти и ядра примерно одинаковый, но по мере увеличения разрешения разгон видеопамяти оказывается все более эффективным, в то время, как при разгоне ядра прирост стабилизируется на уровне 10%.
Что интересно, при повышении частоты ядра на 35% и частоты видеопамяти на 30.43% производительность в самом высоком разрешении увеличилась и в 16-битных, и в 32-битных режимах на 32%, что говорит о том, что разгон GeForce3 оказался очень эффективен, и производительность при разгоне растет прямо пропорционально тактовым частотам.
Для оценки «полезности» разгона ядра и видеопамяти, то есть, по сути, сбалансированности архитектуры, я измерил производительность в разрешении 1600х1200, где почти вся нагрузка ложится на видеокарту, и влияние остальных компонентов можно не учитывать. Измерения производились при номинальных частотах ядра и видеопамяти, при максимальных частотах, и на двух промежуточных частотах с равномерным шагом. В итоге получилось по 4 различных значения частот ядра и видеопамяти. Для того, чтобы графики были удобны для восприятия и корректны по смыслу, по горизонтали я отложил прирост частот ядра и видеопамяти в процентах относительно номинальных частот, а по вертикали – прирост производительности в процентах относительно производительности при номинальных частотах:
В 16-битных режимах разгон ядра, как и предполагалось, гораздо более результативен, изменение частоты видеопамяти с 460 до 600МГц слабо сказывается при номинальной частоте ядра, но дает больший прирост при увеличении частоты ядра.
В 32-битных более эффективным оказывается разгон видеопамяти, однако и разгон ядра обеспечивает приличный прирост производительности, особенно при фиксировании частоты видеопамяти не на номинальной, а на повышенной частоте.
В итоге, из-за возможности наряду с разгоном ядра столь сильно повысить частоту видеопамяти, производительность в 32-битных режимах тоже сильно повышается, чего не наблюдалось при экстремальном разгоне GeForce2 GTS и GeForce2 MX, у которых можно увеличить напряжение только на ядре.
Кстати, интересно оценить падение производительности при переходе от 16-битного к 32-битному цвету при экстремальном разгоне:
При частоте ядра в 200МГц и частоте видеопамяти в 600МГц производительность в 32-битных режимах оказывается даже выше, чем в 16-битных. Естественно, никто не будет использовать видеокарту на базе чипа NVIDIA GeForce3 на таких частотах, однако это первый на моей памяти случай, когда в более «тяжелых» 32-битных режимах видеокарта оказывается быстрее.
В разрешении 1600х1200 падение производительности при переходе от 16-битного цвета к 32-битному на разных частотах ядра и видеопамяти выглядит так:
При фиксировании частоты ядра повышение частоты видеопамяти приводит к линейному снижению потери производительности и при частотах 200/600МГц падение оказывается отрицательным, то есть на этих частотах в режиме 1600х1200х32 видеокарта оказывается быстрее, чем в режиме 1600х1200х16.
Такое поведение объясняется, вероятно, тем, что на таких частотах нехватка пропускной способности видеопамяти сказывается очень слабо и практически в равной мере и в 16-битных режимах, и в 32-битных, а разница в производительности обусловлена оптимизацией кэша, контроллера памяти и архитектуры GeForce3 в целом под 32-битный цвет и соответствующие размеры блоков данных.
Заключение
Можно представить себе производительность чипа GeForce3 Ultra, если этот чип будет производиться. Если он будет отличаться от GeForce3 только тактовыми частотами ядра и видеопамяти, то при частотах 250/600МГц он должен быть примерно на 25-30% быстрее, чем NVIDIA GeForce3.
А для тех, кому уже сейчас производительности GeForce3 мало, и хочется еще больше, а замечание не пугает, есть выход – экстремальный разгон. Благодаря возможности поднять напряжения не только ядра, но и видеопамяти, можно пропорционально повысить рабочие частоты до фантастических значений – 270/600МГц, и получить видеокарту с прекрасной производительностью в самых тяжелых режимах.
Замечание
Данный материал является своего рода экспериментом и ни в каком виде не является призывом к экстремальному разгону или перепайке видеокарт.
Подобная модификация платы сокращает срок ее службы.
При любой модификации платы пользователь автоматически лишается гарантии.
В случае выхода из строя видеокарты или других комплектующих в результате её модификации вся ответственность лежит на пользователе.