Модификация и экстремальный разгон ATI RADEON 9700 PRO.

Автор: Tim
Дата: 09.12.2002
Все фото статьи

Введение или "Догоним и перегоним GeForce FX"


На данный момент видеокарты на базе ATI RADEON 9700 PRO остаются самыми быстрыми и современными игровыми 3D-платами. Однако, конкурент от NVIDIA, GeForce FX, уже объявлен, и появление видеокарт на его основе - не за горами. Если не касаться цен на новые видеокарты и соотношения "цена-качество" новых плат, а остановиться на производительности, то, судя по различным косвенным данным из разрозненных источников, в целом NVIDIA GeForce FX (NV30) может оказаться примерно на 30% производительнее, чем нынешний лидер, ATI RADEON 9700 PRO (R300).
ATI уже готовит ответ в виде R350 - "разогнанного" и усовершенствованного R300, но его появления стоит ожидать не ранее весны 2003 года. До этой поры, судя по всему, ситуация изменится не в пользу ATI - на первое место по производительности выйдет новый чип от NVIDIA.
Тем, кто уже успел купить ATI RADEON 9700 PRO, не стоит волноваться - запаса функциональности и производительности этих видеокарт хватит надолго. Особенно если попытаться поднять производительность путем разгона.

Цель нашего нынешнего эксперимента - путем экстремального разгона добиться от ATI RADEON 9700 PRO максимального увеличения производительности, в идеале не менее 30%, чтобы уже здесь и сейчас, хотя бы в единичном экземпляре, существовала видеокарта, способная "догнать и перегнать" NVIDIA GeForce FX.
Дополнительная цель эксперимента, раз уж нам удастся в широких пределах изменять частоту графического ядра и видеопамяти - оценить "сбалансированность" ATI RADEON 9700 PRO косвенным путем, через оценку прироста производительности при разгоне ядра и видеопамяти в различных условиях.

Честь принести себя в жертву во имя скорости выпала видеокарте FIC 1stGraphics AT010 на базе ATI RADEON 9700 PRO, уже, кстати, побывавшей в нашей тестовой лаборатории:

Итак, приступим!..

Установка системы охлаждения


Первым делом при разгоне видеокарты стоит позаботиться об эффективном охлаждении её компонентов.

Видеопамять на плате я решил охлаждать пассивным способом - радиаторами. Для каждой из 8 микросхем памяти на ATI RADEON 9700 PRO мне пришлось использовать отдельный радиатор, так как между чипами памяти на плате оказались распаяны достаточно высокие конденсаторы, не позволяющие установить такие радиаторы, которые накрывали бы по два чипа сразу. Для изготовления маленьких радиаторов пришлось распилить радиаторы, входящие в комплект Thermaltake Memory Cooling Kit, на три части каждый.
Радиаторы были закреплены на чипах памяти с помощью кусочков липкой термопрокладки, входящей в тот же комплект Thermaltake Memory Cooling Kit.
На этом все хлопоты, связанные с обеспечением нормального отвода тепла от чипов памяти, были закончены.

Для охлаждения графического ядра при экстремальном разгоне стандартный кулер, устанавливаемый на платы ATI RADEON 9700 PRO, никак не подходит - нужно искать что-то более эффективное.
Чип ATI RADEON 9700 PRO выполнен в таком виде, что тепло отводится прямо с поверхности кристалла. Для предохранения кристалла от сколов прямо на подложку чипа установлена специальная металлическая рамка, исключающая перекосы при установке кулера. Наличие этой рамки иногда может привести к проблеме. Проблема состоит в том, что на некоторых экземплярах плат верхняя поверхность рамки на какую-то долю миллиметра выступает над плоскостью кристалла, не позволяя добиться плотного контакта между радиатором и поверхностью чипа.
К счастью, эта рамка, будучи не припаянной, как я ошибочно написал в обзоре ATI RADEON 9700 PRO, а приклеенной к подложке, на удивление легко снимается - достаточно лишь осторожно(!) подковырнуть её чем-нибудь тонким, например, лезвием ножа для резки бумаги.
Итак, снимаем рамку:

Теперь ничто не мешает установке нормальной системы охлаждения графического ядра.
Взвесив все "за" и "против", я решил использовать систему водяного охлаждения Poseidon WCL-02 от 3R System. Эта система устраивала меня и по габаритам, и по мощности, но не включала в себя ватерблок для графических чипов и чипсетов. Пришлось включать в систему ватерблок отечественного производства, предоставленный его разработчиком, энтузиастом отечественных систем водяного охлаждения, Вячеславом Заикиным. Этот ватерблок для графических чипов и чипсетов, выполненный, кстати, целиком из чистой меди, прекрасно подошел к Poseidon WCL-02. Для закрепления ватерблока я использовал прижимную скобу и два длинных болта, пропущенных через отверстия в плате. В качестве термоинтерфейса - термопасту КПТ-8.
В собранном и готовом к испытаниям виде плата стала выглядеть так:


Повышение напряжения питания графического ядра и видеопамяти



Повышение напряжения питания графического ядра:

Питание чипа ATI RADEON 9700 PRO на плате обеспечивает импульсный стабилизатор с управляющей микросхемой SC1175CSW от Semtech:

Эта микросхема имеет два независимых канала управления, но в данном случае они включены параллельно. Типовая схема включения микросхемы в таком режиме изображена на рисунке:



Выходное напряжение стабилизатора задается сопротивлением резисторов R1 и R12 по формуле Vout = 1.25x(1 + R12/R1) (нумерация резисторов по типовой схеме включения). На типовой схеме включения синим цветом помечено, как с помощью шунтирующего резистора R1' можно увеличить напряжение питания графического ядра.
Номинальное напряжение питания графического ядра на плате составляло 1,5В. После припаивания шунтирующего резистора сопротивлением 2,7 кОм к выводам 18 и 20 микросхемы, так, как показано на рисунке...:

...напряжение питания графического чипа составило 1,75В. Увеличение напряжения по сравнению с исходной величиной составило 16,7% - не так уж и много, особенно если учесть, что теперь тепло от ядра отводится с помощью водяной системы охлаждения с медным ватерблоком.

Повышение напряжения питания видеопамяти:

Рядом со стабилизатором напряжения питания графического ядра, под алюминиевой пластинкой, предназначенной для отвода тепла, находится стабилизатор напряжения питания микросхем видеопамяти. Для того, чтобы иметь доступ к компонентам этого стабилизатора, мне пришлось очень аккуратно снять эту пластинку. Именно очень аккуратно - пластинка накрепко приклеена к корпусам микросхем теплопроводящим клеем, и если не рассчитать усилие, то можно легко загубить видеокарту, оторвав микросхемки от платы.
После снятия пластинки обнаружиласть микроcхема IRU3037A от International Rectifier, обеспечивающая стабилизацию напряжения питания цепей ввода-вывода микросхем видеопамяти (VDDQ). Как и у первого стабилизатора, здесь выходное напряжение задается соотношением сопротивлений резисторов в цепи обратной связи, и для повышения напряжения питания достаточно лишь изменить это соотношение, припаяв дополнительный шунтирующий резистор.
До переделки напряжение питания цепей ввода-вывода (VDDQ) микросхем видеопамяти составляло 2,78В, а после припаивания резистора сопротивлением 10кОм к выводам 1 и 4 микросхемы так, как показано на рисунке...:



... выходное напряжение составило 3,19В.

Из-за наличия этой алюминиевой пластинки, которую после переделки платы пришлось устанавливать на место, к выводам микросхемы были припаяны сначала небольшие проводки, а уж потом к ним - резистор.

Стабилизатор напряжения питания внутренних цепей микросхем видеопамяти расположен в противоположном углу обратной стороны платы. Стабилизатор выполнен на микросхеме ISL6522CB от Intersil:

Номинальное напряжение питания внутренних цепей (VDD) микросхем памяти составляло 2,92В, но после припаивания дополнительного резистора сопротивлением 2,7кОм к выводам 5 и 7 микросхемы так, как показано на рисунке...:

...оно поднялось до 3,32В.

Итак, плата готова к экстремальному разгону.
Максимальные частоты, на которых плата устойчиво заработала при экстремальном разгоне, составили 450 МГц у графического чипа и 800 (400DDR) МГц у видеопамяти. То есть, тактовая частота графического ядра относительно номинала, 325 МГц, увеличилась на 38,5%, а частота видеопамяти относительно номинала в 620(310DDR) МГц - на 29%.

Устойчивость работы платы при разгоне определялась по успешному, без появления артефактов, прохождению полного комплекта тестов 3DMark2001 SE в разрешении 1024х768х32 и сразу за этим - четырех benchmark'ов в Unreal Tournament 2003 в разрешениях 800х600, 1024х768, 1280х1024 и 1600х1200 при настройках качества графики по умолчанию.

До повышения напряжения питания и установки дополнительного охлаждения максимальные частоты, при которых видеокарта работала устойчиво, составили 380/750(375DDR) МГц. Таким образом, если поднятие напряжения питания ядра привело к серьезному увеличению разгонного поленциала, с 380 до 450 МГц, то видеопамять при повышении напряжения питания стала "гнаться" ненамного выше - с 750 до 800 МГц. Возможно, верхний предел частоты видеопамяти ограничивается разводкой платы, хотя и не исключен тот факт, что мне достался экземпляр видеокарты с и так уже отлично "разгоняемой" памятью, и повышение напряжения питания не сыграло большой роли.

Впрочем, всё это не так интересно, как само тестирование разогнанной видеокарты. Перед началом тестирования стоит описать тестовую систему и условия тестирования.

Тестовая система и условия тестирования


Собрав тестовую систему, я не смог не сделать пару снимков "рабочего места экстремального оверклокера":



Вид тестовой системы с установленной видеокартой, системой водяного охлаждения её графического ядра и дополнительными вентиляторами, обдувающими микросхемы видеопамяти, пугает, но на что не пойдешь ради скорости? :).

Конфигурация тестовой системы:

Видеокарта FIC 1stGraphics AT010 на базе ATI RADEON 9700 PRO;
Процессор - Intel Pentium4 2800 МГц;
Материнская плата – ASUS P4S8X (SIS 648);
Память - 512 МБ DDR SDRAM PC 2100 Samsung CL2.5;
Жесткий диск – IBM DTLA 305030.


программное обеспечение:

Windows XP Professional;
DirectX8;
Драйвер версии 6200 (Catalyst 4.3) под Windows XP для видеокарт на базе чипов от ATI;
Unreal Tournament 2003 v.2107.

Экстремальный разгон и тестирование производились в помещении при температуре 20-25 градусов Цельсия.

Тестирование было произведено в Unreal Tournament 2003 в разрешениях от 1024х768 до 1600х1200 в четырех режимах: с настройками качества графики по умолчанию, при форсировании анизотропной фильтрации, при форсировании полноэкранного сглаживания и при совместном включении этих функций.

Скорость в 3D


Для оценки эффекта от разгона графического ядра и видеопамяти я выбрал по 2 промежуточных значения частот ядра и видеопамяти, чтобы интервал между частотами был примерно равномерным. В итоге получилось 16 вариантов сочетания частот ядра и видеопамяти. Для удобства восприятия и оценки эффективности разгона ядра и видеопамяти результаты тестирования в каждом из режимов я свел в 2 графика. На одном изображены результаты тестирования платы при фиксированной частоте ядра и при изменяющейся частоте видеопамяти, по этому графику можно судить о "полезности" разгона видеопамяти. На втором графике построены линии, образованные результатами при фиксированной частоте видеопамяти и изменяющейся частоте ядра, по наклону линий на этом графике можно судить об эффективности разгона графического ядра.
Числовые значения результатов, чтобы не загромождать графики, я привел в отдельной таблице для каждого теста.

Unreal Tournament 2003, настройки качества графики по умолчанию:





По результатам тестирования очевидно, что в режиме 1024х768 разгон видеокарты практически не приносит пользы, но при увеличении разрешения прирост производительности появляется и становится весьма ощутимым.
Судя по результатам, прирост производительности при разгоне графического ядра в этом тесте приводит к примерно такому же приросту производительности, как и разгон видеопамяти. Это значит, что, по крайней мере, для Unreal Tournament 2003 при настройках по умолчанию архитектура ATI RADEON 9700 PRO является отлично сбалансированной.

Для более точной оценки эффективности прироста при разгоне можно привести графики, на которых показан прирост производительности при разгоне в процентах относительно результатов платы на номинальных частотах:





Эти графики подтверждают предыдущие: прирост производительности при разгоне едва превышает 5% в разрешении 1024х768, но при увеличении разрешения, когда снижается ограничивающее влияние центрального процессора, увеличивается до 20-25% в режиме 1280х1024 и 30-35% в режиме 1600х1200.
Если судить по виду линий, отражающих результаты тестирования в 1600х1200, то можно сделать вывод, что разгон ядра оказался чуть более эффективным. Однако, не стоит забывать, что частота графического ядра при экстремальном разгоне "подросла" почти на 40%, в то время, как частота видеопамяти - на 30%. То есть, на самом деле, эффект от разгона графического ядра и видеопамяти оказался примерно одинаковым, то есть, плата ATI RADEON 9700 PRO в этой ситуации показала себя отлично сбалансированной.

Числовые значения результатов теста:


Unreal Tournament 2003, форсирование полноэкранного сглаживания:





При форсировании полноэкранного сглаживания самого высокого уровня, 6х, нагрузка на видеокарту резко увеличивается, и разгон приносит пользу во всех протестированных разрешениях.
По виду графиков можно сделать вывод, что и при форсировании полноэкранного сглаживания прирост производительности с разгоном графического ядра и видеопамяти примерно совпадает. То есть, и при полноэкранном сглаживании ATI RADEON 9700 PRO в Unreal Tournament 2003 ведет себя как отлично сбалансированная видеокарта.

Числовые значения результатов тестирования:


Unreal Tournament 2003, форсирование анизотропной фильтрации:






При включении анизотропной фильтрации 16х Quality для вычисления цвета текстуры ATI RADEON 9700 RPO использует гораздо больше текстурных сэмплов, чем при билинейной и трилинейной фильтрации - до 128 штук вместо 4 или 8. Это значит, что для вычисления цвета каждого пиксела при анизотропной фильтрации требуется гораздо больше данных из текстур, то есть, нагрузка на шину памяти - по шине памяти передаются текстурные данные - должна значительно возрасти. Стало быть, разгон видеопамяти должен серьезно увеличить производительность работы при анизотропной фильтрации. Однако, судя по результатам тестирования при разгоне, гораздо больший прирост производительности обеспечил разгон графического ядра. Это значит, что система кэширования текстур в ATI RADEON 9700 PRO превосходно отлажена для работы с применением анизотропной фильтрации, и при форсировании этой функции нагрузка на видеопамять практически не возрастает - все текстурные данные берутся из кэшей. Основным "тормозящим" фактором при этом становится значительно возросший объем дополнительных вычислений, связанных с усреднением цветов большого количества текстурных сэмплов, этими вычислениями как раз и занимаются текстурные блоки графического чипа. Не стоит забывать и то, что текстурные кэши находятся в графическом ядре и работают на его частоте. В итоге разгон графического чипа при применении анизотропной фильтрации оказался гораздо более результативным, нежели разгон видеопамяти.
"Несбалансированность" ATI RADEON 9700 PRO при применении анизотропной фильтрации - налицо.

Числовые значения результатов тестирования:



Unreal Tournament 2003, форсирование анизотропной фильтрации и полноэкранного сглаживания:





При форсировании полноэкранного сглаживания и анизотропной фильтрации разгон графического ядра на ATI RADEON 9700 PRO оказывается более результативным, и в этом "виновата" анизотропная фильтрация, нагружающая вычислениями графическое ядро гораздо сильнее, нежели видеопамять.
В самом "тяжелом" режиме, когда нагрузка на видеокарту велика, и центральный процессор не ограничивает результаты ATI RADEON 9700 PRO, прирост производительности при разгоне должен быть самым высоким. Графики процентного прироста производительности это подтверждают:





Также на этих графиках прекрасно видно, что при максимальной нагрузке - при форсировании анизотропной фильтрации и антиалиасинга - эффективность разгона графического ядра ATI RADEON 9700 PRO оказалась значительно выше, чем эффективность разгона видеопамяти.
Величина прироста производительности при экстремальном разгоне оказалась ощутимой - 30-35% - по предварительным данным, как раз то, что нужно ATI RADEON 9700 PRO для того, чтобы "догнать и перегнать" NVIDIA GeForce FX :) .

Числовые значения результатов тестирования


Заключение


Итак, экстремальный разгон ATI RADEON 9700 PRO, вопреки всем опасениям - явно небезнадежное дело.
При обеспечении адекватного охлаждения и повышении напряжения питания графического ядра и видеопамяти мне удалось поднять частоты графического ядра и видеопамяти на 38,5% и 29% соответственно. Максимальные частоты, на которых плата заработала устойчиво, составили 450/800(400DDR) МГц, что можно смело назвать рекордом :).
Прирост производительности при таком разгоне, если судить по результатам тестирования в Unreal Tournament 2003, составил 30-35%, то есть, он оказался адекватен увеличению тактовых частот графического ядра и видеопамяти.
Не раз поднимавшийся в обзорах вопрос относительно плохой "сбалансированности" ATI RADEON 9700 PRO имеет под собой реальную почву для опасений. При 256-битной шине памяти DDR SDRAM ATI RADEON 9700 PRO имеет "всего" 8 текстурных модулей, и именно скорость текстурирования в некоторых случаях может оказаться фактором, ограничивающим производительность платы. Однако, как показало тестирование при разгоне, явно "несбалансированным" ATI RADEON 9700 PRO становится лишь при применении анизотропной фильтрации, во всех остальных случаях нагрузка на графическое ядро и шину памяти распределилась равномерно.

Что ж, к появлению NV30 мы подготовились. А Вы? :)

Замечание:

Данный материал – своего рода эксперимент, он отнюдь не является призывом к экстремальному разгону или перепайке видеокарт;
Подобная модификация платы сокращает срок ее службы;
При любой модификации платы пользователь автоматически лишается гарантии;
В случае выхода из строя видеокарты или других комплектующих в результате её модификации вся ответственность лежит на пользователе.