До начала времён
Успех переменчив. Достигшие успеха заслуживают всеобщее уважение. Они впереди и на них равняются. Однако долго быть лидером чрезвычайно сложно, остальные следуют по проторенному пути, экономя значительные силы для решающего рывка. А время неумолимо старит недавних лидеров и, как хорошо иллюстрирует история, казавшиеся непобедимыми империи могут пасть под натиском молодых государств. Тем, кто впереди, нельзя расслабляться, нежась в лучах славы; успех уходит стремительно.
Intel, являясь, без преувеличения, родоначальницей персональных компьютеров по сей день является самым сильным игроком в этой области. Множество других фирм оспаривали право на свой кусок пирога, но, в большинстве своём мало в этом преуспели. Например, Advanced Micro Devices, давно занявшая нишу на рынке, до недавних пор удовлетворялась крохами со стола гиганта. Когда Intel, выпуская процессор с новой архитектурой, переходила на новый виток технологии, AMD выжимала последние соки из существующих решений. При таком положении дел за фирмой закрепился ярлык некоторой второсортности, однако, ограничиваясь производством микросхем-клонов, фирма накапливала технический потенциал, способный в один прекрасный день перевернуть жизнь. В начале 1996 года первая ласточка возвестила миру о возможных переменах. Это был процессор с кодовым именем К5.
Часто данное сочетание знаков расшифровывали как killer for Pentium. Новейшая разработка с уникальной суперскалярной архитектурой на голову превосходила по производительности Pentium. Правда поначалу под маркой K5 продавался опытный вариант с кодовым именем SSA/5, имевший производительность примерной равную Pentium. Когда же процессор довели до ума, Intel уже успел выпустить усовершенствованный Pentium с технологией MMX и трудился над новым, шестым поколением процессоров, кардинально отличавшимся от существовавших до сих пор.
Не успевая подготовить достойный ответ на Pentium Pro самостоятельно, AMD покупает небольшую инженерную фирмы NexGen, чтобы использовать их наработки по части процессора новой архитектуры для своего K6.
В довольно короткий срок процессор выпустили на рынок, обещая сравнимую с Pentium Pro производительность для привычных Socket-7 систем. Intel же полностью оставил нижний сегмент рынка, взяв курс на рынок серверов и высокопроизводительных рабочих станции, для коих был разработан Pentium II. Разумеется, конкурировать с ним на равных в производительности, K6 не мог.
Основным недостатком процессора оставался неконвееризированный математический сопроцессор и низкая скорость кеша второго уровня, располагавшегося вне процессора, однако в два раза больший размер кеш-памяти первого уровня у K6 позволял оставаться на равных по скорости работы популярных бизнес-приложений. Благодаря этой особенности возникло понятие офисного компьютера, т.е. компьютера, который призван обеспечивать достаточно быстрое функционирование определённого круга общеупотребительных программ.
Дальше, с выпуском обновлённой модели процессора, который по аналогии с лидирующим продуктом конкурента, назвали K6-II, фирма вслед за Intel смогла перейти на частоту системной шины 100 мегагерц. Архитектура, а следовательно и особенности производительности процессора сколько-нибудь заметных изменений не претерпели. Тем не менее, технология, по которой производился процессор, позволяла ему не отставать по тактовым частотам от своего конкурента. Также, памятуя о невыдающейся эффективности обработки чисел с плавающей точкой, инженеры AMD пошли на хитрость, научив своё детище обрабатывать по несколько этих чисел одновременно. Сказано – сделано, и процессор приобрёл два десятка новых инструкций для SIMD (Single Instruction - Multiple Data – принцип, по которому сделан и набор команд MMX) обработки чисел с плавающей точкой одинарной точности. Набор команд позволял, в первую очередь, ускорить матричные операции, часто применяющиеся при расчётах объектов в трёхмерном пространстве, благодаря чему торжественно был наречён 3Dnow! И это событие было подобно раскату грома при ясном небе.
Нельзя сказать, что Intel не задумывалась о подобной технологии, их разработка даже обещала даже большую функциональность. Однако неожиданный ход конкурента смешал карты и Intel пришлось идти на поспешные меры. Отложив реализацию части запланированных возможностей до «лучших времён», Pentium II модернизировали, добавив ему набор инструкций под названием SSE (SIMD Streaming Instructions – SIMD инструкции для потоковой обработки) и ещё одну палочку в название. Кроме того, выяснилось, что нижний сегмент рынка, на который руководство Intel, увлёкшись погоней за жар-птицей, не обращало внимания, развивился неожиданно бурно и стал приносить немалую прибыль конкурентам. Оставить всё как есть было решительно невозможно и фирма начала подготовку к вторжению на добровольно оставленную противнику территорию.
Для покорения нижнего сегмента рынка было решено максимально использовать имеющиеся разработки. Действительно, после перехода на частоту системной шины 100 мегагерц остались не у дел хорошие чипсеты 440LX. Из чипсета вырезали «ненужные» рядовому пользователю возможности и дали название 440EX, а из Pentium II убрали кеш-память второго уровня вместе с сопутствующими ему компонентами. Для пущей экономии процессор, названный Celeron, даже не стали упаковывать в какой-либо корпус. Ломать – не строить, однако полученное столь лёгким способом дешёвое решение, не смогло удачно конкурировать в своём ценовом классе. На производительности офисных приложений сильно сказывалось отсутствие кеша второго уровня. Но новая технология изготовления, приведшая к выпуску Pentium II для частоты шины 100 МГц, позволила уместить на кристалле процессора L2 кеш размером 128 килобайт и, в связи с отпавшей надобностью в процессорной плате, вернуться к PGA корпусу для гнезда ZIF. Перепроектированное ядро получило полноскоростной кеш L2, подобный применявшемуся на Pentium Pro. И, несмотря на его малый размер, процессор начал оправдывать своё имя «шустряк», выступая на равных со старшими (и, надо отметить, гораздо дороже стоившими) братьями. Лишь уже успевшее сформироваться скептическое отношение покупателей к марке Celeron несколько отсрочило приход к этому процессору огромной популярности.
А в это время AMD копила силы для сокрушительного ответного удара по исконным владениям Intel, сектору высокопроизводительных рабочих станций. Операция носила кодовое название K7. Получив в своё распоряжение вместе с несколькими талантливыми инженерами очень перспективную системную шину от процессора DEC Alpha, разработав совершенно новое процессорное ядро и запаковав всё это в картридж, аналогичный применяемому Intel, фирма готовилась отправиться в независимое плавание. Ведь все прежние разработки фирмы, так или иначе, являлись развитием начинаний Intel, эта же была совершенно уникальной. Новый процессор был наречён Athlon и показал мощь, не посрамившую звучного имени. Pentium III глотал пыль. Однако, снискав славу в «производительном» классе, AMD стремительно сдавала позиции в дешёвом. Обладая прекрасной производительностью и низкой ценой, Celeron отвоёвывал всё большую долю рынка. Попытка восстановить status-quo выпуском K6-III, также имевшего полноскоростной кеш L2 в ядре, не смогла заметно изменить ситуацию к лучшему. Тем временем Intel успешно завершил затянувшийся процесс имплантации кеша L2 в ядро Pentium III, но даже переход на 0,18 мкм технологический процесс не позволил сохранить его размер и кеш был сокращён до 256 килобайт. Однако применённые архитектурные усовершенствования, получившие имя Advanced Transfer Cache, самым лучшим образом сказались на производительности – новоиспеченный Pentium III (кодовое имя Coppermine, хотя никакого отношения к медному процессу здесь нет) безоговорочно вернул себе пальму первенства. Параллельно, урезанием кеша до уже привычных 128 КБ, был получен наследник Celeron.
AMD оказалась в патовой ситуации. Необходимость делать ответный ход была очевидна, но возможности не было и не оставалось ничего другого, как ждать. Вскоре подоспели новые технологии и руки фирмы оказались развязанными. Без лишнего ажиотажа модернизировав существующее ядро Athlon, фирма приступила к интеграции в него второго кеша. Видимо помня о трудностях, которые Intel испытала с реализацией ATC, инженеры AMD решили не испытывать судьбу, увеличивая ширину Back Side Bus и ограничились лишь технологией исключения из кеша L2 данных, дублирующих содержание L1 (т.н. exclusive cache). Также было решено перейти исключительно к PGA упаковке, отказавшись от дальнейшего использования процессорного картриджа. Заодно проектировался и веский аргумент в споре за нижний сектор рынка – вариант с сокращённым размером кеша L2, который должен был всерьёз поспорить с Celeron.
И это был хит. Процессор получил массу наград за соотношение возможностей, производительности и цены, а также всенародное признание. Так на небосклоне компьютерной истории зажглась звезда Duron, а успех отвернулся от Intel и обратил свой взор в сторону AMD, которую теперь никто не может назвать второстепенным игроком. Но какая же всё-таки пугливая штука – этот успех…
Пролог: Сладкая парочка.
Фирмы AMD и VIA сотрудничают с давних пор, помогая друг другу успешно конкурировать с таким электронным гигантом, как Intel.
AMD Duron, он же Spitfire – продукт эволюционного развития ядра K7, полученный посредством интегрирования на кристалл процессора кеш-памяти второго уровня в количестве 64 килобайт. Кеш по-прежнему связан с ядром 64-битной шиной, однако функционирует на полной частоте процессора и построен по шестнадцатиканальной наборно-ассоциативной схеме с исключением дублирующихся данных. Процессор выпускается с частотами от 600 мегагерц, а использованная технология производства позволяет наращивать частоту вплоть до 1 гигагерца.
Долгое присутствие на рынке персональных компьютеров позволило VIA накопить опыт, достаточный для создания современных высокоинтегрированных чипсетов, ни в чём не уступающих решениям от Intel. AMD, занятая разработкой процессоров, не может похвастаться сравнимой оперативностью в создании чипсетов, поэтому практически единственным бескомпромиссным выбором для линейки Socket-A Athlon и Duron стал чипсет от VIA. До недавнего времени лишь два набора системной логики поддерживали данный процессор: это AMD ‘Irongate’ 750 и VIA Apollo KT133. Последний, как и Duron, является модернизацией предыдущего продукта (Apollo KX133) и обладает самыми современными характеристиками, в связи с чем на его основе производится подавляющее количество системных плат.
И вот, в один прекрасный день я получил в свои руки Duron и плату на Apollo KT133 и занялся их изучением.
Пререквизиты: Кто есть кто в этой истории.
Этот материал родился из попыток достигнуть максимум кадров в секунду (далее КвС) в одном популярном 3D-шутере. Не скажу в каком :) . Следовало изучить влияния различных настроек чипсета на производительность системы. В качестве подопытных выступали процессор c разблокированным коэффициентом умножения и материнская плата ABIT KT7, имеющая возможность манипулирования этим коэффициентом (и, надо заметить, ещё кучей других настроек). Подробнее конфигурация тестовой системы выглядела так:
ABIT KT7, BIOS версии UL
AMD Duron 650, серия AKCA0044RPFW
2*64 МБайт PC133 памяти, 4х[8Mx16] NCP 7.5 ns
NVIDIA GeForce2 MX, драйвер версии 6.31
Aureal Vortex2, драйвер версии 2048
Windows 98SE russian, DirectX 7.0a, VIA GART 4.04
На свежеустановленную Windows ставился VIA 4-in-1 версии 4.26. Графическая плата – “бесфирменная” GeForce2 MX (частота ядра 175 МГц) имела 32 МБ SDRAM памяти с временем доступа 6 нс (тактирована на 143 МГц). Одним словом, полный noname :) . Плата не подвергалась разгону.
Показателем производительности выступало среднее количество кадров в секунду, замеренное при прогоне с установленным флагом timedemo демки DEMO001 из комплекта iD Software Quake III 1.17. Каждый замер повторялся от трёх до пяти раз и фиксировалось максимальное из полученных значений. Предваряя возможные претензии замечу, что я не считаю скорость игры абсолютным показателем быстродействия компьютера, но исследования показывают, что скорость Quake3 напрямую зависит от производительности подсистемы памяти компьютера, т.е. данную игру можно с большой уверенностью использовать как измерительный прибор.
Тотальный дефолт.
Для начала было решено производить измерения при настройках, применяемых Quake III по умолчанию после удаления файла q3config.cfg. Все настройки BIOS setup также были сброшены в “исходное” положение командой Load optimized defaults. Замеренный в таком состоянии показатель кадров в секунду был принят за печку, от которой будем “плясать” дальше. А именно, будем отмечать прирост или снижение КвС относительно базового замера (в скобках я буду указывать значение этого прироста в процентах).
Изучению подверглись настройки из раздела “Advanced chipset features”. Кроме того, в разделе “Soft Menu III” UL и последующих ревизий BIOS, появились несколько очень заманчивых опций, которым было уделено не менее пристальное внимание. Также, я замерял значения КвС при разгоне процессора, которые я хочу привести первыми, чтобы создать своеобразную “шкалу” для оценки эффекта настроек. Итак, результаты разгона процессора увеличением коэффициента умножения:
Зависимость КвС от частоты
Частота, МГц | 650 | 700 | 750 | 800 | 850 | 900
|
---|
КвС | 77,1 | 79,3 (+2,85%) | 81,8 (+6,1%) | 83,5 (+8,3%) | 85,6 (+11,02%) | 86,9 (+12,71%)
|
КвС/частота, % | 11,86 | 11,33 | 10,91 | 10,44 | 10,07 | 9,66
|
При пристальном рассмотрении в полученных результатах наблюдается некая закономерная нелинейность и, для прояснения ситуации, я занялся вычислениями. Как видим, отношение КвС к частоте, которое я назвал КПДчастоты (знаю, знаю, что термин некорректен, но кто найдёт слово получше – пусть скажет мне ;) показывает стабильное снижение эффекта от прироста частоты. Что, в принципе, не удивительно. Гораздо более занимательными оказались отношения прироста КвС к приросту частоты, которые я назвал КПД относительное и абсолютное (с приростами относительно предыдущей частоты и базовой 650 МГц соответственно). Как видно, эффект от перехода на частоты кратные 100 всегда ниже, чем эффект при нецелых коэффициентах умножения! Объяснение этому, по видимому, нужно искать в архитектурных особенностях ядра K7.
Перейдём к опциям. Некоторые из них не изменяли или ухудшали производительность, поэтому они исключены из рассмотрения. Кроме "индивидуального" результата, контролировался также и "командный" от совместного применения нескольких опций, поэтому результаты удобно представить в виде следующей таблицы (по горизонтали опции из Soft Menu, по вертикали – из Chipset setup):
Влияние настроек на fps
| Default | Fast dec. | Enh. Perf. | Force 4WI | 4K pages | HCLK+PCI | All soft.
|
---|
Default | 77,1 | 79,4 (2,98%) | 77,4 (0,39%) | 80,4 (4,28%) | 77,9 (1,04%) | 82,7 (7,26%) | 90,0 (16,73%)
|
Turbo | 78,4 (1,69%) | | | | | |
|
2WI | 79,4 (2,98%) | | | | | |
|
4WI | 80,7 (4,67%) | | | | | |
|
CL2 | 78,8 (2,20%) | | | | | |
|
Fast wr. | 77,3 (0,26%) | | | | | |
|
Turbo & 4WI | 81,2 (5,32%) | | | | | 86,0 (11,54%) |
|
All mem. | 82,8 (7,39%) | | | | | 87,4 (13,36%) | 92,6 (20,10%)
|
Описание опций и использованных сокращений:
Fast dec. – Fast CPU Command Decode: Fast (по умолчанию Normal). Позволяет декодировать адрес на один такт раньше.
Enh. Perf. – Enhance Chip Performance: Enabled (по умолчанию Disabled). Использование чипсетом более агрессивных временнЫх параметров.
Force 4WI – Force 4-Way Interleave: Enabled (Disabled). Заставить память работать с четырёхканальным чередованием.
4K pages – Enable DRAM 4K-Page Mode: Enabled (Disabled). Использование страниц по 4 килобайта, увеличивает скорость для 64Мбит микросхем памяти.
HCLK+PCI – DRAM Clock: HCLK+PCICLK (Host CLK). Увеличение частоты памяти на частоту шины PCI.
Turbo – Bank X/Y DRAM Timing: Turbo (Normal). Изменяет временнЫе параметры работы с памятью.
2WI, 4WI – DRAM Bank Interleave: 2-Way, 4-Way (Disabled). Чередование двух или четырёх банков памяти.
CL2 – SDRAM Cycle Length: 2 (3). Уменьшение задержки CAS при доступе к памяти.
Fast wr. – Fast Write Supported: Supported (No Support). Разрешить протокол быстрой записи для адаптера на шине AGP.
Не правда ли, получается забавная картина – настройками BIOS можно достичь эффекта значительно большего, чем разгоном в полтора раза! Оптимизация режима работы памяти выгоднее, чем разгон на 100 МГц, тот же эффект достигается включением памяти на 133 МГц, а новые опции из Soft Menu в комплексе дают такое повышение производительности, какое не достигается никаким разгоном процессора! Анализируя наиболее "полезные" настройки, мы увидим, что все они, так или иначе, уменьшают задержки связки процессор-память: во первых, перевод памяти на 133 МГц, чередование банков, "быстрое" декодирование и задержка CAS.
Из природы “очень полезных” настроек можно сделать вывод, что данная система крайне чувствительна к задержкам на шине. Так, экономия всего одного такта шины (Fast CPU decode), производит эффект больший, чем разгон на одну ступень умножения. В таком случае можно ожидать значительного увеличения быстродействия при увеличении частоты FSB (разгон по шине). Давайте посмотрим, так ли это:
Эффект от разгона по шине.
Частота FSB, МГц | 100 | 105 | 110
|
---|
Частота CPU, МГц | 650 | 683 | 715
|
КвС | 77,1 | 80,7 (+4,67%) | 84,8 (+9,99%)
|
КвС/частота, % | 11,86 | 11,82 | 11,86
|
Мы наблюдаем полное отсутствие падения КПД, т.е. КвС растут прямо пропорционально частоте шины! Если вычислить, как и до этого, отношения приростов, то увидим, что разгон шиной почти в три раза эффективнее, чем разгон коэффициентом. Другими словами, разгон шиной на 65 МГц эффективнее, чем разгон коэффициентом на 150 МГц!
Новомодный режим Fast Writes, поддерживаемый акселераторами GeForce, дал крайне незначительный “экономический” эффект, сравнимый по величине с погрешностью измерений. Более того, при его включении усилился разброс получаемых результатов. Ещё большим сюрпризом стал и тот факт, что включение режима AGP4X не только не прибавило, но даже уменьшило среднее количество КвС! Помня о том, что графический сопроцессор в GeForce обращается к координатам вершин, хранящимся в оперативной памяти компьютера, я ожидал совершенно другого результата. В чём же дело, может сказывается нехватка скорости системной памяти или сцены недостаточно сложные, а текстуры недостаточно детализированные?
Количество против качества.
Чтобы расставить точки над “i” я провёл ещё одну серию замеров при других настройках Quake3, которые должны были сильнее нагружать систему. Были установлены следующие опции: 32 bit rendering, 32 bit textures, High geometric detail, Highest texture quality. Для экономии времени я проводил “экспресс-тестирование”, т.е. не стал испытывать каждую опцию в отдельности, благо акценты уже прояснены. При настройках по умолчанию получилась скорость 72.2 кадра в секунду. Учитывая, что ограничение по Fillrate графической карты не могло возникнуть (разрешение осталось прежним, 640 на 480 точек), падение скорости на пять кадров показало действительное увеличение нагрузки на систему.
Сначала настроим на максимальную производительность память: при частоте 100 МГц настройка памяти позволила получить 76,9 КвС (+6,51%), последующий переход на частоту памяти 133МГц дал 80,1 КвС (ещё +4,16% или 10,94% относительно стандартных установок). Включение остальных настроек Soft Menu дало 83,2 КвС (+3,87% или абсолютных 15,24%). Когда как не теперь, когда влияние остальных факторов сведено к минимуму, должны себя проявить во всей красе AGP4X на пару c Fast writes :) . С трепетом включаем их… и получаем 83,5 кадра в секунду.
Да, 0,36% улучшения трудно назвать удовлетворительным результатом. В чём дело? Влияние различных опций на скорость уменьшилось по сравнению с нормальными настройками Quake3. Может быть в данной ситуации, почему-то, проявляется недостаток скорости процессора? Посмотрим, какая картина сложится на более быстрых “камнях” (все опции остаются включёнными):
Влияние процессора
Частота, МГц | 650 | 800 | 900
|
---|
КвС | 83,5 | 88,9 (+6,47%) | 91,3 (+9,34%)
|
КвС/частота, % | 12,84 | 11,11 | 10,14
|
Да, КПД частот падает также, как и раньше, и даже чуть быстрее. А разгон до 110 МГц на шине вообще не удался, в игре наблюдались “страшные” искажения изображения и на третьем замере компьютер завис. Поскольку до этого компьютер переносил эту частоту без каких либо проблем, логично предположить, что стабильность уменьшилась из-за включения неких опций. Отключением AGP4X вместе с Fast Writes удалось восстановить стабильность. В таком режиме система показала 88,2 КвС, что несколько ниже результата, полученного на частоте 800 МГц (напомню, что при настройках по умолчанию режим 8.0х100 уступил 6.5х110), т. е. снизилась даже эффективность разгона шиной (КПД составил 12,33%).
Так что же вообще дают AGP4X с Fast Writes? Окончательный ответ на этот вопрос я решил поискать при максимальной частоте и самых “быстрых” настройках:
Влияние настроек AGP
Настройка | AGP 2X, no F.Wr. | AGP 2X, F.Wr. | AGP 4X, no F.Wr. | AGP 4X, F.Wr.
|
---|
КвС | 90,7 | 90,7 | 91,4 | 91,3
|
КвС/частота, % | 10,08 | 10,08 | 10,16 | 10,14
|
Вот такие дела: при самых “жестоких” настройках польза от особых режимов AGP 2.0 составляет 0,77%!
Разбор полётов.
Разгон процессора, хотя и не являлся самоцелью, был произведён и обмерян. Конечно, разогнанный процессор оказывается быстрее неразогнанного, но вот с величиной этого быстрее не всё оказалось так просто. Экстраполяция даёт понять, что примерно к двум гигагерцам эффект от разгона исчезнет совсем. Это заставляет изыскивать дополнительные пути повышения производительности, в частности оптимизировать взаимодействие связки памяти-чипсет-процессор, а также увеличивать частоты работы памяти и шины процессора. К слову, шина EV6 имеет потрясающие перспективы по наращиванию частоты, чем AMD просто обязана воспользоваться. Думаю, не помешает напомнить, что эта шина изначально рассчитывалась для работы на частотах до 200 мегагерц (400DDR).
Выяснилась ещё одна занимательная деталь: сразу после сборки системы процессор стабильно работал на частоте 950 МГц при Vcore 1.85 В и даже проходил POST на 1 ГГц. После полумесячной эксплуатации оказалось, что процессор не только ни в какую не хочет “идти на гигагерц”, но даже на частоте 950 МГц не смог работать в Windows. Вот так сюрприз!
В общем, тесты показали, что без настроек памяти и чипсета эффективность разгона очень не высока, а различные ухищрения по сокращению задержек при обращениях к памяти дают значительный эффект. Судя по всему, это следствие DDR шины процессора, ведь за каждый лишний такт по такой шине могли бы пройти не одна, а две посылки данных. В связи с этим хотелось бы обратить ваше внимание на то, как изменяется влияние CL2 при уменьшении других задержек. Так, если на установках по умолчанию она давала прибавку на 2.20%, то при четырёхканальном чередовании выигрыш снизился до 1.97%, а на частоте 133 МГц стал и того меньше, составив совсем незначительные 1.62%. Вообще, совместный эффект от настроек памяти оказывается меньше, чем сумма эффектов от применения каждой опции в отдельности. Напротив, опции из Soft Menu совместно дают больший эффект, чем арифметическая сумма индивидуальных эффектов.
В некоторых материалах высказывалась мысль, что 4-way interleave актуален лишь когда в системе установлено два двухсторонних модуля DIMM. Как выяснилось, это не так. И при двух односторонних модулях по 64 Мбайт (каждый занимает лишь одну линию RAS) эффект также значителен. Причина, по-моему, во внутреннем расслоении памяти типа SDRAM на банки, которые и чередуются. Также, несмотря на заявление в мануале, что использование страниц в 4 килобайта имеет смысл только для 64 мегабитных микросхем SDRAM, эта опция оказывает значительное влияние и при 128 мегабитных микросхемах. Возможно, более корректным было бы указание “для 64 и более Мбит микросхем”.
Полнейшее разочарование постигло меня при изучении возможностей, предоставляемых в соответствии со спецификацией AGP 2.0. Так, режим AGP4X при игре с нормальными настройками (без чрезмерной детализации) вопреки здравому смыслу даже снижает производительность! Также непрочувствованным остался эффект от Fast Writes. Не подумайте, что дело в нефирменной видеокарте или в конкретном чипсете. Выяснив эту особенность, я повторил опыт на ASUS CUSL2-C с Pentium !!! 800EB и ASUS AGP-V7700 и получил аналогичный результат. Видимо мы ещё не доросли до правильного использования подобных вещей. Были сообщения, что поддержка AGP4X отключена в детонаторах, редкие карты поддерживают Side-Band Addressing, поэтому простора для поисков много. Пока рекомендую оставить обе эти опции выключенными, поскольку они снижают стабильность.
Разумеется, полученные цифры никаким образом нельзя распространять на скорость каких-то других приложений (особенно офисных), однако обнаруженные тенденции должны соблюдаться для тех программ, которые, подобно Quake3, сильно нагружают подсистему памяти. А проведённые тесты показывают, что именно в этой области у создателей плат на чипсете Apollo KT133 есть большой простор для творчества и кропотливая доводка BIOS может давать очень ощутимый результат.
Итак, вердикт: не единожды я замечал, что разные люди, тестируя один и тот же продукт, получают кардинально отличающиеся результаты и порой приходят к диаметрально-противополжным выводам. Тезис великолепно иллюстрируется героиней этого тестирования – во многих сравнениях ABIT KT7 занимает последние или предпоследние места по производительности, в то же время, у других людей она оказывается лидером. В чём дело? Полагаю, в подходе тестера. Многие предпочитают не трогать настройки BIOS Setup, в какой-то мере справедливо полагая, что производителю виднее. Однако именно здесь и кроется загвоздка. К примеру, BIOS плат ASUS обычно настраивает память автоматически (опция Memory timings: By SPD), в то время как ABIT-овцы, видимо не желая больше получать упрёков в нестабильности своей продукции, придерживаются консервативных установок. Естественно, в таком случае платы не могут раскрыть весь свой потенциал и не берут призов в рейтингах. Но, как можно видеть из результатов данных изысканий, после небольшого приложения головы и рук положение кардинальным образом меняется. Так что, если лениться при тестировании, можно придти к необъективным результатам, а такой “хоккей” нам, очевидно, даром не нужен.
P.S.
Уже после проведения опытов и замеров, по которым составлялся этот материал, у ABIT появились обновлённые версии BIOS, в которых были исправлены невозможность использования AGP Fast Writes при включении Enhance Chip Performance в Soft Menu, а также некорректная установка таймингов памяти при SDRAM CAS latency 2. Возможно, с новым BIOS мы бы получили несколько более привлекательный эффект от Fast Writes. По крайней мере, скорость работы с памятью возросла более, чем на десять процентов, достигнув небывалых доселе величин. По моему мнению, скорость этой платы стала самой высокой среди конкурирующих аналогов. Кто там кричит про ASUS A7V? Подать её сюда, устроим очную ставку! :)