Dual Duron дома- альтернатива или блеф?

Материал предоставлен сайтом Composter

Введение


Возможно ли использование двухпроцессорных систем на основе процессоров AMD в качестве основы для продвинутого домашнего компьютера? Возможна ли работа процессоров Duron в двухпроцессорных конфигурациях? Если да, то насколько она эффективна? И насколько вообще будет оправдан выбор двухпроцессорной системы?
Признайтесь, ведь и вас волновали схожие вопросы этим летом, когда осуществилась, наконец, давняя мечта AMD – выход на рынок двухпроцессорных систем. Именно тогда компания выпустила чипсет AMD760MP, поддерживающий работу в двухпроцессорных конфигурациях, и сделала, тем самым, свой первый шаг в неизведанный доселе рынок рабочих станций и серверов начального и среднего уровня. Те, кто следит за компьютерной прессой, наверняка знают, что шаг этот оказался довольно успешным - дуальные Athlon-системы показали себя надежными и стабильными решениями. Именно надежность и относительная "без_проблемность" AMD760MP и систем на его основе позволяют говорить о том, что первый шаг в направлении 2х оказался для AMD успешным.
В большинстве материалов, опубликованных в печатных и электронных изданиях, основное внимание уделялось работе двухпроцессорных AMD-систем в тяжелых приложениях, типичных для серверов и рабочих станциях. В то же время, не менее интересeн, на наш взгляд, вопрос о том, насколько применимы дуальные платы на AMD в домашних условиях. Неправда ли, было бы любопытно исследовать уровень производительности подобных плат в офисных приложениях, графических пакетах, наконец, в играх. Быть может продвинутый домашний пользователь тоже найдет достойное применение двухпроцессорности? Ведь все мы помним, какое оживление вызывали в свое время дуальные системы на Celeron… Вдруг Duron работает в паре не хуже?
Конечно же, мы отдаем себе отчет в том, что сегодня вряд ли кому-то придет в голову обзавестись двухпроцессорной системой на базе AMD и играть на ней в Quake. Слишком дорого – одна плата потянет только на $300, а еще нужны дорогие модули registered DDR SDRAM, мощный блок питания и т.п. Однако мы более чем уверены, что через некоторое время, с появлением большого количества материнских плат на AMD760 от разных производителей и неизбежным снижением цен, вопрос о целесообразности применения двухпроцессорных систем в домашних условиях обязательно возникнет. Так почему же не попытаться дать ответ на него сегодня?

Материнская плата


До недавнего времени единственным разработчиком двухпроцессорных материнских плат на AMD760MP был TYAN. Думаю, нет нужды повторяться, почему AMD решила на первых порах положиться именно на этого производителя - традиционно высокое качество продукции, богатый опыт разработки тяжелых серверных плат, отличная репутация на рынке и т.п. несомненно повлияли на выбор партнера AMD.
Первой дуальной платой для процессоров AMD, представленной TYAN, стала Thunder K7. Исполненная в лучших традициях этого разработчика, она содержит интегрированный Ultra SCSI контроллер, графический адаптер, Ethernet-адаптер и четко позиционируется для применения в серверах (в т.ч. и стоечных) и, возможно, в рабочих станциях. Спустя некоторое время TYAN анонсировал еще несколько двухпроцессорных плат на AMD760MP, ориентированных на другие ниши и обладающих другим спектром характеристик. Об одной из них - Tiger MP - и пойдет речь в этой статье.
Tiger MP является младшим представителем линейки двухпроцессорных материнских плат TYAN, основанных на чипсете AMD760MP. Она лишена всех интегрированных возможностей - здесь нет ни SCSI, ни RAID, ни встроенного VGA-адаптера. Зато Tiger MP оказывается на пару сотен дешевле, чем Thunder MP. Именно относительно дешевая плата, без интегрированных устройств, такая, как Tiger MP, могла бы в перспективе стать основой для "хардкоровой" домашней системы. Подчеркиваем: "в перспективе".
Не следует, однако, думать, что Tiger MP получается из Thunder K7 путем удаления из последнего интегрированных устройств. Это не так. Tiger MP - совершенно другая плата, разработанная с чистого листа. И это видно даже по разводке и расположению основных элементов. Просто обе материнских платы - Tiger MP и Thunder K7 - основаны на одном и том же чипсете и выпускаются одной и той же фирмой. Конечно же, определенное сходство есть.
Посмотрим же внимательнее на саму плату:

Tiger MP

северный мост - AMD762
южный мост - AMD766
1 слот AGP 4x
4 слот 64/32-бит PCI (33 МГц)
3 слота PCI 32
4 слота 184-pin DDR DIMM PC2100 Registered
2 канала ATA/100
4 USB
Опциональный RAID-контроллер
Phoenix Plug-N-Play 2Mb Flash BIOS
ATX форм-фактор (30.5 см x 26.1 см)

Tiger MP не предъявляет столь суровых требований к питанию, как Thunder K7 (если помните, в последней питание на центральные процессоры подводится отдельным шлейфом). Подойдет обычный блок питания ATX 300W, никаких дополнительных напряжений не требуется.
А вот от использования только Registered памяти TYAN отказаться не смог (ошибочно, кстати, мнение, что это ограничение заложено на уровне чипсета; чипсету «все равно» - это TYAN проявляет нежные чувства к Registered DRAM). Впрочем, в Сети ходят разговоры о том, при функционирование системы возможно и при использовании нерегистровой памяти, в том случае, если устанавливать не больше двух модулей. Однако в этом случае никто, конечно же, не гарантирует стабильность и надежность работы. В документации четко сказано: "Registered DDR only". Остальное - на уровне опытов энтузиастов.
Если в TYAN Thunder K7 разъемы DIMM выполнены таким образом, что сами модули вставляются под углом к плате, то в Tiger MP модули располагаются перпендикулярно плате. Впрочем, это не препятствует возможности установки платы в стоечные серверы – отечественные и иностранные компьютерные компании уже продемонстрировали решения на основе Tiger MP, упакованные в 2U корпусы.
На плате предусмотрены две группы переключателей, с помощью которых выставляются частоты FSB и памяти – либо 200 МГц, либо 266 МГц, промежуточных значений "для разгона" нет. В чипсете AMD760MP, как известно, реализован синхронный механизм обмена данными. Это означает, что частота шины и частота памяти совпадают. Т.е. если процессор работает на шине 200 МГц, то и память будет работать на 200 МГц.
Phoenix BIOS предоставляет необходимый минимум настроек. Как и следовало ожидать, ни о каком разгоне и речи быть не может, тонкий тюнинг отсутствует как таковой.
Может быть это и правильно: все-таки двухпроцессорные платы - не место для экспериментов. Стандартные настройки даты, времени, дисковых накопителей, AGP Aperture Size, функций энергосбережения, порядка загрузки - вот, пожалуй, и все доступные опции.
К монтажу и расположению элементов вряд ли можно предъявить претензии. На плате много свободного места, соседние узлы не мешают друг другу. На северном мосту установлен довольно массивный радиатор, рядом с процессорными Socket'ами находятся разъемы для подключения вентиляторов. Несколько дополнительных разъемов расположены и в других частях платы.

Вопросы тестирования


Тестирование, которое мы провели, было призвано ответить на несколько вопросов:
1.Насколько оправданным может оказаться применение двухпроцессорных систем на основе процессоров AMD в задачах, типичных для продвинутого домашнего пользователя.
2.Есть ли смысл использовать dual Duron систему вместо dual Athlon?
3.Не лучше ли приобрести однопроцессорную систему на основе максимально производительного процессора?
Задачами, типичными для домашнего пользователя, можно считать приложения для 3D-рендеринга, обработки 2D-графики, возможно CAD, компиляторы, офисные пакеты и, конечно же, 3D-игры. Каким бы продвинутым ни был пользователь, поиграть время от времени в какую-нибудь стрелялку-гонялку он вряд ли откажется. Поэтому, мы не видим ничего зазорного в том, чтобы в качестве одного из типов тестов двухпроцессорной платы Tiger MP выбрать трехмерные игры. Да, они, за исключением, пожалуй, Quake III, не имеют многопоточной оптимизации, однако это вовсе не означает, что их нельзя запускать на двухпроцессорной системе. Наоборот, весьма интересно взглянуть, будет ли хоть какой-нибудь толк от второго процессора в приложениях, которые не умеют с ним обращаться?
Второй вопрос заключался в возможности использования процессоров Duron в дуальной конфигурации. Ведь не секрет, что технически этому нет никаких препятствий - эти чипы содержат блоки, необходимые для работы в подобном режиме. Другое дело, что размер кэша второго уровня у Duron вчетверо меньше, чем у Athlon. А как показывает практика, объем кэш-памяти играет очень большую роль в производительности двух- и многопроцессорных систем.

Тестирование


Планируя конфигурацию стендов, мы не стремились выбрать процессоры с максимальной тактовой частотой. Конечно, можно было без труда собрать систему на основе двух Athlon 1.4 ГГц. Но в таком случае, как бы мы измерили соотношение скорости между dual Athlon и dual Duron системой? Ведь максимальная частота процессоров Duron на сегодняшний день составляет только 1 ГГц.
Исходя из этих соображений, были выбраны процессоры с одинаковыми тактовыми частотами - 900 МГц. Было проведено 4 серии измерений:

с 1 процессором Athlon 900 МГц
с 1 процессором Duron 900 МГц
с 2 процессорами Athlon 900 МГц
с 2 процессорами Duron 900 МГц

Также мы повторили все замеры на связке Pentium4 2 ГГц + i845 (плата Soltek). И чипсет i845 выбран сознательно, ведь именно он, по нашему мнению, вскоре станет основой для массовых систем на Pentium4. А раз мы пытаемся рассмотреть достоинства и недостатки двухпроцессорных AMD-решений в их применении к домашнему пользователю, то для сравнения как раз и следует использовать i845, а не i850, который, видимо, займет вскоре узкую нишу в hi-end решениях на Pentium4.
Таким образом, мы надеялись получить в "чистом виде" результаты, которые дали бы возможность оценить разницу в производительности одно- и двухпроцессорных систем на основе Duron и Athlon и понять, стоит ли вообще морочить себе голову двухпроцессорностью и не легче ли будет приобрести привычную, однопроцессорную систему.
Тестирование проводилось с помощью таких приложений:

SiSoft Sandra 2001 для получения показателей теоретической производительности
ZD Winstone 99: Dual Processor Inspection Tests, High-end Business Tests
архиваторы WinZiP, WinRAR
Windows Media Encoder
3D Studio MAX, Bryce
Quake III, 3DMark 2001, Dronez
Adobe Acrobat

Такой набор программного обеспечения соответствует, пожалуй, задачам, наиболее характерным для использования высокопроизводительных компьютеров в качестве домашних рабочих станций. Например, тесты ZD включают CAD-приложения, FrontPage, компиляторы, Photoshop. В рекомендациях не нуждаются 3D Studio и Bryce - популярнейшие пакеты для 3D-рендеринга, которые, впрочем, ориентированы на пользователей разного уровня. С архивированием мы встречаемся каждый день, а задача перевода документов в универсальный PDF формат встает перед всеми, кто работает с различного рода документацией. Ну а про игры и говорить не стоит.
В тестовых стендах использовалось также нижеследующее оборудование:

жесткий диск Seagate Barracuda III 20 Гб (7200 RPM, ATA/100)
256 Мб Registered DDR SDRAM
видеокарта AOPEN GeForce2

Системы работали под управлением Windows 2000 Professional, DirectX 8, драйверов nVidia Detonator XP 21.81. Файловая система - NTFS.

Результаты


Этот синтетический тест дает возможность оценить теоретическую производительность процессоров и скорость обмена данными между чипсетом и памятью. Хорошо видно, что установка второго процессора дает почти двукратный выигрыш. Оно и неудивительно - ведь суть теста SiSoft Sandra состоит в исполнении фиксированного набора операций.
Winstone содержит два набора тестов: Dual Processor Inspection и High-End Business Mark. Первый пакет позволяет оценить производительность в приложениях, специально оптимизированных под двухпроцессорные системы. Это Microstation MP (типичное CAD-приложение), Adobe PhotoShop и Visual C++. Как видим, в задачах, которые "знают" о существовании второго процессора и умеют с ним работать, разница между Dual Athlon и Dual Duron системой совсем невелика. Даже удивительно - откровенно говоря, мы не ожидали от Duron такой прыти.
Посмотрим теперь, как ведет себя система в приложениях, которые не имеют многопоточной оптимизации. Здесь результаты выглядят довольно противоречиво: в некоторых приложениях выигрыш совсем невелик, в других же... двухпроцессорные вариант и вовсе проигрывают однопроцессорным! Причем в Microstation SE проигрыш составляет почти 50%! Поначалу, получив эти результаты, мы не поверили своим глазам и повторили замеры. Однако и повторные измерения выдали те же самые цифры. В конце статьи мы попробуем объяснить причину столь неожиданных показателей.
Обратите, кстати, внимание на показатели двухпроцессорной конфигурации на Duron. Как и в случае с Dual Processor Inspection тестами, она практически не отстает от аналогичной системы на Athlon.
Windows Media Encoder, если верить разработчику, содержит код с многопоточной оптимизацией. Однако на деле разница абсолютно незаметна. Тоже самое можно сказать и в отношении архиваторов - WinZIP работает с одинаковой скоростью что с одним процессоров, что с двумя. А WinRAR, похоже, вообще предпочитает однопроцессорные конфигурации.
3D Studio MAX традиционно очень хорошо работает на процессорах AMD. И, к тому же, эта программа прекрасно оптимизирована под двухпроцессорные конфигурации. Именно на 3D Studio MAX можно ожидать наибольшего эффекта от использования двух процессоров вместо одного
.

Так и есть. Выигрыш - почти в два раза. И разница между двухпроцессорным Athlon и двухпроцессорным Duron - на лицо.
А вот в Bryce никакого эффекта от второго процессора нет. Видно, что это приложение, ориентированное, в общем-то, на home user'а, не содержит оптимизированного кода.
Но наиболее неожиданные результаты поджидали нас в 3D-играх. Здесь творится полный кавардак: снимаешь показатели с двумя процессорами, получаешь 100 fps, вынимаешь один из них, получаешь... 120 fps. Мы перепроверяли, игрались с драйверами, настройками. Мы проводили тесты в разных режимах. И тем не менее, факт остается фактом: в двухпроцессорной системе на базе AMD760MP игры работают медленнее, чем в однопроцессорной. Попытка объяснения данного факта - чуть позже.

Субъективные впечатления


А субъективно все работает очень быстро. Впрочем, этого и следовало ожидать - с 256 Мб ОЗУ Windows 2000 летает как ракета и на более медленных процессорах. А здесь - как-никак Dual Athlon 900 МГц, очевидного повода для тормозов нет.
Интересно, что использование двухпроцессорной системы имеет преимущества даже в том случае, если вы работает с приложениями, не оптимизированными под многопоточные операции. Попробуйте запустить на однопроцессорной машине архиватор, и ничего другого вы делать уже не сможете. А вот в двухпроцессорной конфигурации ничто не мешает начать архивирование и погрузиться в просмотр MPEG/DVD фильма. Система поровну распределит нагрузку на оба процессора и вы не будете ощущать никакого дискомфорта при просмотре фильма. И подобных примеров множество.

Объяснение странных результатов


А теперь - о главном. Как же все-таки можно объяснить поразительное отставание двухпроцессорных систем от однопроцессорных в играх и некоторых других неоптимизированных приложениях? Мы постараемся дать объяснение, не претендуя, впрочем, на то, что оно окажется единственно правильным.
А причина видится нам в следующем. У всех многопроцессорных систем, в т.ч. и на базе процессоров Intel, существует проблема когерентности кэша. В двух словах, смысл заключается в том, что если какое-либо PCI-устройство совершает операцию прямой записи данных в участок памяти, с которым работает процессор, то процессору по окончании операции записи необходимо обновить свой кэш. Иначе данные, которые процессор прочитает из собственного кэша, окажутся неактуальными. Аналогичная ситуация возникает и тогда, когда PCI-устройство читает данные из памяти, а процессор - пишет. В обоих случаях, приходится следить, чтобы данные в кэш-памяти соответствовали действительности, и, по необходимости, обновлять их.
В любом современном компьютере есть множество устройств, активно пользующихся режимом прямого доступа к памяти (DMA). Это и звуковые карты, и видеоадапетр, и дисковые накопители. При высокой интенсивности таких обращений можно ожидать, что в двухпроцессорной конфигурации возникнут существенные простои, связанные с частым обновлением кэша. Что, в свою очередь, повлечет заметное снижение производительности.
К этому фактору видимо домешивается не лучшим образом реализованная поддержка AGP. Нетрудно заметить, что отставание двухпроцессорных систем от однопроцессорных проявляется не только в низких разрешениях, но и в высоких, там, где основная нагрузка приходится на видеокарту. Иного объяснения, чем не должным образом написанные драйверы AGP и IRQ-роутера, мы не находим. Если мы правы, то со временем можно ожидать улучшенных драйверов и, соответственно, улучшения производительности в играх.

Выводы


Итак, в ходе тестирования мы прежде всего удостоверились в том, что двухпроцессорные системы на базе Athlon стабильны и применимы на широком наборе разнообразных задач. Тоже самое справедливо и в отношении dual Duron систем - как выяснилось, в большинстве приложений разница между dual Athlon и dual Duron совсем невелика.
Далее. В многопоточных приложениях со специально оптимизированным кодом двухпроцессорные системы демонстрируют существенно более высокую производительность, чем однопроцессорные. В то же время, в приложениях без оптимизации двухпроцессорные системы порой существенно отстают от однопроцессорных, независимо от того, используется dual Duron или dual Athlon.
В 3D-играх четко проявляются недостатки реализации AGP-интерфейса. При этом сохраняется надежда но то, что рано или поздно эти проблемы будут решены и производительность будет существенно увеличена.
Наконец, огромная польза от использования двухпроцессорной системы, будь-то на Athlon, Duron или Pentium III, проявляется в том случае, если одновременно запускать несколько задач, каждая из которых в отдельности способна полностью загрузить однопроцессорную систему. Эффект мы ощутили на примере одновременного просмотра DivX фильма и архивирования – вместо того, чтобы следить за медленно бегущими процентами, можно приятно провести время, посмотрев интересный фильм.
И последний вопрос: есть ли смысл экономить и использовать dual Duron системы? Решайте сами, однозначного ответа здесь нет. С одной стороны, отставание dual Duron от dual Athlon невелико. Однако с другой и разница в цене между процессорами Duron и Athlon с одинаковыми частотами составляет десяток-другой у.е. Так может быть не стоит мелочиться? Тем более, что двухпроцессорная материнская плата не будет дешевой «по определению».