Введение
Многоядерная парадигма прочно вошла в нашу жизнь. Пользователи смогли оценить всю прелесть систем, оснащённых CPU с двумя вычислительными ядрами, в результате, продажи таких процессоров растут день ото дня. Вместе с этим совершенно понятно, что прогресс, направленный в сторону увеличения числа процессорных ядер, своего апогея ещё не достиг. На рынок постепенно пробиваются и четырёхъядерные CPU, которые пока что рассчитаны на использование в системах верхнего ценового диапазона, ориентированных на энтузиастов. Возникший интерес к платформам, способным вести многопоточную обработку данных, натолкнул производителей процессоров на мысль о возможности продвижения на рынок высокопроизводительных настольных компьютеров двухсокетных систем, оснащённых парой многоядерных CPU.
Пробный шар в этом направлении невольно запустила компания AMD, предложившая платформу Quad FX, содержащую два двухъядерных процессора Athlon 64 FX. Появление этой платформы в первую очередь было обусловлено желанием AMD дать хоть какой-то ответ на выпуск четырёхъядерных CPU конкурента, так как технологические трудности не дали этой компании возможности выпустить процессоры, содержащие четыре ядра в одной упаковке. Впрочем,
проведённые тесты показали, что на данном этапе платформа AMD Quad FX значительно уступает системам с четырёхъядерными процессорами Core 2 Quad и Core 2 Extreme практически по всем параметрам, в том числе и по быстродействию. Однако впечатлить своих поклонников нарисованными перспективами дальнейшего развития Quad FX AMD, тем не менее, смогла. Представители компании сразу же пообещали, что двухсокетная настольная платформа продолжит своё развитие и после выхода перспективных четырёхъядерных процессоров с микроархитектурой K10. А это означает, что в будущем платформа Quad FX позволит строить системы, включающие в общей сложности восемь процессорных ядер.
Остаться без ответа со стороны Intel такая инициатива, естественно, не могла. Микропроцессорный гигант, уверенно усиливающий свои позиции после ввода в строй микроархитектуры Core, не мог себе позволить упустить из вида возможность появления у конкурента платформ для настольных компьютеров, объединяющих пару четырёхъядерных CPU. И хотя выход «обновлённой» версии Quad FX, которая получит новое название FASN8 и будет объединять процессоры с кодовым именем Agena FX, запланирован только на третий квартал текущего года, свою альтернативу Intel начала поэтапно продвигать ещё в январе. Первая демонстрация концепта системы, оснащённой двумя четырёхъядерными процессорами с микроархитектурой Core, была проведена на выставке CES 2007, там она получила кодовое название «V8». К настоящему же моменту Intel уже освоила серийное производство всех необходимых для создания такой системы компонентов, чем мы и не преминули воспользоваться. В настоящем материале мы проведём первое предварительное тестирование десктопной системы Intel V8, позиционируемой производителем в качестве «восьмиядерного персонального компьютера для создания медиаконтента».
Intel V8 в деталях
В отличие от AMD, которая для создания своей платформы Quad FX выпустила специальные процессоры, а также договорилась с партнёрами о создании специализированных наборов логики и материнских плат, компания Intel пошла по более простому пути. Фактически, платформа V8 представляет собой обычную рабочую станцию, построенную на базе двух четырёхъядерных процессоров Xeon Clowertown, устанавливаемых в материнскую плату с чипсетом i5000X Greencreek. В этом смысле предложение Intel не столь инновационно. Компьютеры, построенные на тех же самых принципах, уже давно предлагает своим клиентам компания Apple, они носят название Mac Pro. Кстати, недавно в числе моделей Mac Pro появилась новинка, использующая именно пару скоростных четырёхъядерных процессоров с микроархитектурой Core.
Процессоры В качестве основы собственного восьмиядерного компьютера для энтузиастов компания Intel рекомендует использовать старшие модели процессоров Xeon, известные также под кодовым именем Clowertown. Эти процессоры обладают микроархитектурой Core и имеют четырёхъядерную структуру. Иными словами, они во многом похожи на четырёхъядерные процессоры Core 2 Quad и Core 2 Extreme с кодовым именем
Kentsfield. Однако, учитывая тот факт, что процессоры Xeon ориентированы на использование в составе серверов и высокопроизводительных рабочих станций, они имеют несколько отличающееся от десктопных процессоров LGA771 исполнение, способны работать в двухсокетных системах и требуют применения особых чипсетов и, соответственно, материнских плат.
Выбор в качестве компонентов топового решения для продвинутых пользователей процессоров Xeon вызван не только тем, что они, в отличие от Core 2 Extreme, способны работать в двухсокетных системах. Дело ещё и в том, что к настоящему моменту линейка процессоров Xeon смогла обогнать свои «настольные» аналоги по целому ряду важных качеств, в том числе и по тактовой частоте. Так, старшая модель Xeon (Clowertown), имеющая процессорный номер X5365, работает на тактовой частоте 3.0 ГГц и использует 1333-мегагерцовую шину, которая придёт в десктопные системы только летом. Именно такие процессоры в количестве двух штук и выступили в качестве базиса «восьмиядерного персонального компьютера для создания медиаконтента» в нашем тестировании.
Диагностическая утилита CPU-Z сообщает об этих процессорах следующую информацию.
Также как и более знакомые обычным пользователям четырёхъядерные процессоры Core 2 Quad и Core 2 Extreme, процессоры Xeon с четырьмя ядрами состоят из двух двухъядерных кристаллов, объединённых в одной упаковке. Каждая такая двухъядерная половинка имеет общий на оба входящие в неё ядра L2 кэш объёмом 4 Мбайта. Таким образом, внутри четырёхъядерного Xeon располагается два L2 кэша, общий объём которых составляет 8 Мбайт.
Следует напомнить, что Intel, в отличие от своего основного конкурента, считает такую двухкристальную компоновку четырёхъядерных процессоров более рациональной, исходя из экономических соображений. Согласно заявлениям компании, использование составных частей с меньшей площадью кристалла увеличивает выход годных чипов примерно на 20%, что снижает себестоимость процессоров на величину порядка 12%. Однако у этого подхода есть и обратная сторона. Поддержание когерентности кэшей в одном четырёхъядерном процессоре с двумя раздельными L2 кэшами неминуемо загружает процессорную шину, поскольку пересылка данных между ними выполняется через системную память.
Полностью, перечень спецификаций процессоров Xeon X5365 выглядит следующим образом:
Как можно заметить, степпинг четырёхъядерных процессоров Xeon Clowertown совпадает со степпингом Kentsfield, что является ещё одним подтверждением их близкого родства.
Также, обращает на себя внимание сравнительно высокое напряжение питания ядра, превышающее аналогичную характеристику всех существующих процессоров с микроархитектурой Core. Из-за этого сильно выросло и типичное тепловыделение Xeon X5365, оно составляет 150 Вт. Столь большое тепловыделение наводит на мысли о возвращении времён NetBurst, по крайней мере, в серверном сегменте, тем более что TDP тогдашних Xeon не превышало 130 Вт. Впрочем, 150-ваттная величина теплового пакета установлена только для трёхгигагерцовой модели линейки четырёхъядерных Xeon Clowertown. Процессоры младших моделей имеют более низкое TDP, ограниченное величиной в 120 Вт.
Для отвода тепла от столь мощных во всех отношениях Xeon X5365 Intel предлагает специальные кулеры, целиком выполненные из меди.
Очевидно, масса этих кулеров весьма значительна, поэтому они используют специальное крепление, использующее backplate.
Отметим, что в настоящее время на сайте Intel нельзя найти информацию о рассматриваемых нами процессорах Xeon X5365. Пока что эти CPU поставляются в ограниченных количествах лишь небольшому числу сборщиков систем. Более широкая доступность четырёхъядерных процессоров для рабочих станций с частотой 3 ГГц ожидается лишь в третьем квартале этого года.
Материнская плата Использование в составе платформы Intel V8 процессоров Xeon, очевидно, требует применения специализированных материнских плат. Сама Intel советует для этой цели платы, основанные на наборе логики Intel 5000X (Greencreek) и предназначенные для эксплуатации в составе двухсокетных рабочих станций.
Ключевое отличие набора логики i5000X от своих предшественников заключается в наличии двух независимых процессорных шин с топологией точка-точка для подключения CPU в двухсокетной системе. Иными словами, этот набор логики позволяет ликвидировать набившее оскомину узкое место многопроцессорных систем прошлого поколения с процессорами Xeon, в которых все процессоры «сажались» на одну общую шину. Благодаря указанному нововведению общая теоретическая пропускная способность процессорных шин в системах на базе i5000X выросла до 17 Гбайт в секунду в случае использования процессоров с 1066-мегагерцовой шиной и до 21 Гбайта в секунду для процессоров с шиной, работающей на частоте 1333 МГц.
Кроме того, i5000X оснащён и ещё одним мощным средством для повышения эффективности взаимодействия процессоров с памятью и между собой. Он снабжён специальным буфером, носящим название Snoop Filter, в котором содержится информация о местонахождении и актуальности всех данных, используемых процессорами. Поскольку используемый для поддержания когерентности кэшей в многопроцессорных системах на базе Xeon протокол MESI требует прослушивания каждым из процессоров шины соседнего CPU, применение Snoop Filter позволяет значительно снизить паразитный трафик, проходящий по процессорным шинам.
Чипсет i5000X, хотя и нацеливается на использование в рабочих станциях, имеет серверные корни. Выдаёт это использование им подсистемы памяти, построенной на модулях FB-DIMM
DDR2 SDRAM. Чипсет имеет два независимых контроллера DDR2 SDRAM, каждый из которых способен работать с двухканальной памятью. Таким образом, максимальная теоретическая пропускная способность подсистемы памяти при условии применения DDR2-667 FB-DIMM достигает 21.3 Гбайт в секунду при чтении и 10.7 Гбайт в секунду при записи данных. Кроме того, контроллеры памяти i5000X обладают рядом интересных свойств, востребованных на серверном рынке. Например, этот чипсет позволяет создавать RAID массивы из модулей памяти, повышая надёжность системы и позволяя заменять вышедшие из строя модули без выключения системы.
Направленность на использование в составе высокопроизводительных рабочих станций обуславливает поддержку северным мостом чипсета i5000X графического порта PCI Express x16. Рассматриваемый чипсет, к сожалению, не позволяет разбивать шину PCI Express x16 на две PCI Express x8, что могло бы быть полезным для поддержки технологий SLI и Crossfire. В этом платформа Intel V8 уступает конкурирующей платформе AMD Quad FX.
Впрочем, это вовсе не означает, что SLI и Crossfire системы на базе плат с чипсетом i5000X построить невозможно. Спасает положение применяемый вместе с i5000X южный мост 631xESB/632xESB. Он поддерживает две дополнительные шины PCI Express x4, одна из которых может быть подведена к физическому слоту PCI Express x16. Некоторые производители материнских плат, например TYAN, используют эту возможность. На таких платах технологии SLI и Crossfire действительно работают (в режиме PCI Express x16 + PCI Express x4), поскольку ни ATI, ни NVIDIA не запрещают в драйверах мульти-GPU конфигурации для чипсетов Intel, нацеленных на применение в рабочих станциях.
Южный мост 631xESB/632xESB добавляет также к числу свойств платформы Intel V8 поддержку двух каналов ATA-100, шести каналов Serial ATA-300, восьми портов USB 2.0, High Definition Audio и двух гигабитных сетевых контроллеров. Кроме того, посредством южного моста возможна реализация двух независимых 64-битных 133-мегагерцовых сегментов шины PCI-X.
Для тестирования платформы Intel V8 было вполне логично выбрать материнскую плату именно этого производителя. Поэтому среди продуктов на базе i5000X для тестов мы выбрали Intel Workstation Board S5000XVN.
Благодаря свойствам используемого чипсета эта плата прекрасно работает с многоядерными процессорами Xeon с 1333-мегагерцовой системной шиной и позволяет использовать PCI Express x16 графические карты. Также, на этой плате имеется два слота PCI Express x8, физически подключенных к шине PCI Express x4, слот PCI-X 100/133 МГц и слот PCI-X 100 МГц. Для установки DDR2 SDRAM на плате предусмотрено восемь слотов для FB-DIMM с частотой 667 или 533 МГц, что позволяет использование в системе до 32 Гбайт памяти.
Жесткие диски (и оптические накопители) могут быть подключены к плате благодаря наличию одного порта Parallel ATA-100, двух портов Serial ATA-300 c поддержкой RAID уровней 0, 1 и 0+1 и четырёх портов Serial Attached SCSI (SAS), также с возможностью создания RAID массивов уровней 0, 1, 0+1 и 5. Помимо этого Intel Workstation Board S5000XVN может похвастать двумя сетевыми гигабитными контроллерами последнего поколения и двухканальным HD Audio кодеком.
Возможности Intel Workstation Board S5000XVN таковы, что они вполне позволяют, основываясь на этой плате, создавать не только мощные рабочие станции, но и компьютеры для энтузиастов, нацеленные на создание и обработку медиаконтента. Но, к сожалению, high-end игровой компьютер из этой платы не получится, в силу возможности установки в неё только одной видеокарты.
К сказанному надо добавить, что первоначальное ориентирование Intel Workstation Board S5000XVN на рынок серьёзных рабочих станций нашло отражение в отсутствии ряда интересных для энтузиастов функций. В частности эта плата, как и другие предложения на базе набора логики i5000X, ни в каком виде не позволяет разгон процессоров. Это – ещё один минус Intel V8 по сравнению с платформой AMD Quad FX, открывающей гораздо больший простор для экспериментов.
Память Так как ранее с модулями FB-DIMM (Fully Buffered DIMM) мы ранее не встречались, пару слов необходимо сказать и об этой памяти.
Поддержка FB-DIMM появилась в серверах и рабочих станциях главным образом из-за необходимости установки в них значительных объёмов памяти. Дело в том, что контроллер памяти не может работать с большим количеством традиционных модулей из-за достаточно сильной электрической нагрузки, требуемой для достижения стабильной работы каждого модуля на высокой частоте. Например, поддержка 64 Гбайт DDR2 SDRAM потребует установки в системе 16 модулей памяти, с которыми традиционный контроллер не сможет совладать практически наверняка, даже при условии использования регистровых DIMM. Поэтому Intel решила перейти с привычного параллельного дизайна шины памяти к последовательному. FB-DIMM являются частью этой концепции: каждый такой модуль объединяет микросхемы DDR2 SDRAM, которые подключаются к последовательной шине посредством устанавливаемого на каждом модуле дополнительного чипа AMB (Advanced Memory Buffer).
У этого подхода есть и обратная сторона. Во-первых, подсистема памяти, построенная на FB-DIMM, имеет гораздо большую латентность, которая повышается из-за добавления на пути данных от чипов DDR2 SDRAM до процессора дополнительного контроллера AMB. Кроме того, AMB представляет собой достаточно сложное устройство, которое при своей работе потребляет заметное количество энергии и ощутимо нагревается. Поэтому все модули FB-DIMM потребляют порядка 3-6 Вт каждый и должны оснащаться теплорассеивателями.
В нашей системе использовалось четыре гигабайтных модуля от Samsung, по одному в каждом канале.
Как видно по стикерам, модули рассчитаны на работу при частоте 667 МГц с таймингами 5-5-5-11.
Аналогичную информацию можно почерпнуть и из SPD модулей.
Как мы тестировали
Вообще, найти достойных соперников для системы Intel V8 не так-то просто. Ведь это – первое решение для энтузиастов, в котором одновременно сожительствует восемь процессорных ядер, физически расположенных в двух процессорах. Поэтому, заниматься глубоким исследованием производительности этой платформы до появления конкурирующего решения, обновлённой системы AMD Quad FX – FASN8 с процессорами Phenom FX, смысла немного. Совершенно очевидно, что система с восемью ядрами с микроархитектурой Core превзойдёт системы с четырьмя ядрами во всех задачах, где возможно эффективное распараллеливание вычислений.
Тем не менее, мы всё же решили сравнить систему Intel V8 с существующей версией платформы AMD Quad FX, а заодно и с компьютером, построенном на базе одного четырёхъядерного процессора Core 2 Extreme QX6800.
В итоге, тестовые системы были укомплектованы следующим оборудованием:
Процессоры:
AMD Athlon 64 FX-74 (Socket 1207, 3.0GHz, 2x1MB L2);
Intel Core 2 Extreme QX6800 (LGA775, 2.93GHz, 1067MHz FSB, 2x4MB L2);
Intel Xeon X5365 (LGA771, 3.0GHz, 2x4MB L2).
Материнские платы:
ASUS L1N64-SLI WS (Dual Socket 1207, NVIDIA nForce 680a SLI);
EVGA 122-CK-NF67-A1 (LGA775, NVIDIA nForce 680i SLI);
Intel Workstation Board S5000XVN (Dual LGA771, Intel 5000X).
Память:
4 x 1GB DDR2-800 SDRAM 4-4-4-12-1T (OCZ DDR2 PC2-9200 FlexXLC Edition);
4 x 1GB FB DDR2-667 SDRAM 5-5-5-15 (Samsung PC2-5300 FB-DIMM).
Видеокарта: PowerColor X1900 XTX 512MB.
Жёсткий диск: Western Digital WD1500AHFD.
Операционная система: Microsoft Windows Vista Ultimate (x64).
Тестирование выполнялась при настройках BIOS Setup материнских плат, установленных на максимальную производительность. Также следует обратить внимание, что в системе Quad FX в соответствие с рекомендациями производителя для операционной системы Vista, мы устанавливали функцию Node Interleaving в Disable.
Везде, где это было возможно, в тестах использовались 64-битные версии приложений.
На диаграммах ниже мы будем приводить результаты тестов четырёх систем: платформы Intel V8 с двумя процессорами Xeon X5365; платформы Intel V8 лишь с одним установленным процессором Intel Xeon X5365; платформы AMD Quad FX с парой процессоров Athlon 64 FX-74 и системы с процессором Intel Core 2 Extreme QX6800.
Тесты производительности
Синтетические тесты: Sandra и Everest В первую очередь, чтобы получить первое представление о вычислительной мощности восьмиядерной системы, мы решили прогнать на ней несколько простеньких бенчмарков из пакета SiSoftware Sandra 2007. Эти тесты производительности хорошо распараллеливаются, а выдаваемый утилитой результат легко можно сравнить с показателями других подобных систем.
В арифметическом и мультимедийном тестах система Intel V8 на базе двух четырёхъядерных процессоров Xeon X5365 показала непревзойдённую производительность. Оно и не удивительно: Xeon X5365 – это самые скоростные четырёхъядерные процессоры Intel доступные на данный момент как среди CPU с микроархитектурой Core, так и вообще.
Хороший результат демонстрирует система Intel V8 и в тесте, измеряющем скорость передачи данных между процессорами в системе. Очевидно, что приобретение современными двухсокетными системами Intel двух независимых шин с частотой 1333 МГц пошло им на пользу. Плюс, в данном случае свой положительный вклад в результат вносит и чипсетный Snoop Filter.
Тесты памяти из Sandra, к сожалению, в системе Intel V8 не заработали. Поэтому для измерения практической пропускной способности и латентности подсистемы памяти, построенной с применением FB-DIMM и двух двухканальных контроллеров, мы воспользовались утилитой Everest 4.0.
Несмотря на впечатляющие значения теоретических пропускных способностей подсистемы памяти, обеспечиваемые набором логики i5000X, на практике всё оказывается не так уж и радужно. FB DDR2 память из-за своих высоких задержек показывает сравнительно низкие результаты.
Впрочем, уделять слишком серьёзное внимание цифрам, полученным в простых синтетических тестов следует вряд ли. Давайте лучше ознакомимся с показателями производительности восьмиядерной платформы Intel V8 в более сложных бенчмарках и в реальных приложениях, в том числе для создания и редактирования контента.
Синтетические тесты: PCMark05 и 3DMark06Формально, PCMark05 способен создавать во время своей работы лишь четыре вычислительных потока. Тем не менее, система Intel V8 в этом тесте работает быстрее аналогичной платформы с одним установленным четырёхъядерным процессором. Это объясняется тем, что интеллектуальный менеджер задач операционной системы Vista старается разгрузить потоки в первую очередь по физически разным процессорам, что в конечном итоге позволяет более эффективно задействовать L2 кэши системы, разделяемые между парами ядер. Впрочем, это не помогает платформе Intel V8 опередить «обычную» систему, использующую десктопный четырёхъядерный процессор Core 2 Extreme QX6800. Происходит это, судя по всему, из-за неэффективности подсистемы памяти, построенной на модулях FB DDR2 и используемой в системе с чипсетом i5000X. Данное предположение, кстати, находит подтверждение в приведённых выше результатах тестов памяти.
Зато тест 3DMark06 ставит систему Intel V8 на верхнюю ступень пьедестала, что особенно сильно проявляется в результатах процессорного бенчмарка. Это совершенно неудивительно, так как он прекрасно оптимизирован под многопоточные среды, в чём мы неоднократно убеждались в наших тестированиях ранее.
Кодирование видеоБольшинство современных кодеков оптимизировано для работы в системах с многоядерными процессорами. Это позволяет платформе Intel V8 вновь блеснуть непревзойдённым уровнем производительности. Впрочем, при этом хочется отметить, что в некоторых случаях, например при измерении скорости кодирования с применением кодека Xvid, величина превосходства восьмиядерной системы над четырехъядерной с процессором Core 2 Extreme кажется не столь значительной. Это, очевидно, обуславливается высокой латентностью подсистемы памяти в системе на базе набора логики i5000X.
Редактирование изображений и нелинейный видеомонтаж Хотя последняя версия Adobe Photoshop и имеет оптимизацию под SMP системы, затрагивает она далеко не все операции и фильтры. Поэтому, результаты теста в данном случае, хотя и выявляют преимущество платформы Intel V8, его величина оказывается не так уж и впечатляюща.
Хотя Adobe Premiere Pro поддерживает многопроцессорность, система с восемью ядрами демонстрирует в нём недостаточно высокий результат, несколько уступающий показателю производительности системы, построенной на четырёхъядерном процессоре Core 2 Extreme QX6800. Более пристальное изучение данной ситуации показывает, что при рендеринге ролика в этом приложении загрузка процессоров в платформе Intel V8 не превышает 50%. Это явно указывает на то, что вычислительная мощность CPU в данном случае узким местом не является. А ограничивает производительность либо скорость подсистемы памяти, либо пропускная способность процессорных шин, которые помимо передачи данных в память загружаются многочисленными операциями, направленными на поддержание когерентности четырёх кэшей второго уровня.
Финальный рендерингЗадачи финального 3D рендеринга традиционно выступают прекрасной иллюстрацией практически линейного масштабирования скорости системы при увеличении в ней числа вычислительных ядер. Неудивительно, что платформа Intel V8 здесь – вне конкуренции.
Другие многопоточные приложения Новая версия Excel 2007 является примером приложения, прекрасно распараллеливающего подсчеты. Измерение времени обсчёта электронной таблицы, реализующей вычислительный метод Монте-Карло для экономической задачи, прекрасно подтверждает этот факт.
Сжатие информации – это ещё один тип задач, получающих весомый выигрыш при увеличении числа вычислительных ядер в системе. Хотя архиваторы весьма требовательны к производительности подсистемы памяти, восьмиядерная система Intel V8 с относительно медленной FB DDR-667 SDRAM работает значительно быстрее компьютера с процессором Core 2 Extreme QX6800 с высокопроизводительной DDR2 SDRAM.
Игры Как мы уже неоднократно показывали в наших обзорах, современные игры не относятся к категории задач, эффективно использующих потенциал SMP систем. Тем не менее, во избежание лишних вопросов, эту категорию тестов мы обойти стороной не смогли.
Даже игры, формально оптимизированные под многопоточность, к коим относится и Quake 4, и Supreme Commander, работают на двухпроцессорной системе с четырёхъядерными CPU Xeon X5365 сравнительно медленно. Дело в том, что число формируемых потоков в этих играх всё равно ограничено. В частности, Quake 4 создаёт только два вычислительных потока, а Supreme Commander – четыре. Это не даёт возможности проявить себя с лучшей стороны платформе Intel V8, а подсистема памяти с высокой латентностью дополнительно ухудшает её результат.
Другое дело – шахматы. Расчётный алгоритм в этой старейшей стратегической игре прекрасно распараллеливается, что неминуемо сказывается на результатах. Восьмиядерная система Intel V8 здесь значительно опережает четырехъядерные системы.
Впрочем, в будущих 3D играх ситуация с поддержкой многопоточности наверняка изменится в лучшую сторону. Надежды на это даёт, например, бенчмарк, измеряющий скорость работы будущей версии движка Source при расчёте физических процессов окружающей среды.
Многозадачная нагрузка Помимо тестирования быстродействия в многопоточных приложениях, мы задались целью выяснить и то, как повлияют на скорость работы ресурсоёмкого приложения, работающего «на переднем плане», фоновые процессы. Для этого мы при помощи популярного однопоточного теста SuperPi измеряли время вычисления 2M знаков числа π, запуская в фоне несколько копий многопоточного архиватора WinRAR.
Полученные результаты чрезвычайно любопытны. Оказывается, при росте фоновой нагрузки восьмиядерная система от Intel может уступать платформе AMD Quad FX, оснащённой лишь двумя двухъядерными процессорами. Причины такого положения дел кроются в эффективности работы с памятью, которая в современных SMP системах помимо всего прочего используется для обмена данными между кэшами второго уровня процессоров. Платформа AMD Quad FX, использующая быструю четырёхканальную небуферизованную DDR2 SDRAM, по скорости пересылки данных превосходит и систему на базе набора логики i5000X, и систему, основанную на NVIDIA nForce 680i SLI. Поэтому при росте числа исполняемых задач в какой-то момент платформы на базе процессоров Intel начинают проигрывать платформе AMD Quad FX. Скорость наступления этого момента, очевидно, будет зависеть от интенсивности работы приложений с памятью и от того, насколько часто в процессе работы будет возникать необходимость обмена данными между раздельными ядрами CPU.
Тесты энергопотребления
Мы привыкли к тому, что системы, построенные с применением 65 нм процессоров с микроархитектурой Core, отличаются сравнительно невысоким уровнем энергопотребления. Однако, судя по всему, на Intel V8 это не распространяется. Процессоры Xeon X5365 имеют типичное тепловыделение 150 Вт, а это больше типичного тепловыделения не только Athlon 64 FX, на которых строится платформа Quad FX, но и устаревших процессоров Intel с микроархитектурой NetBurst. Кроме того, используемые в составе платформы Intel V8 модули памяти FB DIMM потребляют по 5-6 Вт каждый.
Чтобы оценить, насколько прожорлив в свете вышесказанного предложений Intel восьмиядерный персональный компьютер для создания медиаконтента, мы решили измерить его энергопотребление, чтобы впоследствии сравнить его с энергопотреблением других систем. Измерения проводились в системах с конфигурациями, описанными выше. В первую очередь было решено обратить внимание на энергопотребление систем при работе под нагрузкой. Для загрузки работой процессоров и памяти мы использовали специализированную утилиту
OCCT. Видеокарта при измерениях специально не нагружалась. На графике ниже приведено полученное нами пиковое энергопотребление систем в сборе.
460 Вт, полученные у системы на базе двух процессоров Xeon X5365 – это весьма высокий уровень энергопотребления по современным меркам, даже для двухпроцессорной системы. Тем не менее, платформа AMD Quad FX оказалась ещё более прожорливой, её максимальное энергопотребление превышает 530 Вт.
Давайте теперь посмотрим на то, насколько велико энергопотребление систем в режиме простоя, при задействовании технологий Enhanced Intel SpeedStep и Cool'n'Quiet.
Платформа Intel V8 потребляет более 200 Вт и в режиме простоя. В данном случае она проигрывает по экономичности системе Quad FX, в которой процессоры Athlon 64 FX-74 способны снижать свою частоту при малой загрузке более ощутимо, чем Xeon X5365.
Выводы
Знакомство с платформой Intel V8 оставляет после себя неизгладимое впечатление. Полученные результаты тестов настолько высоки, что мы, не сомневаясь, можем смело охарактеризовать её как самую быструю десктопную систему для многопоточной работы (среди существующих в настоящее время). Во всех приложениях, имеющих оптимизацию под SMP, рассмотренная платформа для настольных компьютеров и рабочих станций, объединяющая два четырёхъядерных процессора Xeon, просто обязана демонстрировать непревзойдённую производительность.
Впрочем, сказанное в предыдущем абзаце справедливо главным образом благодаря отсутствию на рынке конкурирующих восьмиядерных систем. Поэтому, после выхода обновлённой версии платформы AMD FASN8, укомплектованной четырёхъядерными процессорами с микроархитектурой K10, ситуация может измениться. Тем более что Intel V8 имеет ряд существенных недостатков, уходящих корнями в её серверное происхождение.
Во-первых, в предложенной Intel восьмиядерной системе не самым рациональным образом реализована подсистема памяти, построенная на FB DDR2 модулях. Она имеет слишком высокую латентность, что отрицательным образом сказывается на быстродействии в ряде распространённых задач. Во-вторых, используемые в основе Intel V8 материнские платы для рабочих станций, базирующиеся на наборе логики i5000X, не лучшим образом подходят для нужд энтузиастов. Они имеют большое количество ненужных для этой категории потребителей функций, не обладая в то же время никакими средствами для разгона процессоров. И, в-третьих, платформа Intel V8 предлагает несколько урезанные возможности для реализации высокопроизводительной видеоподсистемы. Лишь немногие материнские платы на наборе логики i5000X имеют необходимые слоты для установки пары видеокарт, но даже они позволяют использовать технологии SLI и Crossfire лишь в режиме ограниченной производительности по схеме PCI Express x16 + PCI Express x4.
Поэтому, прежде чем делать окончательный вывод о перспективах платформы Intel V8, как об отличном восьмиядерном решении для энтузиастов, хочется дождаться появления тестов конкурирующей платформы AMD FASN8, снабженной двумя четырёхъядерными процессорами нового поколения. Появление соответствующих CPU семейства Phenom FX (с кодовым именем Agena FX) ожидается в третьем квартале, так что ждать осталось недолго. К тому же уже сейчас можно сказать, что платформы AMD Quad FX и FASN8, в отличие от Intel V8, - более дружественны энтузиастам по своим характеристикам и возможностям. Но все точки над i, безусловно, смогут расставить только результаты тестов.