Введение
Ведущие разработчики графических процессоров, компании AMD и NVIDIA, конкурируют не только в сфере игровых ускорителей. Отдельный и, кстати говоря, весьма важный рынок – это ускорители для профессиональных пользователей, использующих GPU в системах автоматизированного проектирования, трёхмерного моделирования, при обработке контента высокого разрешения или просто для расчётов. Хотя объёмы продаж профессиональных карт в количественном выражении не так высоки, их выпуск всё равно приносит немалую прибыль, так как цены на такие ускорители значительно выше, чем, например, на игровые видеокарты. Тем не менее, до недавних пор AMD и NVIDIA имели совершенно различные взгляды на рынок профессиональных графических ускорителей. В частности, NVIDIA считала его одним из приоритетных направлений своей деятельности, нередко начиная продвижение новых архитектур с этого сегмента и именно для него предлагая свои наиболее продвинутые и производительные решения. AMD же столь пристального внимания этому рыночному сегменту не уделяла, и довольствовалась лишь тем, что с некоторым опозданием адаптировала для него игровые графические карты.
Два разных подхода давали и разные результаты. На протяжении многих лет продукция компании AMD была представлена в профессиональном графическом сегменте очень плохо, и NVIDIA имела в нём явно доминирующие позиции. Однако такое положение дел, в конце концов, перестало удовлетворять AMD, и она решила расширять свою экспансию, используя наиболее простые и доступные приёмы: взвешенную ценовую политику и ускорение вывода на рынок свежих поколений профессиональных карт с более современными архитектурами. Всё это не могло не сказаться на рыночной доле. И если в 2009 году продукция компании AMD в сегменте профессиональных видеоакселераторов занимала лишь 12 процентов, то к началу этого года её доля выросла до 20 процентов.
Вдохновившись успехом, AMD решила не останавливаться на достигнутом. На протяжении последних двух лет её выручка от продаж профессиональных ускорителей планомерно возрастает. И сейчас, когда компания постепенно выходит на прибыльность, дополнительные доходы от этой сферы деятельности становятся особенно значимыми. Поэтому AMD решила увеличить свои инвестиции в данный сегмент и ожидает соответствующей отдачи, которая, кстати говоря, не заставляет себя долго ждать. Например, в конце прошлого года AMD удалось добиться важного успеха – проникновения профессиональных GPU серии FirePro в рабочие станции Apple Mac Pro. Для этой цели компанией была сконструирована специальная линейка графических карт D300, D500 и D700 с высокой производительностью и полной поддержкой 4K-разрешений на трех мониторах.
Чуть позже AMD провела и обновление общедоступной линейки профессиональных графических ускорителей, переведя её на графические процессоры последнего поколения. Новым флагманом в ряду обновлённых профессиональных решений стала графическая карта FirePro W9100, в основу которой был положен хорошо известный геймерам GPU с кодовым именем Hawaii. Такое достаточно естественное пополнение в ряду профессиональных видеоускорителей AMD, на самом деле, – очень важный шаг вперёд. Дало в том, что FirePro W9100 не только добавляет в профессиональные видеокарты AMD все возможности архитектуры GCN 1.1, но и существенно поднимает планку производительности – в особенности это касается скорости вычислений с плавающей точкой двойной точности. И, кажется, что теперь AMD готова биться с NVIDIA в сегменте профессиональных видеокарт практически на равных. Однако не будем забегать вперёд и посмотрим на FirePro W9100 подробнее. Компания AMD как раз предоставила нам образец этого продукта для всестороннего тестирования.
AMD FirePro W9100 в подробностях
Итак, FirePro W9100 – это на сегодняшний день лучшая и самая быстрая видеокарта AMD для профессионального применения. Основывается она на вполне привычном для игрового рынка полноценном чипе с кодовым именем Hawaii XT. Напомним, он производится по полупроводниковой технологии c 28-нм нормами и располагает 2816 шейдерными процессорами и 64 блоками растровых операций. Все эти мощности в FirePro W9100 полностью доступны, что делает данный профессиональный ускоритель архитектурно похожим на Radeon R9 290X. Однако номинальная частота графического процессора в FirePro W9100 установлена в 930 МГц, что несколько ниже частоты старшей одночиповой графической карты для игровых систем. Это обусловлено повышенными требованиями надёжности, накладываемыми на комплектующие для высокопроизводительных рабочих станций, которые нередко работают под нагрузкой непрерывно в течение продолжительного периода времени. При этом снижение частоты не приводит к уменьшению энергетических аппетитов видеокарты. Максимальное расчётное тепловыделение FirePro W9100 составляет 275 Вт, что, кстати, почти совпадает с максимальным тепловыделением предшествующей флагманской видеокарты AMD для профессионалов FirePro W9000, которая основывалась на графическом процессоре Tahiti.
Если сравнивать FirePro W9100 и FirePro W9000 с позиции спецификаций, то новая карта кажется заметно интереснее в первую очередь своей подсистемой памяти. Новинка снабжается 16 Гбайт видеопамяти и использует полную 512-битную шину, имеющуюся в Hawaii. Таким образом, максимальная пропускная способность памяти у нового профессионального ускорителя составляет 320 Гбайт/с, что делает FirePro W9100 профессиональной картой с быстрейшей на сегодняшний день памятью максимально доступного объёма. Любопытно, что весь массив памяти у FirePro W9100 набран всего 16 чипами, то есть, в этом случае AMD использует достаточно редкие 8-гигабитные микросхемы GDDR5 с поддержкой ECC.
Огромным преимуществом FirePro W9100, отличающим её от игровых видеокарт, является высокая производительность на операциях с двойной точностью. В профессиональных GPU компании AMD прошлых поколений двойная точность снижала пиковую производительность не менее чем в четыре раза, но в Hawaii удвоение точности приводит лишь к двукратному падению производительности относительно одинарной точности. Таким образом, располагая вычислительной мощностью на уровне 5,24 Тфлопс на вещественных операциях с одинарной точностью, эта видеокарта может предложить на операциях с двойной точностью пиковую производительность в 2,62 Тфлопс. А это – лучший показатель в отрасли: FirePro W9100 – это первая профессиональная видеокарта, которая выдаёт при двойной точности вычислений более 2 Тфлопс. Однако стоит подчеркнуть, что всё сказанное о вычислительной мощности касается исключительно профессиональной версии Hawaii: в игровом варианте этого процессора производительность при удвоении точности масштабируется в отношении 1:8.
Рекомендованная стоимость FirePro W9100 в момент анонса этой видеокарты четыре месяца тому назад была установлена в $4000. Однако ценовая политика AMD продолжает отличаться завидной гибкостью, и на сегодня реальная стоимость уже упала до $3300. Это делает FirePro W9100 гораздо более дешёвой альтернативой для NVIDIA Quadro K6000, которая сегодня продаётся за суммы порядка $5000. При этом предложение AMD отличается куда более продвинутой подсистемой памяти и высочайшей вычислительной производительностью: именно эти факторы и должны обеспечить значительный интерес к FirePro W9100 со стороны профессиональных пользователей. Дело в том, что даже привычные системы автоматизированного проектирования и трёхмерного моделирования современных версий способны генерировать очень высокую вычислительную нагрузку и готовы эффективно задействовать все предоставляемые новинкой аппаратные ресурсы, особенно в свете внедрения высококачественных мониторов с 4K-разрешением (4096 x 2160 пикселей). Плюс, профессиональная графика начинает активно применяться и в среде творческой обработки мультимедийного контента, а там вычислительные ресурсы имеют ещё более высокое значение.
Конечно, немалое внимание AMD уделяет и тому факту, что её профессиональные видеокарты поддерживают фреймворк OpenCL, позволяющий переносить параллельные вычисления общего назначения на GPU. В этой связи стоит отметить, что до конца года AMD обещает выпустить драйвер OpenCL 2.0, который сделает доступным динамический параллелизм и модель общей виртуальной памяти. Но даже и сейчас использование FirePro W9100 для ускорения работы поддерживающих OpenCL приложений будет вполне оправдано. Многие системы рендеринга и обработки видео готовы задействовать эту возможность, и, кстати, линейка профессиональных карт AMD включает даже специализированные построенные на GPU Hawaii вычислительные ускорители FirePro S9150. Однако FirePro W9100 – более универсальное решение, которое может работать и как графический, и как вычислительный ускоритель одновременно.
Технические характеристики FirePro W9100 в сравнении со спецификациями предыдущего флагмана AMD, FirePro W9000, и лучшими на данный момент профессиональными ускорителями NVIDIA выглядят следующим образом:
По своему внешнему исполнению AMD FirePro W9100 кажется весьма внушительным аппаратным компонентом. Видеоплата имеет полноразмерную конструкцию и снабжена двухслотовым кулером, полностью закрывающим лицевую поверхность карты. Полная длина платы с системой охлаждения составляет 28 см. Иными словами, по габаритам FirePro W9100 похожа на Radeon R9 290X с той лишь разницей, что профессиональный ускоритель снабжён дополнительной планкой для жёсткой фиксации видеокарты в корпусе рабочей станции.
Надо сказать, что применённый на FirePro W9100 кулер не имеет прямых аналогов среди игровых графических карт. Однако он ушёл от них недалеко и работает по тому же самому принципу: в его основе лежит медная испарительная камера. Радиальный вентилятор чуть меньшего, чем у игровых Radeon, диаметра обеспечивает продувку радиатора, выхлоп осуществляется как за пределы корпуса, так и через решётку в верхней части кожуха со стороны выводов. Применённая схема не отличается особенной тишиной, но она вполне эффективна. Впрочем, профессиональные пользователи вряд ли будут жаловаться на шум, ведь частота работы графического процессора в FirePro W9100 по сравнению со старшими игровыми платами несколько понижена.
Оборотная сторона платы FirePro W9100 полностью закрыта металлической пластиной. Эта пластина механически защищает карту от повреждений и обеспечивает теплоотвод для тех чипов, которые расположены с обратной стороны печатной платы.
Если посмотреть на видеокарту сверху, то нетрудно заметить, что привычных разъёмов CrossfireX на ней нет. Как и в игровых видеоакселераторах последнего поколения, здесь обмен данными между GPU происходит через PCI Express. Кстати, любопытно, что FirePro W9100 не имеет жёстких ограничений в числе работающих одновременно GPU. Теоретически, в рабочую станцию может быть установлено до восьми таких ускорителей и все их можно будет объединить в единую мульти-GPU конфигурацию. Помимо этого, FirePro W9100 полностью совместима с модулем синхронизации FirePro S400, через который реализуется функциональность framelock и genlock – соответствующий разъём выведен на верхнюю кромку платы.
Для подключения питания на плате имеется два разъёма: шестиконтактный и восьмиконтактный.
Набор видеовыводов, который предусмотрен на FirePro W9100, разнообразием не отличается. Предусматривается лишь шесть портов mini-DisplayPort 1.2 и дополнительный порт для подсоединения 3D-оборудования. Порты mini-DisplayPort встречаются на графических картах не слишком часто, поэтому AMD предполагает, что комплект поставки FirePro W9100 должен включать как минимум два переходника с mini-DisplayPort на DVI. Сами же эти порты в сумме позволяют подключить до шести 4K-мониторов с частотой обновления развертки 30 Гц или до трёх 4K-мониторов c частотой 60 Гц.
Стоит подчеркнуть, что FirePro W9100 – это единственная на данный момент видеокарта, которая может работать с шестью 4K-мониторами одновременно.
Как мы тестировали
Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на самом быстром десктопном четырёхъядерном процессоре Intel Core i7-4790K, имеющем номинальную тактовую частоту 4.0 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel Z97 и 32 Гбайт скоростной памяти стандарта DDR3-2133 SDRAM.
Основным соперником FirePro W9100 на базе GPU Hawaii в рамках тестирования стала конкурирующая профессиональная видеокарта NVIDIA Quadro K5000 поколения Kepler. К сожалению, мы не смогли получить на тесты старший профессиональный ускоритель NVIDIA, но K5000, как и K6000, тоже относится к числу решений верхнего уровня, хотя и стоит в районе $1800, то есть серьёзно дешевле нового профессионального акселератора AMD. Кроме того, для иллюстрации различий между профессиональными и графическими картами общего назначения, мы протестировали и один из флагманских игровых ускорителей с такой же, как у FirePro W9100, архитектурой – Radeon R9 290X.
Таким образом, для тестовых испытаний задействовалось следующее оборудование:
Процессор: Intel Core i7-4790K (Haswell Refresh, 4 ядра + HT, 4,0-4,4 ГГц, 4x256 Кбайт L2, 8 Мбайт L3).
Процессорный кулер: Noctua NH-D15.
Материнская плата: ASUS Z97-Pro (LGA1150, Intel Z97).
Память: 4x8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill [TridentX] F3-2133C9Q-32GTX).
Видеокарты:
AMD FirePro W9100 (Hawaii, 16 Гбайт/512-бит GDDR5, 930/5000 МГц);
AMD Radeon R9 290X (Hawaii, 4 Гбайт/512-бит GDDR5, 1000/5000 МГц);
Nvidia Quadro K5000 (GK104, 4 Гбайта/256-бит GDDR5, 706/5400 МГц).
Дисковая подсистема: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Блок питания: Seasonic Platinum SS-760XP2 (80 Plus Platinum, 760 Вт).
Тестирование проводилось в операционной системе Windows 7 Professional SP1 x64.
Использовавшиеся версии драйверов:
AMD Catalyst Driver 14.4;
AMD FirePro Unified Driver 13.352.1014;
Intel Chipset Driver 10.0.14;
Intel Management Engine Driver 10.0.0.1204;
Intel Rapid Storage Technology 13.0.3.1001;
NVIDIA Quadro Driver Release 340.52;
NVIDIA 3ds Max Performance Driver 13.00.04.
Тестирование видеокарт происходило в разрешении 1920x1200 с отключенным параметром Vsync. Для тестирования использовались популярные приложения для автоматизированного проектирования и трёхмерного моделирования и специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC) тесты, а также бенчмарки, созданные в нашей лаборатории.
Производительность
SPECviewperf 12.0 При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя достаточно простые операции, этот тест показывает «чистую геометрическую» производительность ускорителей при работе через OpenGL и DirectX, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных последовательностей команд, задающих визуализацию сложных моделей, характерных для тех или иных профессиональных приложений.
Встроенные в SPECviewperf используемой нами двенадцатой версии скрипты моделируют деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): CATIA V6 R2012 (catia-04), Creo 2 (creo-01), Energy - абстрактный программный пакет для геологоразведки месторождений нефти и газа (energy-01), Maya 2013 (maya-04), Medical - проприетарное программное обеспечение для объёмного рендеринга изображений, формируемыми KT и МРТ сканерами (medical-01), Showcase 2013 (showcase-01), Siemens NX 8.0 (snx-02), Solidworks 2013 SP1 (sw-03).
По результатам SPECviewperf cразу же становится понятно, что FirePro W9100 – это профессиональное решение AMD нового поколения в полном смысле этого слова. Этот ускоритель по сравнению со своими предшественниками делает огромный шаг вперёд. Если ещё год назад результаты SPECviewperf явно указывали на то, что предложения NVIDIA превосходят карты AMD в теоретической мощности, то теперь так говорить уже неправомерно. Преимущество FirePro W9100 над Quadro K5000 довольно заметно, а при некоторых разновидностях нагрузки его даже можно назвать убедительным. Существует лишь два сценария – Creo и SolidWorks – где профессиональная видеоплата NVIDIA показывает более высокий результат. В остальных же случаях перевес в быстродействии оказывается на стороне FirePro W9100. Причём, в задачах геологоразведки, в медицинских приложениях и при создании трехмерных визуализаций на основе данных САПР в Autodesk Showcase предложение AMD оказывается лучше Quadro K5000 почти вдвое.
То, что FirePro W9100 действительно способна играть в высшей лиге, очень обнадёживает. Однако в полной мере при выборе графического ускорителя опираться на результаты SPECviewperf не стоит. Всё-таки этот бенчмарк имеет синтетическую природу, не учитывает нюансов конкретных приложений и не задействует шейдеры, которые постепенно начинают использоваться и профессиональными пакетами. Поэтому мы протестировали также и производительность в реальных профессиональных приложениях.
Autodesk 3ds Max 2011 Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи профессиональной версии теста SPEC. Эта версия знаменательна тем, что в ней, в том числе, используются сверхсложные модели, насчитывающие порядка 32 миллионов многоугольников, а оценка производительности графических карт выполняется раздельно для обычных и для сложных моделей.
Отдельно необходимо отметить и тот факт, что оба производителя профессиональных решений уделяет скорости работы своих ускорителей в окнах проекции 3ds Max отдельное внимание. Для её увеличения программистами AMD и NVIDIA предлагается специальные оптимизированные мини-драйверы, которые подменяют в пакете стандартный DirectX-драйвер и обеспечивают увеличение производительности.
По общему показателю производительности графики новый профессиональный флагман компании AMD лишь только смог приблизиться к Quadro K5000. И, казалось бы, это не столь хороший результат. Однако картина серьёзно меняется, если в ход идут сверхтяжёлые модели.
Когда дело доходит до обработки модели города, насчитывающей 32 миллиона многоугольников, у FirePro W9100 неожиданно открывается второе дыхание. В таких условиях эта карта может похвастать значительно более высоким быстродействием, нежели Quadro K5000. Любопытно, что результат Radeon R9 290X ещё выше, однако это обуславливается иным путём рендеринга, который 3ds max 2011 задействует на игровой видеокарте. Для FirePro W9100 активируется мини-драйвер с двойной точностью вычислений, Radeon R9 же работает через обычный DirectX с одинарной точностью. Поэтому на профессиональной карте дизайнеры получают в окнах проекции более точную и аккуратную картинку, обновление и вращение которой при этом выполняется с очень хорошей скоростью.
Что же касается остальных аспектов производительности в 3ds max, то соотношение результатов получается следующим:
При обычной работе с моделями скорость FirePro W9100 находится на примерно том же уровне, что и у Quadro K5000. В рендеринге на GPU ускоритель NVIDIA сильнее, зато у FirePro W9100 лучше обстоит дело с шейдерной производительностью. По сравнению с тем, как проявляли себя в этом случае профессиональные карты AMD раньше, это – большой шаг вперёд, который компания смогла совершить в первую очередь благодаря сделанной оптимизации своих графических драйверов. Иными словами, по уровню внимания к своему программному обеспечению AMD начинает догонять NVIDIA, что является отличной новостью для профессиональных пользователей пакетов для трёхмерного проектирования и моделирования.
Autodesk AutoCAD 2015 Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX – это AutoCAD. Ранее мы видели, что профессиональные графические ускорители работают в этом пакете не лучше игровых, поэтому целесообразность использования дорогих карт класса FirePro и Quadro в данном случае находилась под вопросом. С момента нашего прошлого тестирования версии пакета AutoCAD обновились дважды, но эта странная особенность сохранилась.
Что же касается производительности FirePro W9100, то, как в 2D, так и в 3D, этот ускоритель выступает примерно на одном уровне с Quadro K5000.
Однако при использовании разных режимов отображения моделей между решениями AMD и NVIDIA находятся серьёзные отличия.
Ускоритель FirePro W9100 хорош для самого простого – каркасного и самого сложного – реалистичного режима, в то время как Quadro K5000 может обеспечить более высокую производительность при использовании «промежуточных» видов отображения рабочих моделей – Hidden и Conceptual.
MAXON Cinema 4D (CINEBENCH R15) Для исследования производительности в популярном пакете для построения трёхмерных моделей и анимации Maxon CINEMA 4D был использован специально предназначенный для этих целей тест CINEBENCH. Недавно этот бенчмарк обновился и теперь он использует движок от современной версии родительского пакета, поэтому он хорошо применим для получения представления о том, насколько быстро профессиональные видеокарты способны работать в CINEMA 4D R15 и R16.
Этот тест, опирающийся на программный интерфейс OpenGL, присваивает более высокий индекс производительности видеокарте FirePro W9100, которая обладает лучшей скоростью отрисовки графических примитивов и с теоретических позиций.
PTC Creo Parametric 2.0 Система автоматизированного проектирования Creo – очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. Используемый нами бенчмарк оперирует моделью автомобиля, состоящего примерно из тысячи деталей и требующей около 1 Гбайта видеопамяти. При этом он максимально задействует функциональность этого пакета, включая режимы затенения с гранями и затенения с отражениями, отображение моделей со скрытыми поверхностями и без них, полноэкранное сглаживание вплоть до 8x и высококачественную отрисовку рёбер.
До этого мы уже видели результат SPECviewperf, поэтому к тому, что FirePro W9100 проиграет Quadro K5000, были морально готовы. Очевидно, что AMD пока недостаточно хорошо оптимизировала свои драйвера для нагрузки, характерной для этого инженерного приложения. Однако следует подчеркнуть, что качественная работа профессиональных карт именно в Creo остаётся одним из важных приоритетов для разработчиков AMD. Поэтому мы ожидаем, что в будущих релизах драйвера ситуация может перемениться.
Любопытно, что игровая видеокарта Radeon R9 290X предлагает в Creo даже более высокое быстродействие, нежели FirePro W9100. Однако нужно иметь в виду, что функциональность игрового ускорителя в этой системе автоматизированного проектирования несколько ограничена. Например, режим отображения с прозрачностью – Order Independent Transparency (OIT) – в полной мере поддерживается только профессиональным акселератором, так что полноценная инженерная работа в Creo доступна лишь только тем пользователям, которые не скупятся на приобретение дорогостоящего специализированного оборудования.
Autodesk Maya 2015 Популярный редактор трёхмерной графики Maya 2015 – это хороший пример типичного профессионального приложения, использующего интерфейс OpenGL. Несколько лет назад в Maya были особенно сильны видеокарты AMD, потом они сдали свои позиции, но с выходом FirePro W9100 с архитектурой Hawaii ситуация постепенно возвращается на круги своя.
FirePro W9100 работает быстрее Quadro K5000, но преимущество не слишком значительно.
В целом, соотношение результатов графических ускорителей AMD и NVIDIA в различных режимах отображения не слишком отличается. FirePro W9100 проигрывает Quadro K5000 лишь в единственном случае – при работе с каркасными моделями.
Solidworks 2013 SolidWorks — чрезвычайно популярный программный комплекс САПР для автоматизации работ промышленного предприятия на этапах конструкторской и технологической подготовки производства. Бенчмарк SPEC для этого пакета хорошо нагружен задействованием различных графических функций видеокарт. Модели, входящие в этот тест, достаточно сложны и включают до 2,25 миллионов треугольников.
Начать следует с того, что в SolidWorks 2013 мы не смогли снять результат игровой графической карты. Дело в том, что на Radeon R9 290X не работает один из важнейших режимов SolidWorks – RealView. Что же касается скорости работы FirePro W9100, то эта профессиональная карта AMD уступила Quadro K5000. Однако интегральный показатель производительности в данном случае плохо отражает общую картину. Большинство функций SolidWorks на ускорителе серии FirePro работает быстрее.
Самые ресурсоёмкие режимы на FirePro W9100 функционируют быстрее, а Quadro K5000 добивается преимущества лишь при работе с затенениями и при отключении современной функции RealView.
Вычисления на GPU Профессиональные графические карты стали нередко использоваться и при финальном рендеринге. Многие алгоритмы рендеринга свободно переносятся на параллельные процессоры GPU, и за счёт этого получают возможность более эффективного исполнения. Одним из примеров движков рендеринга, способных использовать мощности графических карт через универсальный программный интерфейс OpenCL, выступает LuxRender, строящий изображения методом трассировки лучей. LuxRender имитирует распространение света в реальности при помощи специальных алгоритмов и существует в версиях для следующего специализированного ПО: Blender, 3dsmax, SketchUp, C4D, XSI, Poser и др.
Для тестирования скорости работы LuxRender мы воспользовались специализированным тестовым приложением LuxMark 2.0 и сценой средней сложности Sala, состоящей из 488 тысяч треугольников.
Графическая архитектура GCN смотрится при нагрузке такого рода наиболее выигрышно. FirePro W9100 на пару с Radeon R9 290X опережают Quadro K5000 более чем вдвое. Что, впрочем, вполне объяснимо превосходством карт AMD в теоретической вычислительной производительности.
Вторым тестом, на базе которого мы делали выводы о вычислительной производительности, стал BasemarkCL компании Rightware. Этот тест оценивает скорость работы графических процессоров при очень разносторонней нагрузке: при математическом моделировании физических процессов, при редактировании изображений, при обработке видео и при фрактальных операциях. Тестируемые графические акселераторы показали в этом тесте следующие результаты.
К сожалению, в нашем тесте не приняла участие видеокарта Quadro K6000 – компания NVIDIA не смогла предоставить необходимый образец. А Quadro K5000 основывается на урезанном GPU с существенно ограниченной вычислительной мощностью. Поэтому совершенно не удивительно, что результаты профессиональной карты NVIDIA здесь такие низкие. Зато FirePro W9100 в вычислительных OpenCL-задачах выглядит просто превосходно. Правда, Radeon R9 290X ещё быстрее, но тут надо понимать, что все наши тесты используют одинарную точность вычислений, и именно поэтому игровая карта выступает наравне с профессиональной. Если бы речь шла о вычислениях с удвоенной точностью, то результат Radeon на базе чипа Hawaii был бы примерно вчетверо ниже, чем у FirePro W9100.
Редактирование видео С ростом типичных разрешений видео и увеличением сложности различных эффектов, профессионалы, занимающиеся созданием и обработкой контента, стали остро нуждаться в собственных ускорителях вычислений. Профессиональные графические карты неплохо подходят на эту роль: их потоковые процессоры прекрасно справляются как с кодированием, так и с наложением видеоэффектов. Первой о возможности применения графических ускорителей при обработке видео заговорила NVIDIA, но теперь необходимые возможности могут предложить как карты серии Quadro, так и FirePro.
Для оценки потенциала профессиональных акселераторов при обработке видео мы воспользовались популярным пакетом нелинейного видеомонтажа Adobe Premiere CC Pro, в котором проводили рендеринг ролика с наложением различных эффектов. На следующей далее диаграмме приводится время рендеринга тестовой задачи с использованием Mercury Playback Engine с GPU-ускорением, работающим через CUDA в случае Quadro и через OpenCL в случае FirePro.
FirePro W9100 и Quadro K5000 выдают почти одинаковую производительность в Adobe Premiere CC Pro, однако предложение NVIDIA смотрится всё-таки несколько выигрышнее. Вероятно, дело тут в том, что оптимизацию своего пакета под CUDA компания Adobe начала значительно раньше, чем внедрила поддержку OpenCL, появившуюся лишь недавно. Поэтому эффективность решений NVIDIA и оказывается выше.
Кроме того, на данный момент совместимость с OpenCL получили далеко не все творческие пакеты Adobe, например, рендеринг методом трассировки лучей в Adobe After Effect может быть ускорен лишь на картах NVIDIA. Иными словами, пока профессионалам, работающим с приложениями Adobe, мы бы приобретать карты семейства FirePro не советовали.
Если же речь идёт о работе в пакетах нелинейного видеомонтажа других разработчиков, например, Sony Vegas 13, то ситуация в корне меняется.
Здесь более высокой скоростью работы могут похвастать видеокарты AMD, они увеличивают скорость рендеринга лучше конкурирующего решения. Иными словами, как в приложениях автоматизированного проектирования и трёхмерного моделирования, в задачах обработки видеоконтента наиболее подходящий ускоритель следует подбирать под конкретный программный пакет – универсального решения не существует.
Futuremark 3DMark Хотя профессиональные ускорители практически никогда не используются для игр, мы решили добавить результат популярного игрового теста FutureMark 3DMark Fire Strike, который может позволить взглянуть на участников сегодняшнего тестирования под другим углом.
Карты компании AMD, участвующие в настоящем тестировании, обладают более высоким уровнем игровой производительности. Это вполне логично, если вспомнить, что они основываются на флагманском GPU компании AMD – Hawaii XT, а видеокарта Quadro K5000 – базируется на графическом процессоре GK104 и является профессиональным аналогом GeForce GTX 770.
Любопытно, что в 3DMark Fire Strike мы наблюдаем почти двукратное различие в производительности FirePro W9100 и Quadro K5000. Однако в профессиональных приложениях такое соотношение результатов встречается крайне редко. Одна из причин состоит в том, что в инженерных пакетах аппаратные возможности ускорителей, особенно в части мощности шейдерного домена, — далеко не самый важный из факторов, определяющих быстродействие. Гораздо большее значение имеет оптимизация драйвера и общая сбалансированность характеристик ускорителя. Очевидно, NVIDIA удаётся использовать аппаратные возможности своих профессиональных решений эффективнее, чем её конкуренту. Однако карты AMD имеют более высокий потенциал, который может быть раскрыт позднее, с выходом новых версий драйверов и программного обеспечения.
Энергопотребление
В этом разделе мы приводим фактический уровень энергопотребления полных систем (без монитора), оснащённых различными профессиональными видеокартами. На следующих ниже графиках, если иное не оговаривается отдельно, приводится полное потребление систем (без монитора), измеренное на выходе из розетки, в которую подключен блок питания тестовой системы, и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. В суммарный показатель автоматически включается и КПД самого блока питания, однако учитывая, что используемая нами модель БП, Seasonic Platinum SS-760XP2, имеет сертификат 80 Plus Platinum, его влияние должно быть минимально.
Измерения выполнялись как в состоянии покоя, так и под нагрузкой — во время прохождения теста FurMark 1.13.0, запущенного в режиме «Burn» в окне с разрешением 1280х720. Этот тест хорош тем, что, как и большинство профессиональных приложений, использует OpenGL, а кроме того, он создаёт существенную нагрузку на видеоподсистему.
На данный момент ситуация такова, что компания NVIDIA уделяет больше внимания энергоэффективности своих профессиональных карт. К тому же, с точки зрения производительности, Quadro K5000 относится к немного более низкому классу, чем FirePro W9100. Именно поэтому разница в энергетических аппетитах сравниваемых графических карт профессионального назначения под нагрузкой почти достигает двукратной величины. Потребление системы с FirePro W9100 при графической нагрузке может достигать 317 Вт – и это достаточно высокое значение, свидетельствующее о правомерности 275-ваттного TDP, установленного для этой карты. В то же время Radeon R9 290X, имеющий более высокую частоту графического ядра требует ещё больше энергии.
Любопытно, что установка на плату FirePro W9100 16 Гбайт видеопамяти практически не сказывается на максимальном уровне энергопотребления. Но вот в состоянии простоя в 2D-режиме эта карта потребляет явно больше других вариантов с меньшим объёмом памяти.
Получить представление о температурном режиме и алгоритме работы вентилятора у FirePro W9100 можно из следующего скриншота, снятого при выполнении теста FurMark 1.13.0.
Как нетрудно заметить, максимальная температура графического ядра FirePro W9100 не превышает 94 градусов. Это достигается за счёт варьирования скорости вентилятора, который, как оказывается, в реальной жизни оказывается способен разгоняться до 2500 оборотов в минуту. Кроме того, при высокой нагрузке видеокарта снижает частоту GPU со штатных 930 МГц. Сначала до 824 МГц, а порой и до 774 МГц.
Выводы
После знакомства с новым высокопроизводительным профессиональным ускорителем FirePro W9100, никаких сомнений в том, что AMD действительно решила серьёзно заняться покорением рынка профессиональной графики, не остаётся. FirePro W9100 – это именно такой флагман, которого остро не хватало AMD раньше. Данная карта, основанная на графическом чипе Hawaii, значительнее производительнее своих Tahiti-предшественников. Благодаря этому она может на равных противостоять профессиональным графическим ускорителям NVIDIA как практически в любых приложениях для автоматизированного проектирования и трёхмерного моделирования, так и в задачах, способных задействовать мощности графического процессора для вычислений общего назначения. При этом следует отдать должное AMD: свой здравый подход к ценообразованию она распространила и на FirePro W9100. Эта карта продаётся существенно дешевле Quadro K6000, что делает её очень выгодным вариантом для рабочей станции.
При этом у FirePro W9100 есть целый ряд уникальных достоинств. Она оборудована 16 Гбайт видеопамяти, без проблем позволяя оперировать огромными объёмами данных и текстур. Она может работать с шестью 4K-мониторами одновременно. А высокая вычислительная производительность на операциях двойной точности делает её очень эффективной при разного рода расчётах, например, в задачах математического моделирования в аэро- или гидродинамике. Со всех перечисленных точек зрения альтернатив у FirePro W9100 попросту нет, и именно поэтому данное решение для профессионалов заслуживает самого пристального внимания.
Расстраивает лишь то, что уровень поддержки OpenCL ещё не слишком высок и этот программный интерфейс проигрывает в распространённости продвигаемой NVIDIA архитектуре CUDA. Однако, учитывая, что OpenCL движется на рынок не только через профессиональную графику, но и по более простому пути – через APU – можно быть практически уверенным, что внедрение повсеместной поддержки OpenCL – дело ближайших лет.
В итоге, мы не можем сказать, что FirePro W9100 подойдёт всем без исключения профессионалам. Но набор задач, для которых этот графический акселератор может стать хорошим выбором, очень широк и разнообразен. И, конечно же, FirePro W9100 хорошо подходит для инженерных пакетов автоматизированного проектирования и трёхмерного моделирования. В качестве примеров можно отметить высокую скорость FirePro W9100 в 3ds max при работе со сложными моделями, в Cinema4D и в Maya. Высокие результаты эта плата показала и при визуализации медицинских и геологических приложений. Должны остаться довольны быстродействием FirePro W9100 и те инженеры, которые работают в Siemens NX или Catia.
Впрочем, окончательную точку ставить пока рано. В сентябре NVIDIA частично обновит свою линейку профессиональных видеоакселераторов, и, возможно, сможет противопоставить FirePro W9100 какие-то свои новые предложения. Поэтому, в скором времени мы вернёмся к тестам профессиональной графики.