Профессиональные видеокарты NVIDIA Quadro P6000 и P5000: обзор и тестирование

Автор: Gavric
Дата: 08.02.2017
Все фото статьи

Введение


Архитектура NVIDIA Pascal уже далеко не в новинку: первые продукты на её основе в виде ускорителей вычислений Tesla и игровых видеокарт GeForce GTX тысячной серии появились на рынке весной 2016. И вполне закономерно, что со временем графические процессоры наиболее современного поколения добрались и до линейки Quadro, которая объединяет ускорители для рабочих станций. Формально они были объявлены ещё полгода назад, на конференции SIGGRAPH 2016, однако в реальности путь новых профессиональных графических решений на рынок оказался не таким быстрым из-за необходимости оптимизации программного обеспечения и сертификации ускорителей у разработчиков инженерных пакетов. В результате, реальное появление новых карт Quadro, построенных на GPU семейства Pascal, состоялось только теперь. А раз так, то самое время подробно познакомиться с теми возможностями, которые они предлагают. Примерно полгода тому назад мы подробно тестировали всю линейку современных графических ускорителей Quadro, но самые свежие её представители тогда основывались на архитектуре Maxwell 2. Теперь же настало время посмотреть, насколько сильно шагнул прогресс в области профессиональной графики за самое последнее время.


В части профессиональных графических решений NVIDIA старается выдерживать не слишком интенсивный график обновлений флагманских продуктов. Новые версии высокопроизводительных видеокарт для рабочих станций выходят в среднем раз в два года. Но сказать, что кто-то сильно проигрывает от такого размеренного темпа, было бы совершенно неверно. Конечно можно думать, что постоянные смены лидеров в линейке Quadro не происходят из-за того, что NVIDIA смогла занять чуть ли не монопольное положение на рынке графических ускорителей для инженерного применения. И скорее всего, такая аргументация тоже имеет какое-то значение. Но более важную роль здесь играет другой мотив: флагманские карты семейства Quadro – весьма дорогостоящие продукты, поэтому их покупатели нуждаются в защите инвестиций, и подталкивать их к частой модернизации систем – не самый правильный подход, который вряд ли пробудит у них лояльность. Поэтому нет ничего удивительного в том, что прошлый флагманский ускоритель Quadro M6000, который относится к поколению Maxwell 2, пришёл на рынок в начале 2015 года, и с тех пор он неизменно оставался лучшим вариантом для систем трёхмерного моделирования и автоматизированного проектирования. Правда, в начале 2016 в ответ на появление AMD FirePro W9100 его косметически обновили добавлением видеопамяти, но что-то принципиально лучшее для рабочих станций – новый ускоритель Quadro P6000 – NVIDIA выпустила лишь сейчас.

Погоня за высокой производительностью в сфере профессиональных ускорителей постепенно утрачивает смысл и по другой причине. Дело в том, что нагрузка, которую создают CAD/CAM-системы в окнах проекции, не столь высока для того, чтобы вскрывать недостаток быстродействия даже у видеокарт уровня ближе к среднему. Как показывают проводимые нами тестирования, оптимальную производительность в системах трёхмерного моделирования и автоматизированного проектирования показывают ускорители класса Quadro M4000. Более же мощные видеокарты могут быть нужны лишь при работе с очень сложными высокодетализированными моделями, которые редко встречаются в реальной жизни. И эта ситуация не меняется ни с выходом новых версий программных пакетов, ни с переходом в 4K-разрешения, ни со включением сглаживания линий. Рабочая среда CAD/CAM-систем порождает сравнительно простую графическую нагрузку, суть которой, фактически, сводится к элементарным геометрическим преобразованиям, наложениям несложных текстур и использованию простых моделей освещённости. Ни о каких же шейдерных операциях или о какой-либо постобработке, естественно, речь почти никогда не идёт. Поэтому многие профессиональные инженеры попросту не имеют стимула к модернизации своих систем и к миграции на новые флагманские ускорители.


Тем не менее, NVIDIA достаточно эффективно борется с последней тенденцией, открывая перед высокопроизводительными графическими ускорителями серии Quadro, о которых идёт речь в данной статье, новые сферы применения. Сегодняшние Quadro – это уже не простое аппаратное средство для повышения комфорта при работе в окнах проекции CAD/CAM-систем. Теперь эти ускорители готовы взвалить на себя и задачи финального рендеринга, и математического моделирования, и даже создания и обработки мультимедийного контента. Иными словами, современные профессиональные ускорители Quadro – это уже не просто узкоспециализированные видеокарты. Сегодня они претендуют на то, чтобы стать куда более универсальными рабочими инструментами для инженеров, дизайнеров, специалистов по моделированию или монтажёров. Поэтому в нашем очередном тестировании мы наряду с традиционной проверкой скорости работы новинок в окнах проекции взглянем и на открывающиеся возможности в других областях.

NVIDIA Quadro P6000 и P5000 в подробностях


В то время как с игровыми видеокартами NVIDIA старается проводить смену поколений архитектуры во всех ценовых сегментах в достаточно сжатые сроки, в части профессиональных ускорителей компания придерживается противоположной стратегии. К данному моменту компанией NVIDIA начаты продажи только двух ускорителей серии Quadro, основанных на архитектуре Pascal. Это – флагманская модель P6000 и субфлагман P5000, которые приходят на смену предшественникам Quadro M6000 и M5000. Более же дешёвые профессиональные видеокарты пока продолжают основываться на процессорах поколения Maxwell. Причём, такая ситуация сохранится ещё как минимум пару месяцев. Хотя NVIDIA уже анонсировала младшие Quadro на базе Pascal, в продаже они пока недоступны.


И причины такого подхода хорошо понятны. Переход с Maxwell на Pascal приносит с собой очень заметный прирост производительности, поэтому внедрение нового GPU в ускорителях среднего уровня моментально «обесценит» видеокарты, которые ещё совсем недавно было принято считать лучшими профессиональными ускорителями. С флагманами же проще – произошедший в P6000 и P5000 значительный прирост производительности лишь переводит Quadro M6000 и M5000 на более низкий уровень, но не делает их категорически устаревшими и бессмысленными.

Оценить, насколько более высоким потенциалом обладают новинки, можно из следующей таблицы, в которой мы сопоставили их характеристики с характеристиками предшественниц.


Итак, самая быстрая на данный момент видеокарта для графических рабочих станций – это Quadro P6000. Она основывается на процессоре GP102 – самом мощном варианте Pascal из числа чипов, ориентированных на работу с GDDR5X-памятью. Именно этот GPU, а не «суперкомпьютерный» GP100, следует считать прямым потомком процессора GM200, использовавшегося в основе Quadro M6000. Поэтому нет ничего удивительного, что по сравнению с прошлым флагманским профессиональным ускорителем видеокарта Quadro P6000 существенно нарастила свою вычислительную мощность: количество CUDA-ядер выросло на четверть.


Такое усиление сделало из Quadro P6000 самую быстродействующую видеокарту не только по меркам профессиональных решений. Впервые решение из линейки Quadro оказалось даже мощнее TITAN X. В P6000 процессор GP102 используется «на полную», и в нём активированы все заложенные в архитектуре 30 потоковых мультипроцессоров. TITAN X же, напомним, имеет лишь 28 активных мультипроцессоров, и по этой причине он несколько слабее профессионального флагмана.


Выигрышно смотрится Quadro P6000 и по объёму памяти. Видеокарта оборудована 24 Гбайт GDDR5X SDRAM, работающей при достаточно консервативной эффективной частоте 9 мегатрансферов в секунду, что при условии 384-битной шины даёт суммарную пропускную способность на уровне 432 Гбайт/с. По сравнению с обновлённой версией Quadro M6000 объём памяти остался тем же, зато её скорость за счёт использования GDDR5X заметно выросла. Причём 24-гигабайтная версия M6000 появилась на рынке сравнительно недавно, и число владельцев такой карты не столь высоко. Более же массовая вариация этой карты довольствовалась 12 Гбайт памяти, поэтому большинство владельцев мощных рабочих станций при переходе на Quadro P6000 получат не только прирост показателей производительности, но и увеличенную память, которая может быть полезна при работе с масштабными цифровыми проектами машин и механизмов. Как и раньше, память в Quadro P6000 поддерживает ECC, причём, поскольку сами чипы GDDR5X коррекцию ошибок не поддерживают, это – программная и активируемая на уровне драйвера функция.


Примечательно, что беспрецедентное быстродействие нового профессионального флагмана сочетается с достаточно умеренными энергетическими аппетитами. Паспортное значение теплового пакета Quadro P6000 установлено в традиционные для карт такого уровня 250 Вт, а система охлаждения, включающая закрытый металлическим кожухом радиатор и центробежный вентилятор, полностью позаимствована с M6000. Более того, P6000 удаётся обходится единственным 8-контактным разъёмом питания. Это несколько расходится со спецификациями (формально 8-контактный разъём рассчитан на 150 Вт мощности, а через слот PCIe x16 может подводиться до 75 Вт), но при реальном использовании проблем видеокарты в деле не наблюдается. Зато достигается полная обратная совместимость: в рабочей станции, где использовалась Quadro M6000, заменить её на новую P6000 не составит никакого труда.

Поскольку NVIDIA заявляет о том, что расчётная производительность Quadro P6000 на операциях 32-битной разрядности превышает 12 Тфлопс, можно сделать заключение о том, что новый флагман на 80 процентов производительнее предшественницы в вычислительном плане, в то время как превосходство в скорости растеризации составляет лишь порядка 48 процентов. Преимущество Quadro P6000 над TITAN X тоже впечатляет: игровой флагман имеет пиковую FP32-производительность лишь на уровне 11 Тфлопс.

Правда, столь радужные показатели пикового теоретического быстродействия несколько омрачает ситуация со скоростью исполнения 16- и 64-битных операций. В каждом шейдерном мультипроцессоре чипа GP102 на 128 CUDA-ядер для FP32-операций приходится лишь 4 ядра для FP64. И это значит, что производительность Quadro P6000 при работе с числами двойной точности соотносится со скоростью операций одинарной точности как 1:32. Здесь по сравнению с Quadro M6000 никаких изменений не произошло, а значит, самой быстрой видеокартой серии Quadro для 64-битных вычислений остаётся старушка Quadro K6000. Нет в Quadro P6000 и ускорения операций половинной точности FP16. Лишь одно из CUDA-ядер каждого шейдерного мультипроцессора аппаратно поддерживает такие операции, поэтому чип GP102 исполняет их в 64 раза медленнее, чем FP32-инструкции. И это значит, что для сложных физических расчётов карты серии Quadro подходят плохо, это – именно графический ускоритель, в котором поддержка FP16 и FP64 введена лишь для совместимости. Впрочем, не стоит забывать о специализированных ускорителях Tesla P100: именно они, а не Quadro, позиционируются NVIDIA как актуальные решения для суперкомпьютерных применений, и вот у них уже со скоростью FP16- и FP64-операций всё в порядке.

Вместе с флагманом Quadro P6000 компания выпустила и второй профессиональный графический ускоритель попроще – Quadro P5000. И в то время как P6000 – это самая быстрая на сегодняшний день видеокарта, P5000 выступает более массовой и дешёвой её альтернативой. Актуальная стоимость P6000 составляет около $5400, P5000 же, располагающую той же современной архитектурой Pascal, можно приобрести более чем вдвое дешевле – за сумму порядка $2500. Однако столь радикальное отличие в цене возникло не на пустом месте. В то время как Quadro P6000 – это флагманская видеокарта на базе полностью разблокированного чипа GP102, превосходящая TITAN X, P5000 – всего лишь профессиональный аналог GeForce GTX 1080, основанный на более простом GPU GP104.


В Quadro P5000 используется полная версия графического процессора GP104, а значит, эта видеокарта может предложить в распоряжение пользователя 20 шейдерных мультипроцессоров или 2560 CUDA-ядер – на четверть больше, чем было у Quadro M5000. Однако основной козырь данной профессиональной видеокарты не в экстенсивном наращивании числа CUDA-ядер. Так же, как и в случае с другими продуктами поколения Pascal, переход при производстве GPU на 16-нм техпроцесс позволил NVIDIA кардинально нарастить тактовые частоты. И в результате по пиковой вычислительной мощности Quadro P5000 обходит прошлую карту этого же класса, M5000, более чем в два раза, а превосходство новинки в скорости растеризации достигает 67 процентов. Прогресс более чем впечатляющий – до сих пор такого роста скоростных показателей всего за одну итерацию развития архитектуры в сфере графических ускорителей для рабочих станций мы ещё не встречали.


Заметно улучшилась в Quadro P5000 и подсистема видеопамяти. Её объём возрос до 16 Гбайт, а частота была доведена до тех же, что и у P6000, 9 мегатрансферов в секунду. Естественно, это потребовало перехода на GDDR5X, однако при этом используется лишь 256-битная шина. В результате, прирост в пропускной способности памяти по сравнению с M5000 получился не таким впечатляющим – всего лишь на уровне 36 процентов. Тем не менее, переход с M5000 на P5000 наверняка впечатлит профессионалов, работающих с CAD/CAM-системами: суммарные улучшения в производительности отрицать невозможно.


Правда, попутно выросло и энергопотребление. Для Quadro P5000 теперь установлен 180-ваттный тепловой пакет, и для подключения дополнительного питания используется один 8-контактный разъём. По габаритам и конструкции системы охлаждения Quadro P5000 похожа на P6000, но её кожух выполнен не из металла, а из пластика и лишён прозрачного окошка, открывающего вид на рёбра радиатора.

Помимо серьёзного прироста в производительности, привнесённого переводом профессиональных карт на архитектуру Pascal, новые видеокарты Quadro P6000 и P5000 могут похвастать и набором новых функциональных возможностей.

Одно из самых важных нововведений – это появление в картах семейства Pascal нового дисплейного контроллера. И хотя на первый взгляд новые Quadro P6000 и P5000, как и раньше, несут на себе порт DVI и по четыре выхода DisplayPort, теперь эти выходы соответствуют стандарту DisplayPort 1.4, который совместим с более высокими разрешениями и частотами кадровой развёртки. В результате в то время, как к профессиональным картам прошлого поколения можно было подключить до четырёх 4K-мониторов с частотой кадров 60 Гц, Quadro P6000 и P5000 могут работать с четырьмя 60-герцовыми 5K-мониторами (5120 × 2880), с четырьмя 120-герцовыми 4K-мониторами или даже с перспективными 8K-мониторами (7680 × 4320), например, с недавно анонсированным Dell UP3218K.


Кроме того, развивая возможности по обслуживанию мультимониторных конфигураций, для Quadro P6000 и P5000 компания NVIDIA предложила новую плату Quadro Sync, необходимую для синхронизации изображений, выводимых несколькими установленными в одной системе профессиональными видеокартами. Новая плата Quadro Sync II может работать с вдвое большим числом видеокарт поколения Pascal – их число теперь может доходить до восьми. И если принять во внимание возможность подключения к каждой видеокарте до четырёх мониторов, то получится, что современные технологии NVIDIA позволяют суммарно подсоединить к одной системе до 32 синхронизированных мониторов, которые могут быть объединены в единое рабочее пространство при помощи программного обеспечения NVIDIA Mosaic.


NVIDIA Quadro Sync II

Перекочевала в профессиональные карты семейства Pascal и технология Simultaneous Multi-Projection (SMP), которая позиционируется как шаг навстречу виртуальной реальности. Она позволяет за один проход рассчитывать геометрию сразу нескольких проекций сцены из разных точек. Основное применение этой возможности в случае игровых карт относится к поддержке VR-очков. Но в продуктах серии Quadro появление поддержки SMP может сделать их весьма удобным инструментом и для обслуживания комнат виртуальной реальности (CAVE).

В итоге, получилось так, что новые Quadro P6000 и P5000 ушли далеко вперёд по сравнению со своими предшественниками. Обе новинки выглядят не как простое плановое обновление линейки, они серьёзно повышают планку производительности и возможностей карт серии Quadro и, фактически, могут считаться революционным прорывом. По всем теоретическим показателям кроме объёма памяти P5000 выглядит даже лучше, чем M6000, а это значит, что профессиональным пользователям высокопроизводительных рабочих станций самое время задуматься о модернизации. И ещё больше аргументов в её пользу мы представим в тестировании, речь о котором пойдёт дальше.

Как мы тестировали


Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на восьмиядерном процессоре Intel Core i7-6900K с архитектурой Broadwell-E, работающем на частотах 3,2-3,7 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel X99 и 32 Гбайт скоростной четырёхканальной памяти стандарта DDR4-2666 SDRAM. Вместе с профессиональными видеокартами, относящимися к поколению Pascal, в сравнении приняли участие флагманские карты предыдущего поколения, а кроме того, в некоторых тестах помимо видеоускорителей семейства Quadro участие приняла и игровая видеокарта GeForce GTX 1080.

Таким образом, для тестов было задействовано следующее оборудование:

Процессор: Intel Core i7-6900K (Broadwell-E, 8 ядер + HT, 3,2-3,7 ГГц, 20 Мбайт L3).
Процессорный кулер: Noctua NH-D15.
Материнская плата: ASUS X99-Deluxe (LGA2011-v3, Intel X99).
Память: 4 × 8 Гбайт DDR4-2666 SDRAM, 15-15-15-35 (2 x Patriot Viper 4 PV416G300C6K).
Видеокарты:

NVIDIA Quadro P6000;
NVIDIA Quadro P5000;
NVIDIA Quadro M6000 24 Гбайт;
NVIDIA Quadro M5000;
NVIDIA GeForce GTX 1080.

Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование проводилось в операционных системах Windows 7 Professional SP1 x64 и Microsoft Windows 10 Enterprise Build 10240.
Использовавшиеся версии драйверов:

Intel Chipset Driver 10.1.2.80;
Intel Management Engine Interface Driver 11.0.0.1172;
Intel Turbo Boost Max Driver Version 1.0.1.9;
NVIDIA Quadro Driver Release 376.62.

Тестирование видеокарт происходило в разрешении 3840 × 2160 с отключенным параметром Vsync. Выбор 4K-разрешения обусловлен тем, что в FullHD-разрешении флагманские профессиональные видеокарты не могут раскрыть свой потенциал: производительность в этом случае ограничивается мощностью процессора, и результаты более быстродействующих решений не отличаются от показателей более слабых видеокарт. Кроме того, 4K-мониторы стали негласным стандартом для высокопроизводительных рабочих станций, на которые и нацеливаются предложения класса Quadro P6000 и P5000.

Для тестирования производительности в CAD/CAM-пакетах Autodesk 3ds max, Autodesk Maya, Dassault Systèmes SolidWorks и в PTC Creo использовались тесты, специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC). Для оценки скорости работы в Autodesk AutoCAD использовался тест Cadalyst Systems Benchmark. Скорость рендеринга оценивалась с помощью доступных в сети тестов и проектов, а кроме того, для оценки 3D-производительности мы применяли также и популярные бенчмарки компании Futuremark.

Производительность в CAD/CAM-пакетах



SPECviewperf 12.1

При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя типовую нагрузку, этот тест показывает «чистую геометрическую» производительность ускорителей при работе через OpenGL и DirectX, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных трасс – последовательностей команд, задающих визуализацию сложных моделей, характерных для тех или иных профессиональных приложений.

Встроенные в SPECviewperf используемой нами двенадцатой версии скрипты воссоздают деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): 3ds max 2016 (3dsmax-05), CATIA V6 R2012 (catia-04), Creo 2 (creo-01), Energy – абстрактный программный пакет для геологоразведки месторождений нефти и газа (energy-01), Maya 2013 (maya-04), Medical – проприетарное программное обеспечение для объёмного рендеринга изображений, формируемыми KT и МРТ сканерами (medical-01), Showcase 2013 (showcase-01), Siemens NX 8.0 (snx-02), Solidworks 2013 SP1 (sw-03). Результатом тестов выступает частота кадров при работе с теми или иными моделями. Тест выполнялся в разрешении 3840 × 2160.


















Результаты, которые выдают новые профессиональные видеокарты поколения Pascal в SPECviewperf, хорошо иллюстрируют тот значительный рывок в производительности, который произошёл в новинках по сравнению с Quadro семейства Maxwell 2. Раньше при очередной смене поколений новая видеокарта субфлагманского позиционирования всегда выдавала скорость на уровне флагмана прошлого поколения, но сегодня картина совершенно иная. Действительно, Quadro M6000 оказывается повержена не только новым флагманом P6000, но и гораздо более дешёвой новинкой Quadro P5000. Таким образом, обладатели топовой профессиональной видеокарты поколения Maxwell 2 могут перейти на P5000 и при этом получить примерно 20-процентный прирост производительности.

Что же касается Quadro P6000, то от неё мы можем получить такой уровень быстродействия, который ранее можно было получить лишь в системах, использующих как минимум пару высокопроизводительных видеоакселераторов. Шутка ли, но в некоторых тестах, преимущество P6000 над M6000 может доходить до 80 процентов. В среднем же Quadro P6000 оказывается мощнее предшественницы где-то в полтора раза. Что вполне объяснимо изменившемся подходом NVIDIA к проектированию флагманских профессиональных видеоускорителей. Ведь сегодня старшая видеокарта Quadro – это самая быстрая видеокарта вообще, которая базируется на самой полновесной версии старшего графического процессора GP102 и имеет более высокую мощность даже по сравнению с TITAN X.

Впрочем, в полной мере при выборе графического ускорителя опираться на результаты SPECviewperf не стоит. Всё-таки этот бенчмарк имеет синтетическую природу, не учитывает нюансов конкретных приложений и почти не задействует сложные шейдерные эффекты, которые постепенно начинают использоваться для визуализации в том числе и профессиональными пакетами. Поэтому большое внимание мы уделили исследованию производительности в реальных приложениях для трёхмерного моделирования и автоматизированного проектирования.

Autodesk 3ds Max 2015

Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи теста SPEC, который объединяет в себе 48 различных подтестов, направленных на комплексные измерения скорости моделирования, интерактивной графики и визуальных эффектов. Используемая нами версия этого бенчмарка работает с 3ds max 2015 SP4. Это –достаточно свежая версия пакета, а значит, в тесте задействуются новые шейдеры DirectX 11, векторные карты, новый движок визуализации окон проекции Nitrous и многие другие современные динамические и визуальные эффекты. Тесты проводились в разрешении 3840 × 2160 без сглаживания и со сглаживанием 8x.


Мы отказались от тестирования флагманских профессиональных видеокарт в FullHD-разрешении, потому что в нём четвёрка испытуемых ускорителей выдаёт практически одинаковые результаты. Зато в 4K-режиме, который уже стал для профессиональных инженеров, фактически, отраслевым стандартом, выгода от применения более новых и более мощных ускорителей видна очень хорошо. Здесь мы вновь можем наблюдать подавляющее преимущество архитектуры Pascal, которое делает Quadro P5000 более быстрой картой даже по сравнению с Quadro M6000. Что же касается Quadro P6000, то в особенно тяжёлых графических режимах с полноэкранным сглаживанием она способна обеспечить 40-процентное превосходство по сравнению с M6000 в скорости работы в окнах проекции.

Более подробные данные о скорости работы новинок при различных аспектах нагрузки можно получить на следующих диаграммах.









Autodesk AutoCAD 2016

Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX – это AutoCAD. Нагрузка на ускорители, создаваемая этим пакетом, не слишком велика, и с работой в нём прекрасно справляются даже игровые графические карты, но, тем не менее, разница в производительности решений разного уровня вполне заметна и особенно отчётливо проявляется в 4K-разрешении. Для проверки производительности в AutoCAD мы использовали тест Cadalyst Systems Benchmark.


Впрочем, говорить о острой необходимости выбирать для AutoCAD высокопроизводительные профессиональные ускорители мы бы всё же не стали. Как видно по графику, разница в интегральной производительности флагманских профессиональных карт разных поколений не выходит за пределы 10 процентов. А в прошлых тестированиях мы видели, что сравнимый уровень быстродействия вполне способны обеспечить и видеокарты среднего уровня, например, Quadro M4000. Иными словами, AutoCAD скорее стоит отнести к числу приложений, которые не могут раскрыть потенциал, заложенный в профессиональные ускорители поколения Pascal.

И даже больше того, если проанализировать производительность при различных режимах отображения 3D-моделей, то выяснится, что хоть какие-то отличия в скорости работы новых и старых Quadro есть только в каркасном и реалистичном режимах. Включение же визуальных стилей Hidden или Conceptual приводит к тому, что быстродействие ограничивается процессором, и любая из участвующих в тесте видеокарт обеспечивает идентичную скорость вращения и модификации тестовых моделей.

Что же касается режимов Wireframe и Realistic, то в них дело обстоит следующим образом.




Наиболее ресурсоёмким оказывается каркасный режим, и в нём Quadro P6000 и P5000 обеспечивают заметный прирост в скорости по сравнению с предшественницами семейства Maxwell. В целом же, несмотря на то, что карты Quadro одного класса, но разных поколений, обладают одинаковым количеством блоков растеризации и текстурирования, мы вновь наблюдаем подавляющее преимущество новинок, которое в данном случае обуславливается их высокими рабочими частотами.

PTC Creo Parametric 3.0

Система автоматизированного проектирования Creo – очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. Используемый нами бенчмарк разработки SPEC оперирует несколькими различными моделями, которые раскрывают разные аспекты производительности пакета Creo, в том числе и новые возможности, введённые в третьей версии этого программного обеспечения. Например, тест активирует порядко-независимую модель прозрачности поверхностей (Order Independent Transparency), методику SSAO (преграждение окружающего света в экранном пространстве), усовершенствованные материалы и рельефное текстурирование. Тесты проводились в разрешении 3840 × 2160.


Несмотря на то, что производительность была измерена в 4K-разрешении, Quadro P6000 и P5000 предлагают не слишком весомую прибавку в скорости по сравнению с картами Quadro предыдущего поколения. Очевидно, что быстродействие современных флагманских графических карт для инженерного применения возросло столь существенно, что во многих случаях оно стало даже избыточным, и поэтому прирост производительности от внедрения архитектуры Pascal не всегда оказывается заметен на практике. Впрочем, отрицать тот факт, что новый субфлагман Quadro P5000 явно быстрее видеокарты Quadro M6000 даже в таких, не самых благоприятных случаях, невозможно.

И кроме того, не стоит забывать, что различные режимы отображения моделей в окнах проекции создают разнородную нагрузку, и в каких-то случаях более мощные профессиональные ускорители могут сыграть куда более значимую роль, чем показано на диаграмме с интегральным результатом теста. Для того, чтобы убедиться в этом, давайте посмотрим на производительность новинок в Creo Parametric 3.0 более подробно.












Сильнее всего преимущество видеокарт нового поколения проявляется при включении сложных реалистичных визуальных эффектов: затенения и отражений. Также определённую нагрузку создаёт и удаление невидимых линий. В этих случаях старшие карты линейки Quadro последнего поколения предложат наилучший уровень быстродействия.

Autodesk Maya 2016

Популярный редактор трёхмерной графики Maya 2016 – это хороший пример профессионального приложения, использующего интерфейс OpenGL. Причём, графический движок Viewport 2.0 в последней версии Maya наконец-то переведён на современную версию OpenGL 4.x, в то время как в старых версиях использовался OpenGL 2.x. Именно поэтому для Maya стало важным использовать современные профессиональные видеокарты, драйверы которых полноценно поддерживают этот API. Для тестирования производительности мы воспользовались бенчмарком разработки SPEC, который был адаптирован к современной версии Maya и 4K-разрешению.


Относительная производительность карт Quadro разных поколений различается не слишком сильно, но новый субфлагман P5000 предлагает лучшую по сравнению с M6000 производительность и здесь.

Если же заняться анализом результатов более подробно, то можно получить следующую картину.










Относительная скорость протестированных видеокарт выглядит одинаково при любых режимах отображения. Две новые версии Quadro заметно увеличили производительность по сравнению с предшественницами, и новая 2500-долларовая P5000 оказалась более быстрым акселератором по сравнению с M6000, который всё ещё продаётся в магазинах по цене выше $3000.

Solidworks 2015

SolidWorks — это распространённый программный комплекс САПР для автоматизации работ промышленного предприятия на этапах конструкторской и технологической подготовки производства. Используемый нами бенчмарк SPEC для этого пакета использует объёмные модели со сложностью до 4,75 миллионов треугольников и использует три новых эффекта отображения RealView, Ambient Occlusion и Shadows в сочетании с базовыми стилями: с затенением и с затенением с видимыми кромками. Кроме того, в тесте используется порядко-независимая прозрачность и полноэкранное сглаживание. Тесты проводились в разрешении 3840 × 2160 с полноэкранным сглаживанием и без него.


В Solidworks 2015 преимущество новых видеокарт, построенных на архитектуре Pascal, проявляется серьёзнее, чем во многих других случаях. Очевидно, что поддержка в этой САПР сложных визуальных стилей требует соответствующей поддержки со стороны аппаратного обеспечения. И новые видеокарты Quadro P6000 и P5000 с лёгкостью её могут предоставить. Даже если ориентироваться на режим без полноэкранного сглаживания, то преимущество профессиональных видеокарт семейства Pascal над «одноклассниками» семейства Maxwell 2 доходит до 10-процентного уровня.

Однако в сложных режимах отображения 3D-моделей разница может быть гораздо сильнее, например, очень серьёзную нагрузку создаёт включение модели затенения Ambient Occlusion (AO).
















Получается, что если вы хотите построить для себя наиболее комфортную среду проектирования в SolidWorks, то современный профессиональный ускоритель – одна из важнейших составляющих рабочей станции. Причём, по двум последним графикам отлично понятно, что вложения в этот компонент системы окупают себя на все сто процентов.

Производительность в Adobe Premiere Pro CC 2017


Adobe Premiere Pro – это не инженерное приложение для трёхмерного моделирования и проектирования, а система для нелинейного видеомонтажа. Тем не менее, мы решили включить её в наши тесты, потому что использование профессиональных видеокарт, способных ускорять видеообработку при помощи шейдерных процессоров, позволяет получить в ней заметный прирост быстродействия. Для оценки потенциала ускорителей при обработке видео силами CUDA-ядер мы измерили время финального рендеринга через Mercury Playback Engine с GPU-ускорением, работающим с CUDA, двух тестовых задач.

Первый тест был проведён со стандартным проектом для оценки производительности в Adobe Premiere Pro, PPBM11. Использовалась задача рендеринга H.264-ролика в FullHD-разрешении. При анализе полученных результатов необходимо учесть, что данный тестовый проект отличается наложением на исходный видеоматериал большого числа ресурсоёмких эффектов, которые хорошо ускоряются GPU.

Для получения более полной картины результаты тестов в Adobe Premiere Pro СС 2017 карт серии Quadro мы дополнили сведениями о скорости рендеринга, проводимого исключительно силами центрального процессора, а также при использовании игровой видеокарты GeForce GTX 1080.


Современные графические карты, обладающие поддержкой CUDA, способны весьма серьёзно ускорить видеообработку. Как видно по диаграмме, флагманский восьмиядерный процессор Core i7-6900K проигрывает в скорости рендеринга видео профессиональным ускорителям Quadro верхнего уровня чуть ли не на порядок. Есть заметные различия и в скорости работы разных видеокарт. Ускорители поколения Pascal за счёт увеличения числа CUDA-ядер могут предложить примерно 10-процентное улучшение результатов по сравнению с картами семейства Maxwell 2.

Однако нужно иметь в виду, что приведённая выше диаграмма описывает достаточно редкий «тяжёлый» случай, в котором различные эффекты на исходное видео накладываются с очень высокой интенсивностью. Поэтому мы включили в тесты и второй, более реалистичный «монтажный» проект, в котором рендеринг выполняется в 4K-разрешении, но удельная плотность эффектов гораздо ниже.


Здесь рендеринг на видеокартах даёт всего лишь четырёхкратное ускорение по сравнению с рендерингом на Core i7-6900K. Разница же в скорости разных флагманских карт Quadro почти не проявляется вообще. Иными словами, острая необходимость в параллельных вычислительных ресурсах в Premiere Pro СС 2017 возникает при создании сложных эффектов, накладываемых друг на друга. Более простая же обработка может не требовать использования флагманских видеокарт с большим числом CUDA-процессоров. Но в любом случае карты серии Quadro дают значимый прирост в скорости по сравнению с обработкой видео исключительно процессорными силами.

Производительность финального рендеринга


Современные профессиональные графические карты строятся на мощных GPU, обладающих изрядными вычислительными ресурсами в виде массива потоковых процессоров. Поэтому помимо традиционного использования для ускорения отображения 3D-моделей в CAD/CAM-системах, видеокарты серии Quadro вполне можно применять и для финального рендеринга. Большинство рендереров опирается на 32-битные вычисления, а значит, профессиональные видеоускорители могут стать хорошим средством для быстрого и точного рендеринга трёхмерных моделей, благо поддержку CUDA или OpenCL сегодня обеспечивают многие популярные системы визуализации.

Всё это делает карты Quadro не просто графическими ускорителями в традиционном понимании этого термина, а многофункциональными комбайнами, способными с одной стороны сделать комфортным процесс построения моделей и цифровых проектов, а с другой – обеспечить высокую скорость при их финальном расчёте и визуализации.

Говоря о производительности видеокарт при рендеринге, в первую очередь следует вспомнить о IRay – собственном физически корректном рендерере компании NVIDIA, который она предлагает для 3ds max и Maya, а также для Cinema 4D. Совершенно неудивительно, что IRay имеет глубокую оптимизацию для карт с CUDA, и прекрасно ускоряется видеокартами серии Quadro.


Тестирование скорости рендеринга выполнялось в 3ds max 2017, использовалась версия IRay 1.3.0-117513. Изображение тестовой сцены приведено на иллюстрации выше, она составлена из 494 объектов и включает 18 источников света. При построении финального изображения в разрешении 1024 × 579 делается 1000 итераций.


Рендеринг в NVIDIA IRay силами видеокарт работает гораздо быстрее, чем на восьмиядерном CPU. Хорошо видно и превосходство видеокарт поколения Pascal над предшественниками. Представленные результаты говорят сами за себя, однако нужно добавить, что столь высокая скорость обработки, которую могут обеспечить NVIDIA P6000 и P5000, позволяет с удобством использовать эти видеокарты даже в режиме интерактивного рендеринга.

Возможность рендеринга силами видеокарт с поддержкой CUDA и OpenCL имеется и в популярном пакете для создания трёхмерной компьютерной графики Blender 2.78a. Для тестов производительности в этом случае мы воспользовались стандартной сценой Blender Cycles Benchmark, которая визуализировалась в разрешении 1920 × 1080.




Здесь разрыв в скорости рендеринга на видеокартах Quadro и восьмиядерном процессоре получился не столь значительным. Однако прирост в вычислительной производительности, который произошёл при переходе GPU на архитектуру Pascal, отрицать невозможно. Преимущество новых профессиональных видеокарт над их предшественницами доходит до полуторакратного размера.

Для тестирования производительности визуализации методом трассировки лучей с использованием рендерера Arion мы воспользовались специальным тестом RandomControl Arion Render Benchmark.




Преимущество новых Quadro вновь весьма впечатляет. Благодаря увеличению числа CUDA-процессоров и росту тактовых частот профессиональные карты поколения Pascal получили не только впечатляющие характеристики пиковой производительности. Они нашли отражение и в производительности в реальных задачах, и ярким примером произошедших улучшений может быть почти двукратный рост скорости рендеринга методом трассировки лучей.

Для целей тестирования мы воспользовались и другим движком для построения фотореалистичных изображений методом трассировки лучей, использующим мощности графических карт через универсальный программный интерфейс OpenCL, – LuxRender. LuxRender имитирует распространение света в реальности при помощи специальных алгоритмов и существует в версиях для следующего специализированного ПО: Blender, 3dsmax, SketchUp, C4D, XSI, Poser и др. Для измерения скорости работы LuxRender мы воспользовались тестовым приложением LuxMark 3.1 и сценой Hotel Lobby с высокой сложностью.




Преимущество графической архитектуры Pascal хорошо видно и здесь. Quadro P5000 выполняет рендеринг заметно быстрее, чем Quadro M6000, а её превосходство над восьмиядерным процессором Core i7-6900K достигает многократного размера. Что же касается Quadro P6000, то эта видеокарта-рекордсмен может похвастать результатом, вдвое превосходящим показатель Quadro M6000, что в очередной раз указывает на значительный прогресс, который произошёл с внедрением архитектуры Pascal в профессиональные графические ускорители.

Производительность в игровом 3D и VR


На этот раз у компании NVIDIA получились очень крутые профессиональные карты. Дело в том, что обычно флагманские ускорители серии Quadro превосходили игровые видеокарты только в CAD/CAM-пакетах, где роль играли специфические оптимизации драйверов. По абсолютным же характеристикам быстродействия симметричные версии GeForce были быстрее Quadro за счёт более высоких рабочих частот. Но с приходом GPU поколения Pascal ситуация изменилась. Сегодня Quadro P6000 – самая быстрая видеокарта без каких-либо оговорок, она превосходит GeForce GTX 1080 и TITAN X даже как игровой ускоритель.

Чтобы убедиться в этом, достаточно посмотреть на результаты, которые мы получили в популярном тесте Futuremark 3DMark.




Весьма впечатляющие результаты показывают Quadro P6000 и P5000 и в тесте Futuremark VRMark, который оценивает скорость систем при работе с системами виртуальной реальности. Этот тест выдаёт два показателя. VRMark Orange Room показывает достаточность мощности GPU для работы с HTC Vive и Oculus Rift, а VRMark Blue Room оценивает способность работы видеокарт с VR-шлемами будущих поколений, которые будут работать с разрешением 5K.




VRMark Orange Room показывает, что мощности Quadro P6000 и P5000 для работы с современными гарнитурами виртуальной реальности более чем достаточно. Для полной совместимости с HTC Vive и Oculus Rift достаточно показателей производительности на уровне пять тысяч баллов, а профессиональные карты нового поколения выдают вдвое более высокий результат.

А вот по данным VRMark Blue Room при работе с перспективными VR-шлемами могут возникнуть затруднения. До оптимального результата не дотягивает даже Quadro P6000. Впрочем, при сегодняшнем уровне развития графических архитектур добиться целевого показателя в пять тысяч баллов можно добиться лишь при использовании мульти-GPU конфигураций. При этом тест явно показывает, что Quadro P6000 и P5000, обладающие технологией Simultaneous Multi-Projection, значительно лучше подходят для работы с виртуальной реальностью, чем видеокарты на GPU предыдущего поколения.

Энергопотребление


Новые GPU поколения Pascal по сравнению с Maxwell 2 получили возросшее число потоковых процессоров и гораздо более высокие рабочие частоты. Однако тепловой пакет Quadro P6000 остался на том же уровне, что был у M6000, а P5000 по паспортным спецификациям стала лишь на 20 процентов прожорливее предшественницы. NVIDIA утверждает, что обойтись без существенных изменений в тепловыделении и энергопотреблении позволил переход на 16-нм технологию, который серьёзно поднял энергоэффективность. В теории всё это должно позволить возможность беспроблемной модернизации имеющихся рабочих станций новыми картами Quadro, причём такая модернизация не должна требовать замены корпусов, систем охлаждения или блоков питания.

Для проверки давайте взглянем на фактический уровень энергопотребления полных систем (без монитора), оснащённых различными профессиональными видеокартами. Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и воспользовались для практических измерений. То есть, на следующем ниже графике приводится полное потребление систем, измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Нагрузка для определения пикового потребления создавалась тестом FurMark 1.18.2, запущенным в режиме «Burn» в окне с разрешением 1280х720. Такой вариант нагрузки хорош тем, что он, как и большинство профессиональных приложений, использует API OpenGL.


Полученные на практике значения энергопотребления видеокарт под нагрузкой полностью соответствуют заявленным характеристикам. Quadro P6000 совсем не прожорливее прошлого флагмана, M6000, а потребление Quadro P5000 выше, чем у предшественницы, лишь на 20 с небольшим ватт. Таким образом, энергоэффективность профессиональных ускорителей поколения Pascal действительно вышла на новый уровень и прирост производительности произошёл без заметного роста энергетических аппетитов.

Кроме того, во время тестирования новых Quadro под нагрузкой в FurMark нам удалось убедиться в хорошей производительности применённых на картах систем охлаждения. Предельная температура GPU у Quadro P6000 не превышала 84 градуса, максимальный же нагрев графического процессора у Quadro P5000 составил лишь 81 градус. При выходе же за пределы этих целевых температур видеокарты немного снижают частоту GPU. В обоих случаях центробежный вентилятор в системах охлаждения не разгонялся свыше 2500 оборотов в минуту, что примерно соответствует 60 процентам от его максимальной скорости. В таких условиях он работает с достаточно небольшим уровнем шума и не выходит за границы акустического комфорта.

Выводы


Архитектура Pascal стала огромным шагом вперёд для ускорителей всех классов. Переход на 16-нм технологический процесс позволил NVIDIA не только нарастить вычислительные мощности за счёт добавления в графические процессоры дополнительных CUDA-ядер, но и дал возможность серьёзно поднять тактовые частоты. Внедрение же новой GDDR5X с 16n-предвыборкой увеличило пропускную способность памяти. В итоге видеокарты, построенные на GPU поколения Pascal, с точки зрения производительности заметно превосходят своих предшественников.

Исключением не стали и профессиональные ускорители для высокопроизводительных рабочих станций. Пока NVIDIA представила лишь две старшие карты линейки Quadro нового поколения, Quadro P6000 и P5000, но и по ним совершенно понятно, что приход архитектуры Pascal знаменует не очередное эволюционное обновление линейки, а настоящий революционный прорыв. Дело в том, что благодаря переводу серии ускорителей Quadro на новые графические процессоры и более быструю GDDR5X-память NVIDIA нарастила вычислительный потенциал значительно серьёзнее, чем это случалось раньше. Плюс, компания совершила ещё два важных шага. Во-первых, она нарастила объёмы видеопамяти, наделяя новые профессиональные видеокарты способностью работать в высочайших разрешениях и со сверхсложными моделями. Во-вторых, компания поменяла и общий подход к характеристикам Quadro: теперь в этой серии будут доступны не просто быстродействующие и оптимизированные для профессионального применения решения, а видеокарты с максимально возможной на данный момент производительностью. Отличный пример реализации такой стратегии – это Quadro P6000: данная видеокарта теперь не просто занимает место самого мощного профессионального видеоускорителя с оптимизированными для CAD/CAM-систем драйверами, она к тому же является и самой быстрой видеокартой вообще.

Всё это находит отражение и в том уровне производительности, который демонстрируют протестированные новинки в своих типичных применениях: в системах автоматизированного проектирования и трёхмерного моделирования. Превосходство Quadro P6000 и P5000 над решениями поколения Maxwell 2 во многих случаях доходит до полутора- или даже двукратного размера. В результате, заметно быстрее старшей видеокарты прошлого поколения, M6000, оказывается даже новый субфлагман Quadro P5000.

Столь серьёзный прогресс в быстродействии делает новые карты линейки Quadro Px000 не просто отличным вариантом для современных рабочих станций. Откровенно говоря, то же самое можно было сказать и про прошлое поколение Quadro Mx000. Ведь и оно отлично справлялось с ускорением отображения моделей в CAD/CAM-системах даже в 4K-разрешениях. Но теперь карты Quadro претендуют на большее: они вполне могут занять место многофункциональных комбайнов для профессионалов. Ведь помимо обеспечения комфортной рабочей среды они способны предоствить в распоряжение специалистов и значительные вычислительные ресурсы, которые нетрудно задействовать для финальной визуализации и рендеринга готовых проектов. Иными словами, оснащённая картой семейства Quadro Px000 рабочая станция способна стать для 3D-дизайнера или инженера САПР полностью универсальным рабочим инструментом.

К сказанному нужно добавить и то, что высочайшая производительность видеокарт Quadro P6000 и P5000 – это далеко не лишний задел на ближайшее будущее. Мощностей этих решений наверняка хватит для ускорения работы и при перспективном переходе в сверхвысокие разрешения (5K и 8K), а также при работе с набирающими популярность системами виртуальной реальности, специально для которых в новинках появилась аппаратная поддержка.

Официальным производителем и поставщиком профессиональных видеокарт NVIDIA Quadro в Россию
является компания PNY Technologies