Новости за день

NVIDIA представила графический процессор Volta GV100
Вчера вечером на конференции GTC 2017 компания NVIDIA представила новый графический процессор (и архитектуру) Volta GV100 и серверные продукты на его основе. Первоначально решения поколения Volta ожидались в 2016 году, но вместо них компания вывела на рынок GPU поколения Pascal и соответствующие продукты. Эта рокировка тем более интересна, что GPU Volta содержит значительные нововведения, а также будут производиться по эксклюзивному техпроцессу TSMC 12FFN (12 нм FinFET для NVIDIA). Добавим, площадь кристалла GV100 самая большая в истории графических процессоров и равна 815 мм2, на которой размещено 21,1 млрд транзисторов. Подобная структура очень чувствительна к уровню брака и даже при небольшом его проценте способна значительно снизить выход годных микросхем.
Исполнение адаптера NVIDIA Volta GV100
Исполнение адаптера NVIDIA Volta GV100

Что касается нововведений, то радикальным изменением в графической архитектуре компании стало появление блоков под названием «Tensor». Эти блоки позволяют эффективно выполнять матричные вычисления, которые становятся широко востребованными по мере развития технологий, связанных с искусственным интеллектом и, конкретно, с глубоким (или глубинным) машинным обучением. Аппаратные ускорители тензорных расчётов использует Google (Tensor Processing Units) и готовит к выпуску Intel (Lake Crest). В составе GPU Volta GV100 672 тензорных блока (по 8 на мультипроцессорный кластер SM). Всего в составе Volta GV100 84 мультипроцессорных кластера, хотя на первом этапе 4 штуки из них деактивированы.
Блок-схема мультипроцессорного кластера NVIDIA Volta GV100
Блок-схема мультипроцессорного кластера NVIDIA Volta GV100

Кроме тензорных блоков в составе GPU Volta GV100 2560 ядер FP64 (32 на каждый SM) и 5120 ядер FP32 (64 ядра на SM). Производительность в тензорных вычислениях достигает 120 терафлопс. Скорость FP64-расчётов приближается к 7,5 терафлопс, а при вычислениях с одинарной точностью (FP32) достигает 15 терафлопс. Если сравнивать Volta GV100 и Tesla P100, то производительность в режиме супервычислений выросла в 1,5 раза, а в режиме машинного обучения увеличилась в 12 раз.

В качестве памяти Volta GV100 на одной подложке с кристаллом GPU установлены четыре 4-ГБ микросхемы HBM2. Скорость обмена с памятью составляет 900 ГБ/с. Частота памяти при этом приблизительно равна 1700 МГц. Внешний интерфейс платы с Volta GV100 — это второе поколение интерфейсов NVLink 2.0 с пропускной способностью 300 ГБ/с. Интересной особенностью этого интерфейса можно считать то, что он напрямую заводится в процессор IBM POWER9 и позволяет кэшам GPU и POWER9 обмениваться данными. Наконец, TDP Volta GV100 ничуть не изменилось по сравнению с GPU Pascal и достигает 300 Вт. Тактовая частота при этом может увеличиваться до 1455 МГц.
Автор: GreenCo Дата: 11.05.2017 12:26
На базе NVIDIA Volta GV100 будут доступны системы DGX-1, HGX-1 и DGX Station
Поговорим о доступности систем NVIDIA на новых GPU Volta GV100. Таковых предусмотрено три варианта: DGX-1, HGX-1 и DGX Station. Система DGX-1 использует для загрузки два процессора Intel Xeon и 8 адаптеров Tesla V100 для вычислений. По сравнению с системами DGX-1 на адаптерах Tesla P100 скорость вычислений с половинной точностью (FP16) выросла со 170 терафлопс до 960 терафлопс. Поставки обновлённых систем NVIDIA DGX-1 начнутся в третьем квартале. Цена вопроса — $149 тыс.
Стоечный модуль DGX-1 с 8 адаптерами Tesla V100
Стоечный модуль DGX-1 с 8 адаптерами Tesla V100

Определённой альтернативой DGX-1 станет модуль HGX-1 в той же процессорной конфигурации, но с использованием жидкостного охлаждения компонентов. Цена модуля не уточняется.
Рабочая станция DGX Station с четырьмя модулями Tesla V100
Рабочая станция DGX Station с четырьмя модулями Tesla V100

Также с использованием жидкостного охлаждения будет работать другая конструкция с использованием Volta GV100 — DGX Station. Это что-то типа самостоятельной рабочей станции с четырьмя адаптерами Tesla V100 и процессором Intel Xeon. Внешние интерфейсы рабочей станции включают NVLink 200 Гбайт/с и три разъёма DisplayPort с поддержкой разрешения 4K. Стоимость рабочей станции равна $69 тыс.
Автор: GreenCo Дата: 11.05.2017 13:03