Новости за день

NVIDIA представляет ускоритель Tesla K40
В настольном сегменте венцом архитектуры NVIDIA Kepler не так давно выступила видеокарта GeForce GTX 780 Ti, которая полностью использовала весь заложенный в GPU GK110 потенциал. Нечто подобное сейчас произошло в сегменте спецускорителей вычислений. Компания NVIDIA разослала пресс-релиз, в котором сообщила о выпуске «Tesla K40, самого мощного в мире ускорителя из когда-либо созданных, который обеспечивает экстремальную производительность в широком спектре научных, инженерных, корпоративных и HPC-приложений». Речь идёт о максимально возможной для GPU GK110 конфигурации потоковых процессоров — 2880 штук, против 2496 штук в версии Tesla K20. Впрочем, ускоритель Tesla K40 использует новую ревизию чипа — GK110B.
Ускоритель линейки NVIDIA Tesla
Ускоритель линейки NVIDIA Tesla

Согласно оценкам компании, «Tesla K40 обладает вдвое большим объемом памяти и на 40% быстрее предшественника Tesla K20X, а также в 10 раз быстрее самого мощного на сегодня CPU, являясь первым в мире и самым мощным ускорителем, оптимизированным для анализа больших объемов данных и масштабных научных исследований». Но тут мы позволим себе не согласиться с компанией. Ускоритель Tesla K40 может считаться на 40 % быстрее другой модели — Tesla K20. Скорость вычислений с одинарной точностью у Tesla K40 составляет 4,29 терафлопс, а с двойной — 1,43 терафлопс. Модель Tesla K20 (2496 ядер CUDA) может похвастаться скоростью вычислений с одинарной точностью на уровне 3,52 терафлопс, и с двойной — 1,17 терафлопс. Рост пропускной способности по шине памяти вырос с 208 ГБ/с до 288 ГБ/с. Объём памяти типа GDDR5 от модели к модели увеличился с 5 ГБ до 12 ГБ. При желании найти 40-% прирост производительности труда не составит, да.

Адаптер Tesla K20X появился год назад как спецпроект для суперкомпьютера Titan, созданного для Национальной Лаборатории Окриджа, штат Теннесси. Графический процессор для модели Tesla K20X использовал уже 2688 потоковых процессоров, и его производительность довольно близка к возможностям Tesla K40. Скорость вычислений с двойной точностью для Tesla K20X равна 1,31 терафлопс, а с одинарной — 3,95 терафлопс. Объём бортовой памяти равен 6 ГБ GDDR5. Скорость обмена с памятью — 250 ГБ/с. Так что компания предпочла сравнить новинку с чуть более медленной версией, но в пресс-релизе допустила неточность в названии. Впрочем, это не отменяет того, что в лице Tesla K40 мы видим самый производительный ускоритель для выполнения общих вычислений силами одиночного GPU.
Автор: GreenCo Дата: 19.11.2013 09:33
AMD готовит 12-ГБ версию ускорителя расчётов FirePro S10000
Вчера мы напомнили, что следующее поколение ускорителей расчётов компании Intel — Xeon Phi — может освоить также такой формфактор, как конструктив с процессорным разъёмом. Это даст в руки Intel весомый козырь в игре против компаний NVIDIA и AMD. Ускорители расчётов последних двух разработчиков, как нетрудно догадаться, будут оставаться привязанными к шине PCI Express со всеми вытекающими «лишними» накладными расходами как конструктивными, так и по стоимости используемых материалов.

Впрочем, у компании NVIDIA появилась возможность освоить процессорные разъёмы компании IBM, но к более массовой x86-совместимой платформе это относиться не будет. Всё, что остаётся NVIDIA, и в чём её огромная и честно заработанная заслуга, это разработка графических процессоров с процессорными функциями. Свежим примером этому может служить новость ниже о выпуске самого мощного однопроцессорного ускорителя Tesla K40. Для полноты картины нам остаётся рассказать о новинках компании AMD для ниши ускорителей суперкомпьютеров. И такая новость есть, хотя мы о ней на прошлой неделе не успели рассказать.
AMD FirePro S10000: всё ещё самый быстрый на планете ускоритель расчётов (из неспециализированных ускорителей)
AMD FirePro S10000: всё ещё самый быстрый на планете ускоритель расчётов (из неспециализированных ускорителей)

Официальным пресс-релизом компания AMD сообщила о подготовке к выпуску новой версии ускорителя расчётов FirePro S10000. Адаптер FirePro S10000 с бортовым объёмом памяти в размере 6 ГБ GDDR5 был анонсирован ровно год назад. По словам AMD, пользователи систем на основе FirePro S10000 отмечают высокие скоростные характеристики ускорителя, но хотели бы увидеть адаптер с расширенным объёмом памяти, ибо работа с «большими» цифровыми моделями представляет определённые сложности. Ответом на этот запрос стал выпуск 12-ГБ версии FirePro S10000. Поставки нового ускорителя начнутся весной будущего года. Скоростные показатели адаптера при этом не изменились и составляют 1,48 терафлопс для вычислений с двойной точностью и 5,91 терафлопс при вычислениях с одинарной точностью. Нетрудно заметить, что фактически прошлогодний адаптер AMD FirePro S10000 остаётся несколько быстрее новейшего ускорителя NVIDIA Tesla K40 (DP — 1,43 терафлопс, SP — 4,29 терафлопс). Но надо понимать, что решение AMD опирается сразу на два GPU Tahiti и является более прожорливым по потреблению, что снова нас возвращает к превосходным характеристикам решений NVIDIA.
Автор: GreenCo Дата: 19.11.2013 11:31
IBM и NVIDIA проталкивают Power8 и GPGPU в нишу массовых ЦОД
Летом этого года компании IBM, NVIDIA, Google, Mellanox и Tyan объявили о создании консорциума по продвижению открытых платформ на архитектуре IBM Power — OpenPOWER. Это стало своеобразным ответом на инициативу «Open Compute Project» компании Facebook, которая предложила создать открытую архитектуру для построения серверов на x86-совместимых платформах. По понятным причинам альянс IBM делает ставку на RISC/UNIX-платформы, которым становится всё более неуютно даже на рынке суперсерверов.

На момент анонса о создании консорциума OpenPOWER его глобальные задачи не были озвучены. Это произошло вчера, когда компании IBM и NVIDIA совместно сообщили о «применении GPU-ускоренных супервычислений для анализа корпоративных данных на лету». Новоявленные партнёры намерены дать бой x86-совместимым платформам на их исконном поле — в нише ЦОД для облачных и корпоративных служб по обработке данных. Причём бить обещают из орудий главного калибра — процессорами Power8. По мнению IBM, корпоративный рынок нуждается в новом уровне вычислений для работы, в частности — с Большими Данными. И, конечно же, речь будет идти об адаптации к платформам IBM уже достаточно обширной экосистемы NVIDIA в лице CUDA-совместимых программ.
Партнёрство, которое многих ещё удивит
Партнёрство, которое многих ещё удивит

«Объявленное сотрудничество расширяет сферу применения графических ускорителей. Теперь параллельные вычисления смогут ускорять не только супервычисления, но и приносить пользу в корпоративных центрах обработки данных. В результате этого сотрудничества клиенты IBM смогут быстрее обрабатывать, защищать и анализировать огромные массивы данных». К данному пассажу из пресс-релиза партнёров добавить нечего. Разве что информацию о появлении первых совместных платформ в течение следующего года. Что особенно забавно, это в какой-то мере может помочь удержаться на плаву платформам на Intel Itanium. Но для этого компания Intel должна протянуть руку помощи компании NVIDIA, а на это ещё надо решиться (см. Xeon Phi).
Автор: GreenCo Дата: 19.11.2013 13:41