NVIDIA DGX-1: первый в мире суперкомпьютер для глубокого обучения

Автор: Александр Чуб, 06 апреля 2016, 10:00

Компания NVIDIA плотно взялась за разработки в сфере искусственного интеллекта и ранее уже была представлена платформа для автономных автомобилей Drive PX 2, которую уже начали использовать многие компании в своих разработках. NVIDIA пошла дальше и представила первый в мире суперкомпьютер для глубокого обучения NVIDIA DGX-1. По утверждению компании, DGX-1 сравним по скорости обучения глубоких сетей с 250 серверами x86 на базе Intel Xeon и способен обеспечить искусственный интеллект всеми необходимыми вычислительными ресурсами.

Суперкомпьютер построен на базе восьми модулей с GPU Pascal Tesla P100. Общая производительность системы DGX-1 на вычислениях с половинной (FP16) точностью будет достигать 170 терафлопс. Каждый из 8 GPU Pascal Tesla P100 имеет по 16 ГБ памяти HBM 2. В решении впервые для связи графических процессоров использован новый интерфейс компании — NVLink, который обеспечивает ультрабыстрый обмен данными между CPU и GPU и между разными GPU. Обещают от 5 до 12 раз прирост скорости по сравнению с традиционным внутренним соединением PCIe Gen3. Для кэширования данных используется SSD на 7 ТБ. Сетевой интерфейс — два порта 10GbE и четыре InfiniBand 100Gb. Пиковое потребление — 3.2 КВт.

Система NVIDIA DGX-1 включает полный набор программ, оптимизированных для глубокого обучения, который позволяет ученым и исследователям в области данных легко и быстро обучать глубокие нейронные сети. В набор ПО DGX-1 входит NVIDIA Deep Learning GPU Training System (DIGITS), интерактивная система для создания глубоких нейронных сетей (DNN), GPU-ускоряемая библиотека примитивов для создания DNN - NVIDIA CUDA Deep Neural Network (cuDNN) версии 5. Помимо этого, система включает оптимизированные версии нескольких широко используемых фреймворков глубокого обучения— Caffe, Theano и Torch. В США система NVIDIA DGX-1 будет продаваться с июня, цена — около $129 тыс.

Показать пресс-релиз Скрыть пресс-релиз

САН-ХОСЕ, Калифорния—GPU Technology Conference—5 апреля, 2016—NVIDIA сегодня представила NVIDIA® DGX-1™, первый в мире суперкомпьютер для глубокого обучения, который обладает достаточной вычислительной мощью для развития искусственного интеллекта (ИИ).

NVIDIA DGX-1 – это первая система, разработанная специально для задач глубокого обучения. Она оснащена всем необходимым аппаратным обеспечением, программным обеспечением для глубокого обучения и инструментами разработки для быстрого и легкого развертывания системы. В основе полностью готовой к эксплуатации системы лежит новое поколение графических процессоров, которые обеспечивают скорость обработки данных, сравнимую с 250 серверами x86 архитектуры.

Благодаря использованию GPU-ускоренных вычислений, система глубокого обучения DGX-1 позволяет исследователям в области данных с легкостью создавать новые классы умных машин, способных учиться, видеть и воспринимать мир как человек. Новая система обладает беспрецедентной вычислительной мощью, позволяя запускать приложения искусственного интеллекта нового поколения. Она значительно сокращает время исследователей на обучение больших и сложных глубоких нейронных сетей.

Компания NVIDIA создала систему DGX-1, чтобы поддержать революцию в области искусственного интеллекта, который сегодня активно вторгается в науку, бизнес и нашу повседневную жизнь. Мощные глубокие нейронные сети позволяют создавать новые типы приложений, работающих с колоссальными объемами информации и, соответственно, требующих значительно более высокого уровня вычислительной производительности.

“Искусственный интеллект – это самый масштабный технологический прорыв нашего времени, - говорит Дженсен Хуанг (Jen-Hsun Huang), генеральный директор и соучредитель NVIDIA. – Совершенно очевидно, он изменит все отрасли промышленности, все компании, да и весь уклад человеческой жизни. Искусственный интеллект породит новые рынки, от которых получат пользу все. Сегодня исследователи в области данных и искусственного интеллекта тратят слишком много времени на создание «домашних» высокопроизводительных вычислительных систем. Система DGX-1 проста в установке и преследует только одну цель: раскрыть потенциал сверхчеловеческих способностей и направить его на решение проблем, ранее считавшихся неразрешимыми”.

Пять передовых технологий в основе DGX-1

Система глубокого обучения NVIDIA DGX-1 построена на базе графических процессоров NVIDIA Tesla® P100, основанных на архитектуре NVIDIA Pascal™. Это законченное, полностью готовое к использованию решение, которое обеспечивает скорость обработки, сравнимую с 250 серверами на базе CPU.

Среди других передовых технологий, которые обеспечивают максимальную производительность и простоту использования NVIDIA DGX-1, - высокоскоростной интерфейс NVIDIA NVLink™ для максимальной масштабируемости приложений; 16нм процесс производства FinFET для высокой энергоэффективности; технология Chip-on-Wafer-on-Substrate с HBM2 для работы с большими объемами данных; а также новые инструкции половинной точности, которые обеспечивают более 21 терафлопса пиковой производительности в задачах глубокого обучения.

Все вместе эти прогрессивные технологии позволяет системе DGX-1, оснащенной графическими процессорами Tesla P100, обучать сети в 12 раз быстрее по сравнению с решениями на базе четырех процессоров NVIDIA Maxwell™, представленных в прошлом году.

Архитектура Pascal уже получила широкую поддержку в экосистеме искусственного интеллекта.

“Графические процессоры NVIDIA ускоряют развитие искусственного интеллекта. По мере роста нейронных сетей нам нужны не только более производительные GPU с бОльшей и более быстрой памятью, но и более высокая скорость обмена информации между графическими процессорами, а также аппаратное обеспечение, способное получить выигрыш от пониженной точности вычислений. Все это есть в архитектуре Pascal”, - говорит Йэн ЛеКан (Yann LeCun), руководитель направления искусственного интеллекта в Facebook.

Эндрю ЭнДжи (Andrew Ng), руководитель исследований и разработок в Baidu, говорит: “Компьютеры с искусственным интеллектом подобны космическим кораблям: чем больше, тем лучше. Производительность и интерфейс архитектуры Pascal позволит нам создать самый большой в мире корабль”.

“Microsoft разрабатывает суперглубокие нейронные сети, имеющие свыше 1000 слоев, - говорит Ксюдонг Хуанг (Xuedong Huang), ведущий специалист по речи в Microsoft Research. – Впечатляющая мощь NVIDIA Tesla P100 позволит нам быстрее развивать искусственный интеллект с помощью инструментария Microsoft CNTK”.

Полный набор ПО для глубокого обучения

В набор ПО DGX-1 входит NVIDIA Deep Learning GPU Training System (DIGITS™), полноценная интерактивная система для создания глубоких нейронных сетей (DNN), а также GPU-ускоряемая библиотека примитивов для создания DNN - NVIDIA CUDA® Deep Neural Network (cuDNN) версии 5.

Помимо этого, система включает оптимизированные версии нескольких широко используемых фреймворков глубокого обучения— Caffe, Theano и Torch. DGX-1 дополнительно предоставляет доступ к облачным инструментам управления, обновлениям ПО и банку приложений-контейнеров.

Характеристики системы NVIDIA DGX-1

Пиковая производительность до 170 терафлопс вычислений половинной точности (FP16)
Восемь GPU-ускорителей Tesla P100, с 16ГБ памяти на борту у каждого GPU
NVLink Hybrid Cube Mesh
7ТБ SSD DL Cache
Dual 10GbE, Quad InfiniBand 100Gb
3U – 3200Вт

Опциональная возможность поддержки для системы NVIDIA DGX-1 повышает ее продуктивность и уменьшают время простоя. Программно-аппаратная поддержка обеспечивает доступ к базе знаний NVIDIA и включает облачные службы управления, программные обновления и приоритетное решение критических проблем. Подробнее смотрите на странице www.nvidia.com/page/support/dgx1-support.

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.

NVIDIA