NVIDIA

NVIDIA Программно-аппаратный комплекс глубокого обучения DGX-1 от NVIDIA — это целевая платформа глубокого обучения, ускоренная ИИ, которая обеспечивает производительность на уровне 250 обычных серверов. Он основан на архитектуре класса Pascal ЦП NVIDIA и четырех устройствах Mellanox ConnectX®-4 EDR 100Gb/s InfiniBand HCA. DGX-1 использует несколько портов InfiniBand EDR, позволяя исключить узкие места и обеспечить максимальную пропускную способность при сверхмалых задержках. За счет возможностей сетевого ускорения для разгрузки данных и коллективных процедур обмена данными комплекс NVIDIA можно масштабировать на несколько систем платформы DGX-1, подключив системы 124 DGX-1 из состава суперкомпьютера машинного обучения SaturnV. SaturnV не только получил место #1 в списке Green500, но и занял место #28 в списке Top500 с показателем 3,3 петафлопс. В мультисистемном кластере DGX-1 используется топология сети на основе fat tree (утолщенное дерево) с InfiniBand, а его производительность в 20 превосходит типичного мультисистемного кластера, т. е. это высочайшая производительность обмена данными среди вычислительных приложений и приложений глубокого обучения.

nvidia-dgx.jpg