Обзор

Платформы NVIDIA® Mellanox® UFM® коренным образом изменяют управление сетями центров обработки данных путем объединения усовершенствованной телеметрии сетей в режиме реального времени с платформами киберразведки и киберанализа на базе искусственного интеллекта с целью поддержки горизонтально масштабируемых ЦОД InfiniBand.

Платформы UFM дают возможность операторам используемых для исследований и производства ЦОД эффективно размещать, контролировать, администрировать и обслуживать современную инфраструктуру центров обработки данных (ЦОД), а также превентивно выявлять и устранять в ней неисправности. Кроме того, эти платформы обеспечивают более эффективное использование ресурсов инфраструктуры, конкурентные преимущества и снижение эксплуатационных расходов. Платформы UFM объединяют в себе несколько уровней решений и расширенный набор функций, начиная с оптимизации рабочей нагрузки и проверки конфигурации и заканчивая повышением качества работы инфраструктуры посредством выявления отклонений в работе сети с помощью искусственного интеллекта и диагностического обслуживания, благодаря чему данные платформы могут соответствовать требованиям максимально большого количества современных горизонтально масштабируемых ЦОД.

ОПИСАНИЕ ПРОДУКТА
Платформы UFM оптимизируют эксплуатационные расходы при  организации суперкомпьютерных вычислений

Основные особенности платформ UFM

UFM Telemetry

NVIDIA MELLANOX UFM TELEMETRY

МОНИТОРИНГ В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ

Создает обширную базу данных контролируемых в режиме реального времени показателей телеметрии сети, рабочей нагрузки, конфигурации системы и других параметров.
Варианты платформы: ПО, контейнер Docker или устройство UFM Telemetry.
UFM Enterprise

NVIDIA MELLANOX UFM ENTERPRISE

ВИЗУАЛЬНЫЙ КОНТРОЛЬ И УПРАВЛЕНИЕ ИНФРАСТРУКТУРОЙ

Объединяет преимущества телеметрии UFM и расширенные функции мониторинга сети и управления сетью.
Варианты платформы: ПО, контейнер Docker или устройство UFM Enterprise.
UFM Cyber AI

NVIDIA MELLANOX UFM CYBER-AI

КИБЕРРАЗВЕДКА И АНАЛИТИКА

Расширяет возможности платформ UFM Telemetry и UFM Enterprise, обеспечивая горизонтальное масштабирование при выполнении профилактического обслуживания, что позволяет снизить эксплуатационные расходы при организации суперкомпьютерных вычислений.    
Платформа: необходимо специально отведенное устройство UFM Cyber-AI в локальной среде

UFM TELEMETRY

МОНИТОРИНГ В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ

UFM Telemetry

Платформа UFM Telemetry предоставляет инструменты проверки сети для контроля за работой и состоянием сети и обеспечивает сбор и потоковую передачу в режиме реального времени в локальную или облачную базу данных обширных данных телеметрии сети, информации о рабочей нагрузке приложения, сведений о конфигурации системы и других данных для их дальнейшего анализа.

Характеристики:

  • Телеметрия коммутаторов, адаптеров и кабелей. 
  • Проверка системы.
  • Тесты качества работы сети.
  • Потоковая передача данных телеметрии в локальную или облачную базу данных. 

UFM ENTERPRISE

ВИЗУАЛЬНЫЙ КОНТРОЛЬ И УПРАВЛЕНИЕ ИНФРАСТРУКТУРОЙ

UFM ENTERPRISE

Платформа среднего уровня UFM Enterprise объединяет в себе все преимущества платформы UFM Telemetry и расширенные возможности мониторинга сети и управления сетью, оптимизации рабочей нагрузки и периодической проверки конфигурации. Эта платформа также выполняет автоматическое обнаружение и подготовку сети, мониторинг трафика и выявление перегрузки сети. Платформа UFM Enterprise позволяет предоставлять диспетчеров заданий и объединять их с ведущими диспетчерами заданий, диспетчерами облаков и диспетчерами кластеров, в том числе с Slurm и Platform LSF. Платформа UFM также дает возможность выполнять подготовку сети и интегрировать ее с OpenStack, Azure Cloud and VMware.

Характеристики:

  • В состав входит платформа UFM Telemetry.
  • Автоматическое обнаружение и подготовка сети.
  • Надежная кабельная сборка.
  • Контроль за перегрузками позволяет выявлять критические параметры трафика. 
  • Обнаружение проблем и их решение.
  • Глобальное обновление ПО.
  • Предоставление диспетчеров заданий, объединяемых с инструментами Slurm и Platform LSF.
  • Расширенная отчетность и универсальные интерфейсы REST API.
  • Богатый возможностями веб-интерфейс GUI.
UFM Cyber AI

NVIDIA MELLANOX UFM CYBER-AI

КИБЕРРАЗВЕДКА И АНАЛИТИКА

Устройство UFM Cyber-AI усиливает преимущества UFM Telemetry и UFM Enterprise, предоставляя горизонтальное масштабирование профилактического обслуживания для снижения операционных затрат на суперкомпьютеры.

Платформа: необходимо специально отведенное устройство UFM Cyber-AI в локальной среде

Характеристики:

  • Встроенные UFM Telemetry и UFM Enterprise
  • Обнаруживает снижение производительности
  • Обнаруживает изменения в профиле использования, возникающие в течение продолжительного периода
  • Обнаруживает отклоняющееся от нормы поведение кластеров
  • Находит взаимосвязь между явлениями, которые могут казаться не связанными между собой, при помощи Искусственного интеллекта
  • Сообщает о необходимости профилактического обслуживания
  • Непрерывный сбор системных данных оптимизирует возможность прогнозирования

Как работает платформа UFM Cyber-AI 

Уникальные преимущества платформы Cyber-AI основаны на процессе сбора обширных телеметрических данных в течение продолжительного периода времени и использования алгоритмов глубокого обучения.  

Информационная панель платформы UFM
  • Платформа UFM получает данные о  "пульсе", режиме работы, условиях и использовании ЦОД, а также о характерных особенностях сети при рабочей нагрузке в ЦОД, после чего данная платформа создает обширную базу телеметрических данных и данных об обнаружении корреляций между событиями.     
  • Платформа UFM преобразует и коррелирует данные об изменении "пульса" в показатели будущего ухудшения работы или неправильного использования вычислительных ресурсов ЦОД.   
  • Такие изменения и корреляции между процессами активизируют работу прогнозной аналитики и инициируют оповещения, которые указывают на неправильную работу системы и неправильное функционирование приложений, а также на потенциальные сбои в системе.    
  • Системные администраторы могут быстро обнаруживать и реагировать на такие потенциальные угрозы безопасности и эффективно предотвращать возможные сбои, что позволяет сократить эксплуатационные расходы и соблюдать соглашения об уровне обслуживания (SLA) c конечными пользователями.   

Интеграция с существующими инструментами для управления ЦОД

Платформа UFM предоставляет  открытую и расширяемую объектную модель для описания инфраструктуры ЦОД и выполнения всех необходимых действий по управлению. Интерфейс API платформы UFM обеспечивает интеграцию с ведущими диспетчерами заданий, диспетчерами облаков и диспетчерами кластеров, в том числе с Slurm и Platform LSF. Платформа UFM также дает возможность выполнять подготовку сети и интегрировать ее с OpenStack, Azure Cloud and VMware. 

NVIDIA Mellanox Care — услуги мониторинга и NOC

Регулярный анализ качества работы — необходимое условие для обеспечения соответствия вашего решения Mellanox целям вашей компании и последним технологиям Mellanox. Наши услуги мониторинга и центра управления сетью (NOC) непрерывно проверяют ваше решение с целью выявить потенциальные проблемы до того как они произойдут. Таким образом вы можете быть уверены, что мы выявим и устраним проблемы, прежде чем они нанесут вам какой-либо вред, а в конечном результате вы сможете повысить рентабельность инвестиций и снизить расходы на обслуживание системы.      

Усоуги мониторинга и центра управления сетью (NOC).
  • Дистанционный центр управления сетью (NOC), управление сетью и усоуги мониторинга.
  • Профильный специалист по оказанию данных услуг.
  • Поддержка уровня 1, 2 и 3.
  • Непрерывная защита от ошибок и неисправностей.
  • Уведомления о неисправностях и устранение неисправностей.
  • Анализ ошибок и уведомления об ошибках.
  • Мониторинг работы — аварийные сигналы и оповещения в режиме реального времени.
  • Масштабируемые экономичные услуги.
Значок видео

Платформы UFM оптимизируют эксплуатационные расходы при  организации суперкомпьютерных вычислений

Mellanox Quantum

Значок видео

Победа HDR 200G InfiniBand на Международной конференции SuperComputing 2019

Технология вычислительных процессов внутри сети InfiniBand и стратегический план

Решения NVMe over Fabric

Техасский центр передовых вычислений (TACC) выбирает Mellanox InfiniBand

Увидеть в действии

Задать вопрос

Приобрести

Политика в отношении Cookie-файлов компании NVIDIA Mellanox​​​​​​​

На этом веб-сайте используются cookie-файлы, которые могут помочь в доставке контента в соответствии с вашими предпочтениями и интересами, обеспечить лучший поиск и проанализировать наш трафик. Вы можете удалить и/или заблокировать cookie-файлы с этого сайта, но это может повлиять на работу сайта. Более подробная информация приведена в < a1 > Политике конфиденциальности .