NVIDIA – UFM Overview (Foundational)

Il y a deux semaines, j'ai écrit sur NVIDIA – Bluefield DPU use cases parce que je pense que les processeurs de traitement des données sont révolutionnaires. Aujourd'hui, dans cet article, je vais parler des plates-formes UFM (Unified Fabric Manager) de la famille NVIDIA qui ont révolutionné la gestion des réseaux des centres de données. UFM combine le streaming de collecte de télémétrie réseau en temps réel, des outils de surveillance et d'orchestration haut de gamme et des analyses d'IA, pour prendre en charge les centres de données InfiniBand.

Le produit UFM le plus basique est UFM Telemetry. Cet outil basé sur CLI peut diffuser et exporter la télémétrie via Fluent Bit vers des collecteurs de données tiers. Le produit suivant est UFM Enterprise qui propose des solutions de gestion, d'orchestration et de surveillance. UFM Enterprise peut être installé en tant qu'installation logicielle pour diverses distributions Linux, en tant que conteneur Docker ou en tant qu'appliance UFM. UFM Enterprise contient également les fonctionnalités UFM Telemetry mentionnées précédemment. Il dispose d'intégrations d'interface utilisateur Web graphique et d'API REST.

L'offre la plus complète de cette gamme est UFM Cyber-AI, qui est une plate-forme dédiée qui inclut et tire le meilleur parti de UFM Telemetry et de l'UFM Enterprise, et l'applique à l'aide d'algorithmes d'apprentissage automatique via un GPU rapide. UFM Cyber-AI utilise les données d’UFM Telemetry et la connaissance de la topologie d'UFM Enterprise pour exécuter des modules prédictifs qui génèrent des notifications utilisateur intelligentes sur les défaillances de liaison, les anomalies de réseau, les irrégularités des locataires, etc. Ces notifications sont accompagnées d'actions recommandées qui peuvent aider les utilisateurs à suivre et à entretenir la structure.

Pour résumer, NVIDIA UFM se décline en trois versions. UFM Telemetry, un outil basé sur CLI qui collecte la télémétrie en temps réel à partir de la structure et la diffuse vers des collecteurs de données tiers. De plus, l'UFM Enterprise est un outil de gestion, d'orchestration et de surveillance. Enfin, UFM Cyber-AI combine la force des deux précédentes avec un logiciel d'apprentissage automatique pour prédire les problèmes et proposer des solutions.
 
En résumé

Comment gérez-vous votre réseau InfiniBand ?

Commentaires