InfiniBand Key Features
J'écrirai sur les principales fonctionnalités d'InfiniBand dans cet article. Nvidia InfiniBand propose des solutions évolutives à haut débit et à latence extrêmement faible. La technologie InfiniBand permet aux supercalculateurs, intelligence artificielle (IA) et centres de données au cloud de fonctionner à n'importe quelle échelle, tout en réduisant les coûts opérationnels et la complexité de l'infrastructure. Dans cet article, nous verrons quelles sont les fonctionnalités clés qui font d'InfiniBand la technologie d'interconnexion de choix pour l'IA, l'apprentissage profond, la science des données et bien d'autres applications informatiques accélérées.
Tout d’abord, commençons par une gestion simplifiée. InfiniBand est la première architecture à véritablement mettre en œuvre la vision du SDN (Software Defined Network). Le réseau InfiniBand est géré par Subnet Manager. Le Subnet Manager est un programme qui gère l'ensemble du réseau. Il fournit une gestion centralisée du routage, permettant une fonctionnalité plug-and-play pour tous les nœuds du réseau. Chaque sous-réseau InfiniBand possède son propre Subnet Manager (SM) maître et, afin de garantir la résilience, le deuxième Subnet Manager (SM) fonctionne comme une réserve.
Subnet Manager (SM) |
La prochaine fonctionnalité clé d'InfiniBand présentée est la bande passante élevée. L'architecture InfiniBand a débuté son parcours en 2002 avec une vitesse de 10 Gbit/s et, depuis lors, elle fournit les liaisons bidirectionnelles non bloquantes à bande passante la plus élevée.
InfiniBand bandwidth |
La prochaine fonctionnalité clé, et certainement l'une des plus importantes pour les applications informatiques accélérées, est le déchargement du processeur. L'architecture InfiniBand prend en charge le transfert de données avec une intervention minimale du processeur. Ceci est réalisé grâce au protocole de transport basé sur le matériel, au contournement du noyau ou à la copie zéro et à l'accès direct à la mémoire à distance (RDMA). Ils effectuent un accès direct à la mémoire depuis la mémoire d’un nœud vers la mémoire de l’autre nœud sans impliquer le processeur de l’un ou l’autre. Le déchargement des nœuds de calcul peut également être implémenté par le GPU Nvidia. Nvidia GPUDirect permet le transfert direct de données de la mémoire d'un GPU vers la mémoire d'un autre. Il permet des applications informatiques accélérées telles que l'IA, l'apprentissage profond et la science des données, une faible latence et des performances améliorées, grâce au calcul basé sur GPU.
Passons maintenant à la latence et voyons à quel point la latence d’InfiniBand est incomparable à celle de toute autre technologie d’interconnexion. Une latence extrêmement faible est obtenue grâce à une combinaison de mécanisme de déchargement matériel et d'accélération unique à l'architecture InfiniBand. En conséquence, la latence de bout en bout peut être aussi lente que 1000 nanosecondes ou 1 microseconde.
Extreme low latency |
Qu'en est-il de l'évolutivité du réseau ? L'un des principaux avantages d'InfiniBand est la capacité de déployer jusqu'à 48000 nœuds sur un seul sous-réseau. Cela dit, plusieurs sous-réseaux InfiniBand peuvent être interconnectés à l'aide de routeurs InfiniBand, permettant une évolutivité facile au-delà de 48000 nœuds. Jusqu'à présent, nous avons un sous-réseau InfiniBand évolutif qui est facilement géré par le Subnet Manager et est capable de fournir une bande passante élevée et une faible latence avec un déchargement du processeur.
Commentaires
Enregistrer un commentaire