
Cisco a présenté le routeur 8823 embarquant la puce SiliconOne P200 pour optimiser la connectivité des datacenters IA distribués. (Crédit Photo: Cisco)
L'équipementier a présenté un routeur et une puce capables de gérer des connexions de 51,2 Tbit/s entre des datacenters distants. Ces offres répondent aux besoins de connectivités de plus en plus croissantes des clusters d'IA distribués.
Les récentes annonces de partenariats de plusieurs milliards de dollars entre les fournisseurs de services IA et les hyperscalers ou les NCP montrent que les charges de travail IA sont de plus en plus dispersées sur différents datacenters. La connectivité devient donc un point important et Cisco vient d'apporter une réponse à ce besoin avec le routeur 8223 au format 3U motorisé par la puce Silicon One P200. Le système prend en charge différents formats optiques comme l'OSFP (Octal Small Form-Factor Pluggable) et le QSFP-DD (Quad Small Form-Factor Pluggable Double Density) pour supporter les clusters IA géographiquement dispersés. Il dispose de 64 ports compatibles avec l'optique cohérente 800G et est capable de traiter plus de 20 milliards de paquets par seconde.
« Les contraintes énergétiques et les exigences de résilience incitent les hyperscalers, les néoclouds et les entreprises à adopter des clusters d'IA distribués couvrant les campus et les zones métropolitaines, qui nécessitent tous une connectivité sécurisée, performante, haute capacité et économe en énergie », a écrit Rakesh Chopra, vice-président senior de Silicon One chez Cisco, dans un article de blog. Il ajoute que le routeur « est optimisé pour les fabrics désagrégés à grande échelle au sein et entre les centres de données, permettant aux clients de faire évoluer leur infrastructure d'IA avec contrôle et efficacité ».
Silicon One P200, le coeur du réacteur
Au sein du routeur 8223, Cisco a placé son Asic Silicon One P200 spécialement conçu pour supporter une bande passante et des performances réseaux élevées. Rakesh Chopra indique que le système est capable de gérer des trafics de 51,2 Tbit/s en consommant 65% d'énergie en moins que les générations précédentes. La puce P200 gère le Radix 512 (c'est-à-dire la capacité de connecter 512 liaisons) pour supporter jusqu'à 13 petabits avec deux niveaux de routage et jusqu'à 3 exabits avec trois niveaux de routage. Au-delà des performances, Cisco rappelle les fonctions améliorées pour Ethernet au sein de son Asic à savoir le contrôle de flux optimisé, la détection et l'évitement de la congestion. Il intègre par ailleurs des éléments de sécurité comme le support de MACsec, IPsec, ClearTag et CloudSec mais aussi une chiffrement post-quantique. La puce est en concurrence directe avec Jericho 4 de Broadcom présenté début août.
La puce Silicon One P200 affiche des performances réseaux importantes taillées pour les charges de travail IA. (Crédit Photo: Cisco)
Seul ombre au tableau, certains experts ont critiqué le recours à la technologie de mémoire tampon profonde (deeper buffer) dans les Silicon One qui provoquerait de la gigue dans les charges de travail. « La véritable source de ce problème ne réside pas dans les mémoires tampon. Il s'agit d'une mauvaise gestion de la congestion et d'un mauvais équilibrage de charge avec les charges de travail de l'IA, qui sont totalement déterministes et prévisibles », explique Rakesh Chopra à Networkworld. Il ajoute qu' « il est possible de déterminer proactivement comment répartir les flux sur le réseau et éviter la congestion ». La conception à mémoire tampon profonde du 8223 offre une capacité suffisante pour stocker temporairement les paquets en cas de congestion ou de pics de trafic, une fonctionnalité essentielle pour les réseaux d'IA où la communication entre GPU peut générer des flux de données importants et imprévisibles, selon Gurudatt Shenoy, vice-président de Cisco Provider Connectivity.
Une volonté d'ouverture sur les OS
Il est à noter que les premiers systèmes d'exploitation pris en charge par le 8223 sont Sonic (Software for Open Networking in the Cloud) de la Linux Foundation et FBOSS (Facebook Open Switching System), et non IOS XR de Cisco. IXR sera également supporté, mais ultérieurement, selon le fournisseur. Le choix du NOS de Sonic est judicieux, car il est de plus en plus apprécié par les entreprises et les hyperscalers pour sa modularité, sa programmabilité et son architecture cloud. Agnostique, il peut s'exécuter sur différents commutateurs et Asis tout en prenant en charge une suite complète de fonctionnalités réseau telles que le protocole BGP (Border Gateway Protocol), l'accès direct à la mémoire à distance (RDMA), la qualité de service (QoS) et Ethernet/IP.
« Si l'on considère les besoins actuels en matière de capacité sur l'IA, les premiers clients à adresser sont les hyperscalers et la série 8000 répond à cette demande », souligne Rakesh Chopra. Le routeur 8223 et la puce P200 ont reçu un accueil positif des fournisseurs de cloud qui ont pu la tester. C'est le cas de Microsoft au sein d'Azure qui apprécie l'optimisation de la mémoire tampon et la gestion des pics de charge. De son côté, Alibaba Cloud va intégrer la puce P200 dans son architecture de datacenter et salue l'optimisation de la bande passante ainsi que la réduction de la consommation énergétique.
Suivez-nous