La gamme de serveurs et de puces Power11 déployée par IBM doit aider les entreprises clientes à développer des infrastructures pour l'IA sécurisée, le cloud hybride et l'informatique edge.
Disponible à partir du 25 juillet, la série IBM Power11 comprend divers modèles, depuis un système phare haut de gamme Power E1122 jusqu'à un système d'entrée de gamme Power S1012. Grâce à une intégration plus étroite avec Red Hat et Watsonx, tous ces modèles peuvent aider les entreprises clientes à développer leur infrastructure IA, à mettre en oeuvre des applications pilotées par LLM et à étendre l'écosystème cloud hybride d'IBM. Selon Tom McPherson, directeur général Power Systems d'IBM, la famille de serveurs Power11 offrira également un temps de disponibilité et une sécurité garantis. La prise en charge de l'accélérateur Spyre AI Accelerator de big blue, disponible au quatrième trimestre 2025, renforcera le rôle des serveurs en tant que boîte de développement de l'IA, ce qui, selon IBM, augmentera considérablement la vitesse et la précision des capacités de traitement de l'IA pour la famille de serveurs Power. En déchargeant les tâches d'IA sur l'accélérateur, les serveurs Power11 peuvent améliorer les performances et donc des temps de réponse plus rapides ainsi qu'une meilleure efficacité globale du système.
Dès qu'il sera disponible, IBM intégrera l'accélérateur Spyre dans ses principaux serveurs, y compris avec le processeur Telum II de ses mainframes z17 et LinuxONE. Toujours selon IBM, l'accélérateur Spyre contient 1 To de mémoire et 32 coeurs accélérateurs IA qui partageront une architecture similaire à l'accélérateur IA intégré dans la puce Telum II. Chaque Spyre est monté sur une carte PCIe. « Il est possible de connecter plusieurs accélérateurs Spyre afin d'augmenter de manière substantielle la quantité d'accélération disponible », a précisé IBM. « Spyre est un accélérateur de niveau entreprise conçu pour les tâches d'inférence de l'IA avec une efficacité et une évolutivité élevées, en particulier pour les modèles complexes et l'IA générative », a écrit Chris Drake, directeur de recherche senior au sein de l'organisation mondiale de recherche sur les infrastructures d'IDC, dans un rapport sur ces serveurs. « Cela permettra une intégration transparente de l'IA dans les applications et les flux de travail existants fonctionnant sur Power et le déploiement d'une gamme plus large de cas d'usage de l'IA. Big blue cherche également à utiliser l'IA pour moderniser les applications Power avec le prochain Watsonx Code Assistant for i », a ajouté M. Drake. « Celui-ci devrait accélérer les tâches de modernisation du langage de programmation RPG pour les applications IBM i grâce à des capacités alimentées par l'IA et disponibles directement dans l'environnement de développement intégré. »
L'accélérateur IA Spyre embarque 32 coeurs d'accélérateur individuels et contient 25,6 milliards de transistors. (Crédit IBM)
Les caractéristiques du serveur Power E1180 sont les suivantes :
- Processeur avec 10, 12 ou 16 coeurs fonctionnant à 4,4 GHz.
- Jusqu'à 256 coeurs de processeur Power11 dans un système avec jusqu'à quatre noeuds ; jusqu'à 64 To de mémoire DRAM DDR5 à 4000 MHz, et six PCIe Gen4 x16 dont quatre peuvent être PCIe Gen5 x8 et deux PCIe Gen5 x8.
- Un tiroir d'extension E/S PCIe Gen4 4U de 19 pouces et des modules de ventilation PCIe, prenant en charge un maximum de 192 emplacements PCIe et quatre tiroirs d'extension E/S par noeud.
- Des cartes PCIe Gen1, Gen2, Gen3, Gen4 et Gen5 prises en charge dans le noeud du système, et des cartes PCIe Gen1, Gen2, Gen3 et Gen4 prises en charge dans le tiroir d'extension E/S.
- Le support des partitions logiques dynamiques Dynamic LPAR pour ajuster les charges de travail entre les ressources processeur et mémoire.
- La technologie Active Memory Expansion (AME) optimisée sur le processeur.
- Des pools d'entreprise Power qui offrent une flexibilité inégalée pour l'équilibrage de la charge de travail et la maintenance du système.
« Le serveur de milieu de gamme Power E1150 d'IBM, monté en rack 4U, prend en charge 32 à 120 coeurs de processeurs, 256 Go à 16 To de mémoire DDR4 OMI haute performance jusqu'à 4000 MHz et les options Elastic, Mobile et Shared Utility Capacity, ce qui signifie qu'avec ce système, les clients peuvent déployer une consommation payante de processeurs, de mémoire et de systèmes d'exploitation pris en charge, par jour, sur un ensemble de systèmes Power E1150 », a affirmé IBM. Le serveur Power11 d'entrée de gamme S1122is monté en rack a2U peut prendre en charge deux processeurs Entry Single-Chip Module (eSCM) ou Dual Chip Mode (DCM) par serveur, en fonction des besoins en énergie du client. Chaque module à puce unique (SCM ou Single Chip Module) du processeur Power11 contient deux contrôleurs de mémoire. Quatre processeurs 10 coeurs 3.90 - 4.20 GHz (max), quatre processeurs 12 coeurs 3.90 - 4.40 GHz (max), ou quatre processeurs 16 coeurs 3.80 - 4.30 GHz (max) sont utilisés dans chaque noeud du système, fournissant 40 coeurs (par noeud) à un système de 160 coeurs, 48 coeurs (par noeud) à un système de 196 coeurs, ou 64 coeurs (par noeud) à un système de 256 coeurs, d'après IBM.
« La plateforme Power11 a été spécialement conçue pour aider les entreprises à exploiter les opportunités à l'ère de l'IA et des opérations hybrides et multicloud », a encore écrit M. Drake. « Déjà, Power11 répond aux exigences de performance et de conformité de l'IA, y compris les capacités d'accélération et la capacité d'accéder, de transformer et de gérer les données d'entreprise à l'échelle, et de prendre en charge l'intégration transparente des capacités d'IA générative (GenAI) avec les processus critiques de l'entreprise », a-t-il avancé. « Ensuite, la plateforme prend en charge des capacités d'automatisation, ce qui se traduit par une série d'avantages en termes de gestion, de fiabilité, de sécurité et de durabilité pour les clients de la plateforme Power », a-t-il poursuivi. « Enfin, Power11 est conçu pour prendre en charge une infrastructure hybride distribuée et flexible, avec un placement des charges de travail orienté vers l'entreprise sur site, le cloud public ou privé en fonction des besoins de performance, de coût et de conformité. »
Accélérer l'exploitation de l'inférence
« Tous les serveurs comprennent un accélérateur Matrix Math Accelerator basé sur l'IA qui facilite l'inférence AI in-core et l'apprentissage machine là où résident les données », a indiqué IBM. Le fournisseur affirme qu'il peut n'y avoir aucun temps d'arrêt planifié pour la maintenance du système. Par exemple, « des fonctions telles que les correctifs autonomes, le déplacement automatisé de la charge de travail et les événements de maintenance planifiée du système peuvent se produire sans jamais mettre les applications critiques hors ligne », comme l'a expliqué Bargav Balakrishnan, vice-président de la gestion des produits chez IBM. « Cette fonction peut éviter aux professionnels de l'IT de perdre du temps à planifier, tester et exécuter les mises à niveau de leurs systèmes », a précisé M. Balakrishnan. « Les serveurs Power prennent en charge le Power Cyber Vault d'IBM qui utilise l'IA/ML et le cadre de cybersécurité du NIST pour identifier, protéger, détecter et répondre automatiquement et instantanément aux cybermenaces », a-t-il ajouté.
« Cyber Vault offre une protection contre les cyberattaques telles que la corruption et le cryptage des données grâce à des instantanés proactifs immuables qui sont automatiquement capturés, stockés et testés selon un calendrier personnalisé. Power11 utilise également une cryptographie quantique intégrée approuvée par le NIST, qui peut aider à protéger les systèmes contre les attaques de type 'harvest-now, decrypt later' ainsi que contre les attaques d'intégrité du firmware », a fait valoir M. Balakrishnan.
Autres caractéristiques des serveurs :
- PowerVC : cette solution logicielle de virtualisation et de gestion du cloud est conçue pour les systèmes Power. Elle est basée sur Openstack et simplifie la gestion des machines virtuelles AIX, IBM i et Linux fonctionnant sur Power Systems.
- La console de gestion du cloud Cloud Management Console (CMC) : ce service basé sur le cloud fournit une plateforme centralisée pour la surveillance et donne un aperçu de l'infrastructure Power Systems.
- La console de gestion du matériel Hardware Management Console (HMC) : cette appliance est utilisée pour configurer et gérer les systèmes Power. Elle facilite la gestion du matériel des serveurs Power, la gestion de l'hyperviseur Power et de la virtualisation, la gestion des services et des mises à jour, la surveillance, et constitue un point d'intégration pour d'autres solutions Power.
- Pour moderniser davantage le développement d'applications, Watsonx Code Assistant for i peut aider les développeurs à étendre les applications RPG pour plus de facilité et de productivité. À noter que Watsonx.data, le lac de données hybride et ouvert d'IBM, sera disponible sur Power11 d'ici à la fin de l'année 2025.
« IBM est bien placée pour fournir à ses clients un écosystème d'IA flexible, rentable et efficace sur le plan opérationnel, qui prend en charge le développement et le déploiement de l'IA dans divers environnements cloud, distribués et souverains », a écrit M. Drake. « En intégrant l'automatisation pilotée par l'IA dans l'IT, la cybersécurité et la gestion des données, IBM sera un moteur de l'adoption de l'IA dans toute une série d'industries réglementées, y compris dans les services financiers et la santé, où la confiance et la gouvernance sont essentielles », a ajouté M. Drake.
Mais selon lui, le plus grand défi de big blue sera de démontrer la mise à l'échelle des solutions d'IA et des bases de clients au-delà de sa base traditionnelle. « D'autres grands fournisseurs de services cloud et fournisseurs de services numériques hyperscale déploient et font également la promotion active de services cloud natifs de l'IA qui offrent une intégration transparente avec des écosystèmes plus vastes. IBM doit donc s'assurer qu'elle est perçue comme un catalyseur essentiel de l'IA dans des environnements hybrides et interopérables », a convenu M. Drake.
Suivez-nous