
Les fournisseurs comme CoreWeave, Lambda Labs ou Crusoe proposent des GPU as a service pour les charges de travail IA des entreprises. (Crédit Photo: Coreweave)
Une étude montre l'appétence des entreprises pour l'utilisation des services de GPU as a service des NCP pour leurs charges de travail IA. Elles mettent en avant le prix et la disponibilité des ressources par rapport aux hyperscalers.
Avec la demande croissante de ressources IT pour l'IA, l'intérêt pour les NCP ou nécloud provider fournissant des services de GPU as a service ne cesse de grandir. Ce modèle commercial promu par des sociétés comme CoreWeave, Lambda Labs ou Crusoe représente une alternative aux hyperscalers. Une étude menée en juillet par le site d'évaluation des hébergeurs HostingAdvice montre cette percée. Elle a sollicité 350 professionnels IT américains de différents horizons (ingénieur de la donnée, datascientist, architectes cloud, spécialistes FinOps) dans des secteurs variés (santé, logiciels, IT, finance et automobile). Le fait saillant de l'enquête est que 90% des sondés utilisent déjà des néoclouds ou prévoient d'y avoir recours. Dans le détail, 25 % utilisaient déjà largement les néoclouds, 34 % les testaient et 21 % prévoyaient de les adopter dans les six mois.
La disponibilité et les coûts mis en avant
Les raisons pour s'orienter vers des NCP sont doubles : la disponibilité et le cloud. Pour près d'un tiers des personnes interrogées, c'est la réduction des temps d'attente qui a justifié le recours à des NCP. Plus d'un tiers des sondés ont répondu qu'ils devaient généralement attendre entre deux et quatre semaines pour obtenir un accès à un GPU auprès des fournisseurs de cloud traditionnels, et 20 % ont indiqué un délai de trois mois ou plus. Selon Joe Warnimont, analyste senior chez HostingAdvice, des délais d'attente de plusieurs semaines ou de plusieurs mois pour obtenir un GPU représentent un énorme problème. « Imaginez un DSI qui doit annoncer à son conseil d'administration qu'un important projet d'IA est retardé d'un trimestre parce qu'il ne peut pas se procurer ces ressources spécifiques », observe-t-il. « Si un concurrent peut déployer des modèles trois mois plus vite, ce n'est pas seulement un inconvénient, c'est un énorme désavantage concurrentiel », ajoute-t-il. A l'appui de ces propos, Bijit Ghosh, directeur général de l'IA/ML, des données et du cloud chez la banque Wells Fargo, explique que « les néoclouds offrent une alternative attrayante alors que la pénurie de GPU ralentit les initiatives en matière d'IA ». Et il ajoute que « si Wells Fargo n'est pas encore passée à un néocloud, elle évalue les options ». Il estime que « l'accès aux GPU sans avoir à attendre plusieurs mois comme c'est le cas avec les hyperscalers est l'avantage le plus significatif ». Enfin, « quand une banque dispose d'un nouveau modèle de risque ou d'une IA de détection des fraudes, elle ne veut surtout pas attendre 90 jours pour accéder à des GPU A100 de Nvidia. »
La disponibilité des GPU arrive en tête des raisons pour utiliser un néocloud. (Crédit Photo : Hosting Advice)
Alors que seulement 13 % des répondants ont déclaré que le coût était le principal facteur motivant l'utilisation des néoclouds, près de la moitié d'entre eux ont affirmé pouvoir économiser 25 % ou plus en abandonnant les hyperscalers. « Les pressions inflationnistes, les droits de douane et tout le reste créent actuellement beaucoup d'incertitude », a expliqué Joe Warnimont. « Si l'on peut réaliser ne serait-ce qu'une petite économie, c'est toujours bon à prendre, et 25 % à 50 % d'économies sur un budget d'infrastructure d'IA, c'est assez considérable, voire transformationnel. » Le responsable de Wells Fargo module cet enthousiasme, « si les néoclouds ne sont pas toujours moins chers en dollars par heure que AWS ou Azure, leur tarification peut être plus prévisible en raison du nombre réduit de coûts cachés liés à la sortie ou au stockage des données ».
Des limites sur le réseau et des fonctionnalités cloud
« Face à ces questions de coût et d'accès, l'émergence des néoclouds est devenue cruciale et quelque peu prévisible pour accompagner l'expansion d'un marché stimulée par les exigences de l'IA », a expliqué par ailleurs Mitch Ashley, vice-président et responsable des pratiques DevOps et du développement d'applications chez le cabinet d'analyse The Futurum Group. Les NCP « ne sont pas seulement de nouveaux acteurs ; ils constituent une réponse directe du marché à la demande croissante et anticipée en charges de travail IT liées à l'IA, notamment en termes de disponibilité et de coût des GPU haut de gamme », a-t-il justifié. « Les entreprises se tournent vers ces néoclouds et leurs hyperscalers existants pour obtenir une solution ciblée et plus rentable », ajoute-t-il. Pour l'analyste, « l'avenir de ce marché ne réside pas dans la concurrence avec les hyperscalers sur tous les fronts, mais dans la fourniture d'une passerelle hautement performante et accessible vers l'innovation en matière d'IA ».
Cependant, selon lui, « les DSI doivent être conscients de certains problèmes ». En particulier, « ils doivent examiner la compatibilité avec les réseaux clients existants, car les NCP s'appuient souvent sur des structures à haut débit telles qu'InfiniBand ». De plus, « les néoclouds n'offrent pas non plus toutes les fonctionnalités cloud proposées par les hyperscalers, ce qui signifie que l'orchestration multicloud et inter-environnements des charges de travail est généralement nécessaire », a-t-il fait remarquer.
Quel avenir pour les NCP
L'avenir du marché est également incertain. Joe Warnimont, de HostAdvice, pense que les NCP vont devenir des cibles de rachat pour les hyperscalers, même si une poignée de leaders du marché pourraient émerger et survivre. M. Ghosh, de Wells Fargo, estime pour sa part que les NCP se tailleront une place permanente aux côtés des fournisseurs traditionnels de cloud. « Les hyperscalers sont excellents en termes d'échelle et d'étendue des services, mais les néoclouds l'emportent en matière de spécialisation, d'optimisation des performances et de vitesse d'accès », a-t-il soutenu. « Dans les secteurs réglementés comme le secteur bancaire, les NCP peuvent se vendre comme des partenaires stratégiques pour la capacité de pointe », a-t-il ajouté. « Nous pouvons conserver nos charges de travail stables sur site ou dans des clouds privés, puis exploiter les néoclouds lorsque nous avons besoin d'une puissance GPU immédiate », a encore expliqué le dirigeant. « L'essentiel est d'avoir plus de contrôle sur l'emplacement où s'exécutent les charges de travail, de les placer de manière adaptée à leur usage et d'obtenir le meilleur rendement possible de ces investissements », conclut-il.
Suivez-nous