Métiers

Thèmes

Services

17

Juin

2025

Toute l'actualité > Economie

Canalys : des coûts peu clairs limitent l'utilisation de la GenAI par les entreprises

Etudes et chiffres clés,

Les tarifs au token ont été adoptés par tous les fournisseurs de LLM en mode SaaS. (Crédit S.L.)

Les tarifs au token ont été adoptés par tous les fournisseurs de LLM en mode SaaS. (Crédit S.L.)

Le cabinet d'études estime que le potentiel plus large de l'IA générative reste inexploité, car les entreprises craignent les coûts récurrents liés au cloud.

Alors que les entreprises passent de la phase de test des outils et modèles d'IA générative à leur utilisation dans le monde réel (également appelée « inférence »), elles ont du mal à prévoir ce que cette utilisation entraînera en termes de coûts cloud, selon une étude du cabinet d'analyse Canalys . « Contrairement à la formation, qui est un investissement ponctuel, l'inférence représente un coût opérationnel récurrent, ce qui en fait une contrainte cruciale sur la voie de la commercialisation de l'IA », a déclaré Rachel Brindley, directrice principale chez Canalys, dans un communiqué. « À mesure que l'IA passe de la recherche au déploiement à grande échelle, les entreprises se concentrent de plus en plus sur la rentabilité de l'inférence, en comparant les modèles, les plateformes cloud et les architectures matérielles telles que les GPU par rapport aux accélérateurs personnalisés. »

Selon Yi Zhang, chercheur chez Canalys, de nombreux services d'IA reposent sur des modèles de tarification basés sur l'utilisation, qui facturent par jeton ou par appel API, ce qui rend difficile la prévision des coûts lors de l'augmentation de l'utilisation. « Lorsque les coûts d'inférence sont volatils ou excessivement élevés, les entreprises sont obligées de limiter l'utilisation, de réduire la complexité des modèles ou de restreindre la mise en oeuvre à des scénarios à forte valeur ajoutée. En conséquence, le potentiel plus large de l'IA reste sous-exploité », a souligné M. Zhang.

Par Viktor Eriksson, ComputerWorld (adapté par Serge Leblal)

Articles sur Canalys

Articles Etudes et chiffres clés

Articles les plus lus

Laetitia Varin rejoint Orange Cyberdefense pour créer son canal de vente indirecte

Laetitia Varin rejoint Orange Cyberdefense pour créer son canal de vente indirecte

Avec E-deal 2027, Efficy permet de piloter son CRM en langage naturel

Avec E-deal 2027, Efficy permet de piloter son CRM en langage naturel

La start-up lyonnaise Wikit rachetée par Nexpublica

La start-up lyonnaise Wikit rachetée par Nexpublica

Arrow référence les onduleurs d'ABB pour l'Europe

Arrow référence les onduleurs d'ABB pour l'Europe

Articles à la une

Nextcloud ouvre davantage son App Store aux ISV

Nextcloud ouvre davantage son App Store aux ISV

Arrow référence les onduleurs d'ABB pour l'Europe

Arrow référence les onduleurs d'ABB pour l'Europe

Beemo valide la certification HDS v2.0

Beemo valide la certification HDS v2.0

Laetitia Varin rejoint Orange Cyberdefense pour créer son canal de vente indirecte

Laetitia Varin rejoint Orange Cyberdefense pour créer son canal de vente indirecte

Upscale AI prépare le déploiement de la technologie réseau Skyhammer

Upscale AI prépare le déploiement de la technologie réseau Skyhammer

Fabien Petiau nommé vice-président de Cloudera France

Fabien Petiau nommé vice-président de Cloudera France

NEWSLETTER
DISTRIBUTIQUE

Cet article vous a plu? Retrouvez toutes l'actu de distributique

ABONNEZ-VOUS

s'abonner
aux newsletters

suivez-nous

Publicité

Derniers Dossiers

Cybersécurité, le double visage de l'IA

Cybersécurité, le double visage de l'IA

En cybersécurité, l'IA joue un double rôle : le gentil en aidant à détecter et à prévenir les menaces, à automatiser les processus de sécurité, à simuler et anticiper les...

DEE: l'efficacité énergétique bientôt une obligation pour les datacenters

DEE: l'efficacité énergétique bientôt une obligation pour les datacenters

Des datacenters plus durables et plus efficaces, c'est ce que recherchent les pouvoirs publics européens avec la mise en oeuvre de la nouvelle Directive sur l'efficacité...

Datacenters : HPC et IA accélèrent l'adoption du refroidissement liquide

Datacenters : HPC et IA accélèrent l'adoption du refroidissement liquide

A l'occasion du salon Data Centre World Paris 2024 qui s'est tenu en novembre dernier à Paris Porte de Versailles, la consommation énergétique était au centre des discussions à...

Voir tous les dossiers

Publicité

Distributique.com Le site préféré des professionnels du Channel

Carrières

Laetitia Varin rejoint Orange Cyberdefense pour créer son canal de vente indirecte

Laetitia Varin rejoint Orange Cyberdefense pour créer son canal de vente indirecte En tant que responsable du channel, Laetitia Varin aura pour mission...

Fabien Petiau nommé vice-président de Cloudera France

Fabien Petiau nommé vice-président de Cloudera France Passé notamment par Checkmarx et ServiceNow, Fabien Petiau aura pour mission...

Tous les articles carrières

Nouveaux produits

Aquaris M10 - BQ

Aquaris M10 : Une tablette sous Ubuntu qui se transforme en PC Ref : Aquaris M10
Marque : BQ
Prix : 250

En juin dernier, l'espagnol BQ lançait, en partenariat avec Canonical, le premier smartphone tournant sous l'OS Ubuntu. Il récidive aujourd'hui dans le domaine des tablettes en annonçant la mise...

Tous les nouveaux produits

Régions

Tous les articles régions

SUIVEZ-NOUS

Inscription Newsletters

SITE

CATÉGORIES

© Distributique.com 1997 - 2026

Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées sur ce site, faite sans l'autorisation de l'éditeur ou du webmaster du site Distributique.com est illicite et constitue une contrefaçon.