
Alternative européenne aux géants américains du big data, Stackable a été fondé en Allemagne en 2020 par Sönke Liebau (en photo) et Lars Francke. (Crédit P.K.)
Fondé en Allemagne en 2020 par Sönke Liebau et Lars Francke, Stackable se positionne comme une alternative open source aux solutions propriétaires de Databricks, Dataiku ou Snowflake. Avec 20 salariés et une trentaine de clients incluant le ministère britannique de la Défense et Atruvia, cette start-up germanique assure la gestion des big data grâce à sa plateforme modulaire native Kubernetes qui fonctionne aussi bien sur site que dans le cloud.
La démocratisation des données d'entreprise traverse une période charnière avec l'émergence de solutions européennes qui défient l'hégémonie américaine. Stackable, plateforme de données open source née en Allemagne en 2020, incarne cette génération d'outils conçus pour répondre aux enjeux de souveraineté numérique tout en offrant une alternative crédible aux mastodontes du secteur. L'histoire de Stackable trouve ses racines dans le déclin des distributions Hadoop traditionnelles. Lorsque Cloudera et Hortonworks ont fusionné en 2018, créant de facto un monopole, l'entreprise en position dominante a rapidement supprimé sa version communautaire gratuite tout en quintuplant ses tarifs. Face à cette situation, Sönke Liebau et Lars Francke, cofondateurs de la société de conseil Open Core, ont organisé un "groupe d'entraide big data" rassemblant 60 à 70 grandes entreprises allemandes pour identifier les besoins du marché. "Quand le Covid a frappé, nous avons connu une situation de cohabitation d'adultes. Ma famille et celle de Lars sont restées ensemble chez Lars pendant deux mois", explique Sönke Liebau, cofondateur et CPO de Stackable, évoquant les circonstances particulières de la création de l'entreprise.
Kubernetes comme socle de flexibilité
La plateforme Stackable Data Platform s'appuie sur une architecture entièrement native Kubernetes qui permet un déploiement uniforme dans tous les environnements. Cette approche "Infrastructure as Code" garantit la reproductibilité des déploiements entre les environnements de développement, test et production. L'écosystème comprend une sélection d'applications open source éprouvées : Apache Kafka pour le streaming de données, Apache Spark pour le traitement, Trino pour les requêtes distribuées, Apache Druid pour l'analytique temps réel, Apache Superset pour la visualisation, ainsi qu'Apache NiFi pour l'ingestion. La gestion des certificats et de la sécurité repose sur un système d'opérateurs spécialisés - le Secret Operator pour la génération automatique de certificats et le Listener Operator pour l'exposition sécurisée des services. Cette approche automatise la complexité inhérente aux environnements Kubernetes où les adresses IP et noms d'hôtes sont dynamiques.
Local ou dans le cloud, la Stackable Data Platform répond aux principaux besoins de sécurité et de souveraineté.
Stackable capitalise sur les préoccupations croissantes liées au vendor lock-in des solutions cloud. "Si vous utilisez un fournisseur cloud, AWS ou Azure, vous obtiendrez tout ce que nous offrons, mais si vous voulez migrer vers un autre cloud ou dans votre propre centre de données, ce ne sera pas simple", analyse Sönke Liebau. La plateforme allemande répond aux défis de la dépendance technologique en proposant une solution entièrement basée sur des composants open source déployables partout. Cette approche s'inscrit dans le cadre réglementaire européen renforcé avec le Cyber Resilience Act et le Digital Operations Resilience Act (Dora) qui impose aux institutions financières d'évaluer leur capacité à remplacer leurs fournisseurs critiques. Stackable bénéficie également de certifications européennes strictes (C5, protection de base BSI et ISO 27001) et participe au groupe d'experts de la Commission européenne sur le Cyber Resilience Act.
Roadmap : vers l'intégration d'Iceberg et Polaris
La roadmap technique de Stackable s'articule autour de plusieurs axes stratégiques. Le support d'Apache Iceberg via Trino constitue une priorité majeure pour permettre la gestion de tables analytiques versionnées dans le stockage objet. L'intégration de Minio comme passerelle de stockage objet compatible S3 facilite l'interopérabilité avec les environnements cloud et hybrides. "Nous recherchons activement des alternatives à MinIO" explique toutefois le CFO, car la solution n'est plus entièrement open source. Le support de Polaris, le catalogue de métadonnées d'Apache Iceberg, figure également parmi les développements prévus pour renforcer les capacités de gouvernance des données. Les évolutions incluent également l'implémentation d'un opérateur OpenSearch, le développement d'une couche d'abstraction sécuritaire et l'intégration avec des outils de métadonnées tiers pour répondre aux besoins des grandes entreprises.
La plateforme data de Stackable est bien intégrée dans l'écosystème open source.
Atruvia, prestataire de services pour la moitié des banques allemandes, utilise Stackable pour la détection de fraude en temps réel sur les paiements. "Si notre plateforme tombe, aucun paiement n'est transféré pour une bonne partie du système bancaire allemand", souligne Sönke Liebau, qui pointe l'importance critique de cette implémentation et illustre la capacité de la solution à gérer des charges de travail très sensibles. La ville de Freibourg a aussi déployé Stackable pour proposer une plateforme open data permettant aux citoyens d'accéder et de croiser les jeux de données publics municipaux. D'autres secteurs bénéficient de la plateforme : l'industrie manufacturière pour le monitoring de performance des installations de valorisation énergétique des déchets, les services financiers pour l'analyse prédictive, ou encore les espaces de données GAIA-X pour les jumeaux numériques industriels.
Une facturation au noeud
Stackable adopte un modèle de licence basé sur la confiance (sans audit) et facture 4 000 €HT par noeud et par an. "Nous nous asseyons ensemble avec le client et évaluons combien de matériel ils auraient acheté pour ce cas d'usage à l'ancienne époque", explique le CPO. Cette approche évite la surveillance technique intrusive tout en s'adaptant aux évolutions des besoins clients. L'offre se décline en trois niveaux : Community Edition gratuite, Basic Subscription incluant templates et dashboards préconfigurés, et Business Subscription avec SLA 9/5 et support Red Hat OpenShift. Les services connexes comprennent des formations (à partir de 1 600 €HT), des audits rapides (10 000 €HT ), des preuves de concept (16 000 €HT) et des abonnements de support annuels (11 000 €HT). "Je ne pense pas que quelqu'un nous donne de l'argent pour notre logiciel. Les entreprises ont besoin de quelqu'un capable de proposer du support, d'examiner les CVE et vulnérabilités", conclut pragmatiquement Sönke Liebau sur la réalité du marché enterprise.
Suivez-nous