Plus d'automatisation chez Arcitecta pour mieux gérer les données

Avec une cinquantaine d'employés et des références prestigieuses, Arcitecta ambitionne de doubler ses effectifs dans les 2 prochaines années, nous a expliqué Eric Pollet, directeur du marketing produit chez Arcitecta.

Avec une cinquantaine d'employés et des références prestigieuses, Arcitecta ambitionne de doubler ses effectifs dans les 2 prochaines années, nous a expliqué Eric Pollet, directeur du marketing produit chez Arcitecta.

Fondé en 1998 à Melbourne, Arcitecta s'impose progressivement comme un acteur innovant de la gestion des flux de données non structurées. Rencontré lors de l'IT Press Tour à New York début octobre 2025, l'éditeur australien a présenté les dernières évolutions de sa plateforme Mediaflux, notamment le module Livewire pour les transferts à très haut débit et l'intégration d'une base de données vectorielle pour accompagner les entreprises dans leurs projets IA.  

Arcitecta n'est pas un nom qui résonne immédiatement dans l'univers du stockage et de la gestion des données en Europe. Pourtant, cet éditeur australien développe depuis plus de 25 ans une approche originale qui attire désormais l'attention des plus grandes institutions de recherche et d'archivage du monde. Sa plateforme Mediaflux se positionne comme bien plus qu'un simple système de fichiers : il s'agit d'un véritable tissu de gestion des données (data fabric) capable d'unifier des environnements de stockage hétérogènes tout en apportant intelligence et automatisation aux flux de données.

Une plateforme pensée pour la complexité  Au coeur de Mediaflux se trouve XODB, une base de données propriétaire développée en interne depuis 2010. Cette architecture unique permet à Arcitecta de gérer non seulement les métadonnées traditionnelles, mais aussi les relations spatiales et temporelles entre les données, ainsi que les bases vectorielles pour l'intelligence artificielle. "Mediaflux virtualise le stockage, ce qui permet aux organisations de combiner des équipements de différents fournisseurs, de différentes technologies et de différents âges sans avoir à effectuer une migration complète", nous a expliqué Eric Pollet, directeur du marketing produit chez Arcitecta. 

Cette approche vendor-agnostic séduit particulièrement les grandes institutions confrontées à l'explosion des volumes de données non structurées. Princeton University en est l'illustration parfaite : l'université a déployé Mediaflux comme socle de sa plateforme TigerData, qui gère désormais plus de 200 pétaoctets de données de recherche sur un écosystème combinant du stockage Dell, IBM et sur bande magnétique. L'un des déploiements clients gère même plus d'un trillion de fichiers dans un espace de noms unique, une prouesse technique rare dans l'industrie. 

Livewire : repousser les limites du transfert de données  L'une des innovations majeures présentées lors de l'IT Press Tour concerne le module Mediaflux Livewire, conçu pour accélérer les transferts de données massives sur des réseaux à haute latence. Confronté aux défis des connexions lentes ou irrégulières, Livewire découpe les ensembles de données volumineux en fragments plus petits, exploite les métadonnées pour prioriser la transmission et utilise le parallélisme TCP/IP pour optimiser les débits. "L'objectif global est d'intégrer le tissu de gestion des données dans le monde entier. Pour ce faire, nous avons créé notre propre réseau de transport qui fait partie intégrante de Mediaflux, et votre capacité à orchestrer le flux d'un endroit à l'autre est aussi simple que l'exécution d'un service", détaille Eric Pollet. Arcitecta affirme pouvoir transférer un pétaoctet de données en environ quinze heures, une performance qui positionne Livewire parmi les solutions les plus rapides du marché. 

Initialement conçu pour les environnements réseau à haut débit et les WAN avec une latence supérieure à 200 millisecondes, Livewire s'adapte désormais aux connexions plus modestes grâce à une modélisation des performances de chaque site, une compression automatique ajustable, la retransmission des paquets en cas d'échec et une surveillance réseau en temps réel. Les cas d'usage s'étendent des projets géospatiaux à l'imagerie médicale, en passant par l'industrie pétrolière et gazière. 

Mediaflux Real-Time : collaboration sans frontières  Lors du salon NAB 2025 à Las Vegas, Arcitecta a dévoilé Mediaflux Real-Time, une capacité inédite proposant à des équipes géographiquement dispersées de collaborer sur des fichiers en cours d'écriture. Cette fonctionnalité donne la possibilité à un utilisateur de commencer à lire un fichier dans un datacenter distant alors qu'un autre utilisateur est encore en train de l'écrire dans un autre emplacement, avec une latence de quelques dizaines à centaines de millisecondes seulement. Initialement développée pour le secteur des médias et du broadcast à la demande de Dell Technologies, cette innovation trouve des applications bien au-delà de son marché d'origine. Ainsi, les studios de post-production peuvent examiner des rendus en cours, les équipes de recherche peuvent partager des simulations en temps réel, et les organisations distribuées peuvent décentraliser leurs opérations sans sacrifier la réactivité. 

Face à la montée en puissance de l'intelligence artificielle, Arcitecta a enrichi XODB avec un support natif des bases de donnés vectorielles. Cette évolution positionne Mediaflux comme une infrastructure prête pour l'IA, capable de stocker et d'interroger simultanément les métadonnées traditionnelles, les informations géospatiales, les séries temporelles et les vecteurs générés par des modèles d'apprentissage automatique. "Notre rôle n'est pas de créer tous ces embeddings vectoriels nous-mêmes. Il existe des millions d'IA différentes, et notre travail sera de nous assurer que nous acheminons les données vers les bonnes IA adaptées à des objectifs particuliers", précise Eric Pollet. Arcitecta s'est notamment associé à Wasabi AIR (anciennement Gray Meta) pour intégrer des capacités de reconnaissance faciale, de détection d'objets et d'OCR, les vecteurs résultants étant stockés directement dans XODB et interrogeables avec le reste des métadonnées. Cette approche séduit particulièrement les institutions patrimoniales et les centres de recherche. Le National Film and Sound Archive of Australia utilise ainsi Mediaflux combiné à Wasabi AIR pour enrichir automatiquement ses collections avec des métadonnées extraites par IA, rendant des décennies d'archives audiovisuelles instantanément découvrables. Le Dana-Farber Cancer Institute développe quant à lui ses propres modèles propriétaires pour analyser des données médicales sensibles sans jamais les exposer à des services cloud publics. 

Des références, mais une visibilité encore limitée  Malgré des succès techniques indéniables et des clients de premier plan, Arcitecta peine encore à s'imposer face aux acteurs américains du stockage et de la gestion des données (Komprise, Data Dynamics ou encore Hammerspace). "Le principal défi d'Arcitecta n'est pas le produit, la technologie ou les équipes. Le problème est la visibilité de l'entreprise. Le fait d'être australien crée également des difficultés pour approcher les marchés européen et américain", reconnaît un observateur du secteur cité dans les documents de présentation. L'éditeur commence néanmoins à franchir des étapes importantes. Princeton University est devenue un ambassadeur de fait de la technologie, influençant l'adoption par Rutgers University et suscitant l'intérêt d'autres institutions. L'Imperial War Museum au Royaume-Uni et la Technische Universität Dresden en Allemagne ont également choisi Mediaflux pour moderniser leurs infrastructures de gestion d'archives numériques. Fort d'une équipe d'environ 50 personnes réparties entre l'Australie, les États-Unis et l'Europe, Arcitecta prévoit d'accélérer son expansion. L'entreprise vise un doublement de ses effectifs américains et européens dans les deux prochaines années, tout en ciblant davantage les entreprises du Fortune 500. "Nous avons actuellement trois ou quatre de ces grandes entreprises en phase de preuve de concept ou de test bêta. Nous y arrivons progressivement", indique le dirigeant d'Arcitecta. 

Pour renforcer sa présence et fédérer les utilisateurs de Mediaflux, Arcitecta a organisé en septembre 2025 à Boston le premier événement Datakamer, une conférence d'un jour réunissant chercheurs, archivistes, technologues et décideurs autour des défis de la gestion des données à grande échelle. Contrairement aux salons technologiques traditionnels, Datakamer se voulait une "intervention créative dans le continuum des données", favorisant les échanges entre pairs et l'établissement de bonnes pratiques plutôt que les discours commerciaux. Le succès de cette première édition a encouragé Arcitecta à planifier des événements similaires en Europe, en Australie et potentiellement à Princeton University, qui s'est proposée comme modératrice pour de futurs rassemblements. Cette approche centrée sur la communauté reflète la philosophie de l'entreprise : plutôt que de vendre une solution clef en main, Arcitecta cherche à accompagner ses clients dans la transformation de leurs pratiques de gestion des données sur le long terme. 

Perspectives et défis à venir  Pour les six prochains mois, Arcitecta prévoit d'enrichir Mediaflux avec un module Python facilitant l'intégration avec les workflows de data science, des mises à jour de son système de gestion d'actifs numériques (DAMS), une expansion des capacités de la base de données vectorielle et des outils pour simplifier les déploiements. L'entreprise maintient également un rythme soutenu de présence dans les événements sectoriels, avec des participations prévues à Supercomputing 2025, SC Asia, Data Week avec Wasabi, eResearch avec IBM et NAB 2026 avec Dell Technologies. 

Le pari d'Arcitecta repose sur une conviction forte : dans un monde où les données non structurées explosent et où l'intelligence artificielle devient omniprésente, les organisations ont besoin d'une infrastructure capable de gérer la complexité tout en restant agnostique vis-à-vis des technologies sous-jacentes. "Mediaflux n'est pas simplement un système de fichiers, c'est un tissu de données de bout en bout qui converge la gestion, l'orchestration, l'accès multi-protocole et le stockage dans un système unique", résume Eric Pollet. Reste à savoir si cette vision suffira à faire d'Arcitecta un acteur incontournable sur un marché déjà bien encombré. 

s'abonner
aux newsletters

suivez-nous

Publicité

Derniers Dossiers

Cybersécurité, le double visage de l'IA

Cybersécurité, le double visage de l'IA

En cybersécurité, l'IA joue un double rôle : le gentil en aidant à détecter et à prévenir les menaces, à automatiser les processus de sécurité, à simuler et anticiper les...

Publicité