Cisco accélère et sécurise le RAG avec InsightEngine de Vast Data

Matériels, Logiciels,

Les architectures de référence Secure AI Factory de Ciso pour Nvidia embarquent maintenant InsightEngine de Vast Data. (crédit : Vast Data)

Les Pod IA de Cisco, clés de voûte de l'infrastructure Secure AI Factory de Cisco, intègrent désormais InsightEngine de Vast Data. Ce moteur de données, incluant les microservices Nvidia NeMo Retriever et NIM, accélère et sécurise le RAG pour les agents d'IA.

Annoncée en mars dernier lors de la GTC de Nvidia, la solution Secure AI Factory de Cisco sert à construire et sécuriser des infrastructures taillées pour exécuter des workloads d'IA. Au coeur de cette architecture de référence, on trouve des Pod IA pour transformer des données brutes en ensembles de données prêts pour l'IA. Ces derniers s'appuient sur des serveurs UCS équipés de GPU Nvidia RTX Pro 6000 Blackwell Server Edition qui sont parmi les premiers systèmes à intégrer le design de référence AI Data Platform de Nvidia.

Pour accélérer les pipelines de génération augmentée de récupération (RAG) et garantir un accès temps réel et sécurisé aux modèles et aux données, Cisco a annoncé que ses Pod IA intègrent désormais InsightEngine de la société israélienne Vast Data spécialisée dans le stockage scale-out. Avec ce partenariat, « nous apportons aux entreprises l'accélération RAG à grande échelle », fait savoir John Mao, vice-président des alliances stratégiques du spécialiste du stockage « L'intégration d'InsightEngine dans l'architecture Secure AI Factory ouvre la voie à une nouvelle ère où les agents IA peuvent fonctionner de manière sécurisée, collaborative et à une échelle sans précédent ».

La latence des pipelines de RAG réduite Cette association promet plusieurs avantages : réduction de la latence des pipelines de RAG de quelques minutes à quelques secondes, fonctionnement en continu des agents IA, pile d'infrastructure complète simplifiée et pré-validée pour l'IA, expérience utilisateur améliorée pour les datascientists et les développeurs pour améliorer la productivité...

InsightEngine inclut les microservices Nvidia NeMo Retriever et Nvidia NIM pour se connecter à des données propriétaires et sécuriser à grande échelle les opérations de RAG. « Cette approche propose aux utilisateurs IA d'utiliser facilement ces modèles et d'exécuter leurs pipelines RAG directement sur le système d'exploitation Vast AI. Grâce au contrôle d'accès basé sur les rôles (RBAC) et à la conformité et la préparation aux audits, les entreprises peuvent faire confiance à leur infrastructure pour protéger leurs informations sensibles », assure Vast Data. « InsightEngine gère le cycle de vie, le déploiement et l'auto-scaling de ces modèles, offrant ainsi un autre niveau d'efficacité pour les applications d'IA », conclut-il.