Pure Storage dévoile Data Stream pour l’efficacité des données en IA
Par L'équipe rédaction Neety
Publié le novembre 13, 2025

Pure Storage, en collaboration avec Nvidia, a lancé Data Stream, une solution intégrée qui promet de transformer la gestion des données pour les projets d’intelligence artificielle. Cette innovation vise à automatiser et rationaliser le processus de préparation des données, un défi majeur pour les entreprises s’engageant dans des initiatives d’IA. Découvrez comment cette solution pourrait bien changer la donne pour de nombreuses organisations.
Résumé en 3 points
- Data Stream automatise la préparation des données pour les applications d’IA, réduisant le temps de préparation qui peut représenter jusqu’à 80 % d’un projet.
- La solution connecte les pipelines de données à l’architecture IA de Nvidia, facilitant le traitement en temps réel et l’intégration de multiples formats de données.
- Elle fonctionne en tandem avec Nvidia NeMo Retriever pour optimiser l’usage des données brutes dans les systèmes d’IA.
Automatisation de la préparation des données
Pure Storage a révélé que Data Stream est une solution complète, intégrant matériel et logiciels, destinée à automatiser des tâches fastidieuses telles que la collecte, le nettoyage et la structuration des données. Grâce à cette fonctionnalité, les entreprises peuvent désormais se concentrer davantage sur la formation et le déploiement de modèles IA, un processus souvent freiné par l’immense volume de données non préparées.
Avec la possibilité de réduire considérablement le temps de préparation, Data Stream se positionne comme un outil essentiel pour les entreprises qui souhaitent accélérer leurs projets d’IA sans sacrifier la qualité des données traitées.
Collaboration avec Nvidia pour une architecture optimisée
Data Stream s’intègre de manière transparente avec l’architecture de référence IA de Nvidia, permettant une collaboration efficace entre le stockage et les GPU. Cette intégration simplifie la connexion des pipelines de données, une tâche souvent complexe et chronophage.
De plus, la solution prend en charge l’ingestion et la structuration de données en temps réel à partir de divers formats, incluant les fichiers texte, PDF et tableaux. Cette flexibilité assure une compatibilité maximale avec les applications d’IA actuelles.
Optimisation des performances de traitement
En utilisant des pipelines basés sur le Nvidia RTX Pro 6000 Blackwell Server Edition, Data Stream intègre des bibliothèques logicielles telles que Nvidia Spark Rapids et cuVS. Cette combinaison vise à prévenir les goulots d’étranglement de calcul, souvent responsables de ralentissements dans le traitement des données.
Le traitement des données se fait directement au niveau du stockage, minimisant ainsi les mouvements de données qui peuvent perturber les flux de travail et augmenter les temps de latence. Les résultats sont stockés dans des formats adaptés aux solutions de stockage vectoriel, comme JSON, Apache Parquet ou Arrow.
Pure Storage et Nvidia : une collaboration stratégique
Pure Storage, connu pour ses solutions de stockage flash, s’est associé à Nvidia, un leader mondial des technologies de calcul et de traitement graphique, pour offrir une solution qui répond aux besoins croissants des entreprises en matière d’intelligence artificielle. Cette collaboration s’inscrit dans une volonté commune de simplifier et d’optimiser les processus de gestion des données, permettant ainsi aux entreprises d’exploiter pleinement le potentiel de l’IA.
En combinant les forces de Pure Storage et Nvidia, Data Stream représente un pas en avant dans l’intégration des technologies de stockage et de traitement, ouvrant la voie à de nouvelles possibilités pour les applications d’IA en entreprise.