61 rue Henri Barbusse 92110 Clichy Levallois
info@issmi.fr

Avec S3 Vectors, AWS promet de réduire les coûts de stockage de l’IA

ISSMI, trouver un job chez des grands comptes

Avec S3 Vectors, AWS promet de réduire les coûts de stockage de l’IA

AWS affirme qu’il est possible de se passer de bases de données vectorielles spécialisées pour les applications d’IA générative et agentique. Avec à la clé des économies de stockage substantielles.

Présentée en bêta, l’offre de stockage spécialisée S3 Vectors d’AWS peut selon le fournisseur réduire le coût du téléchargement, du stockage et de l’interrogation des vecteurs jusqu’à 90 %, par rapport à l’utilisation d’une base de données vectorielle. Ces avantages pourraient intéresser ceux qui exécutent des applications d’IA générative ou d’IA agentique dans le cloud. Généralement, les modèles d’apprentissage machine représentent les données sous forme de vecteurs, c’est-à-dire des groupes de paramètres décrivant un objet, et les systèmes d’IA utilisent ces vecteurs pour rechercher et raisonner efficacement entre différents éléments de données. La plupart du temps, les vecteurs sont stockés dans des bases de données vectorielles spécialisées ou dans celles dotées de capacités vectorielles pour la recherche et l’extraction à grande échelle de similarités dans des données. Avec Amazon S3 Vector, AWS propose cette fois aux entreprises d’utiliser un type de bucket S3 spécialement conçu pour le stockage et l’interrogation de données vectorielles via un ensemble d’API dédiées, ce qui, selon le fournisseur, évite de provisionner l’infrastructure d’une base de données vectorielle.

Selon Raya Mukherjee, analyste principal chez Everest Group, en raison des différences dans leur structure et des exigences matérielles, Amazon S3 ou tout autre système de stockage objet dans le cloud est moins coûteux à gérer et à entretenir que les bases de données vectorielles, et il pourra donc aider les entreprises à simplifier l’architecture, à réduire les frais opérationnels et à diminuer les coûts. Alors que le stockage objet est conçu pour gérer de vastes volumes de données non structurées à l’aide d’une architecture plate qui minimise les frais opérationnels et prend en charge la récupération efficace de fichiers individuels, les bases de données vectorielles sont conçues pour la recherche à haute performance de similarités dans des données complexes et hautement dimensionnelles et s’appuient souvent sur des méthodes d’indexation spécialisées et une accélération matérielle qui peuvent faire grimper les dépenses d’infrastructure et d’exploitation.

Jusqu’à 10 000 index vectoriels individuels par bucket

« Chaque bucket Amazon S3 Vectors peut prendre en charge jusqu’à 10 000 index vectoriels individuels, et chaque index est capable de stocker des dizaines de millions de vecteurs, en optimisant automatiquement le stockage en termes de performances et de coûts à mesure de l’écriture, de la mise à jour ou de la suppression des vecteurs », selon AWS. De plus, AWS a intégré S3 Vectors avec Bedrock Knowledge Bases, SageMaker Unified Studio et OpenSearch Service, « ce qui devrait garantir une utilisation efficace des ressources, même si les ensembles de données augmentent et évoluent », comme l’a estimé M. Mukherjee. Alors que l’intégration avec Bedrock Knowledge Bases et SageMaker Unified Studio aidera les développeurs à créer des applications de génération augmentée de récupération (RAG) qui garantissent la rentabilité du réglage fin des LLM et réduisent les hallucinations, l’intégration d’OpenSearch offrira aux entreprises la possibilité de stocker des vecteurs rarement consultés afin de réduire les coûts. « Lorsque ces vecteurs sont nécessaires, les développeurs peuvent les transférer dynamiquement vers OpenSearch pour une recherche en temps réel et à faible latence », a expliqué AWS.

Les entreprises et les développeurs peuvent tester S3 Vectors et ses intégrations avec les autres produits maison (Bedrock, OpenSearch Service et SageMaker) dans les régions Est des États-Unis (Virginie du Nord), Est des États-Unis (Ohio), Ouest des États-Unis (Oregon), Europe (Francfort) et Asie-Pacifique (Sydney).