61 rue Henri Barbusse 92110 Clichy Levallois
info@issmi.fr

Google lance un moteur RAG dans Vertex AI

ISSMI, trouver un job chez des grands comptes

Google lance un moteur RAG dans Vertex AI

Avec Vertex AI RAG Engine, Google propose un outil pour rationnaliser le processus complexe d’extraction d’informations pertinentes d’une base de connaissances et d’alimentation d’un LLM. L’objectif est de rendre les modèles plus pertinents.

Après le choix du modèle d’IA, les entreprises sont à la recherche de techniques les rendre plus précis. C’est dans ce cadre qu’intervient le RAG pour Retrieval-Augmented Generation. Cette technique vise à rendre plus précis et plus fiables les LLM avec des sources de données spécifiques, qui n’ont souvent pas été incluses dans l’entraînement original des modèles. Plusieurs sociétés ont mis au point des outils spécifiques pour le RAG. C’est le cas de Google avec Vertex AI RAG Engine.

Dans un billet de blog, l’entreprise américaine présente l’outil comme un composant de la plateforme Vertex AI mise à disposition des développeurs pour faciliter la création et le déploiement des applications d’IA génératives. Vertex AI RAG Engine est un service managé d’orchestration qui rationalise le processus complexe de récupération des informations pertinentes et de leur transmission à un LLM.

Google a présenté le moteur RAG sur Vertex AI. (Crédit Photo : Google)

Des avantages pour une multitude de secteur

Google voit plusieurs avantages à son service. Simple, les développeurs peuvent démarrer via une API pour créer rapidement un test. Il est capable de se connecter à diverses bases de données vectorielles telles que Pinecone et Weaviate, ou utiliser Vertex AI Search. La personnalisation est de mise avec le choix dans l’analyse, le fractionnement, l’annotation, le stockage vectoriel et le recours à des modèles open source.

Dans son message, Google donne quelques exemples d’usage de moteur de RAG sur Vertex AI. Les conseillers financiers peuvent par exemple interroger un système d’IA avec le profil spécifique et les objectifs d’investissement d’un client. Le système est capable également signaler les conflits d’intérêts potentiels ou les violations de la réglementation sur la base des informations trouvées dans les données ingérées. Dans le domaine de la santé, un moteur RAG peut ingérer et indexer la vaste littérature biomédicale et les données des patients. Les cliniciens pourront établir des traitements personnalisés basés sur les caractéristiques uniques et les antécédents médicaux d’un patient.