61 rue Henri Barbusse 92110 Clichy Levallois
info@issmi.fr

Pour les besoins des applications IA, Informatica enrichit IDMC

ISSMI, trouver un job chez des grands comptes

Pour les besoins des applications IA, Informatica enrichit IDMC

Informatica vient de mettre à jour sa plateforme de gestion de données IDMC. Un effort particulier a été mis sur la gouvernance et la conformité des modèles d’IA, ainsi que l’automatisation du master data management.

Afin d’accompagner la montée en puissance de la GenAI et des agents IA, Informatica actualise sa plateforme IDMC (intelligent data management cloud). Elle comprend plusieurs outils pour intégrer et cataloguer des données provenant de diverses sources tout en appliquant des règles de gouvernance. On retrouve ainsi des services d’extraction, de transformation et de chargement (ETL), d’observabilité des données et du master data management (MDM).

Les dernières mises à jour « aideront les entreprises à maintenir les données à un niveau de qualité et à comprendre leur provenance », indique Krish Vitaldevara, directeur des produits chez Informatica, à InfoWorld. Il cite par exemple la capacité à nettoyer, tracer et unifier les données entre les silos comme un élément essentiel pour les sociétés qui cherchent à diffuser la GenAI et les agents IA, « car la précision de leurs réponses dépend de la qualité des données sous-jacentes ». Les récentes fonctionnalités sont conçues pour automatiser une grande partie du travail en amont nécessaire à la préparation des données pour les charges de travail liées à l’IA, « élargissant ainsi la stratégie globale de l’entreprise qui consiste à se positionner comme une couche fondamentale pour la préparation à l’IA », a déclaré M. Vitaldevara.

Un moteur de correspondance granulaire et auditable

Dans le cadre du MDM, Informatica a lancé plusieurs éléments. Le premier est Claire Match Analysys and Explainability, un outil basé sur son chatbot qui donne des scores de contribution au niveau des champs. « Il indique précisément pourquoi les enregistrements des données de référence ont été mise en correspondance ou conservés séparément, en enregistrant les preuves pour les pistes d’audit », observe Devin Pratt, directeur de recherche chez IDC. Il ajoute, « pour les applications d’IA générative, cette transparence offre aux équipes la capacité de vérifier que les LLM font référence à des « golden records » légitimement fusionnés plutôt qu’à des doublons, ce qui réduit les risques d’hallucination et les problèmes de conformité ».

Dotée de capacités de réglages en libre-service, la fonctionnalité donne aux utilisateurs la possibilité d’ajuster les seuils de correspondance et de réentraîner les modèles supervisés sans intervention du service informatique, a déclaré Informatica dans un communiqué. Ces moyens d’auto-réglage accéléreront les boucles de rétroaction pour les applications basées sur l’IA, souligne Devin Pratt. L’analyste constate que si des offres concurrentes telles que SAP MDG et Stibo STEP, fournissent une correspondance assistée par le ML avec des tableaux de bord, elles ne disposent pas des capacités d’explicabilité granulaire au niveau des champs et de réglage self-service de Claire. De même, « Talend et IBM InfoSphere proposent des moteurs de correspondance, mais ils s’appuient davantage sur une gestion technique avec des explications limitées basées sur l’interface utilisateur, ce qui place Informatica en tête en matière de transparence basée sur l’IA » poursuit-il.

Un orchestrateur et un scanner de catalogue

Parmi les autres fonctionnalités, Informatica présente un orchestrateur capable d’automatiser l’enrichissement et la validation des enregistrements pour améliorer la gestion des données. Michael Ni, analyste principal chez Constellation Research, estime que cette capacité se distingue des offres similaires, car elle fonctionne dans les services du fournisseur, mais également dans des sources de données tierces y compris des LLM en temps réels. « Les concurrents tels que les plugins d’enrichissement de Stibo ou le séquençage de règles d’Ataccama nécessitent davantage de script », relève Devin Pratt.

Le spécialiste du data management a par ailleurs ajouté un scanner de catalogue de données pour le MDM afin d’automatiser le suivi de la conformité des données. Il collecte les métadonnées MDM, cartographie la traçabilité au niveau des enregistrements et s’intègre à la solution Cloud Data Governance and Catalog (CDGC) d’Informatica au sein d’IDMC pour le suivi de la conformité. « Les entreprises peuvent utiliser cette fonctionnalité pour les audits réglementaires et la découverte de fonctionnalités d’IA » indique l’analyste d’IDC.

Une gouvernance renforcée

Afin d’offrir plus de visibilité et de contrôle sur les données utilisées dans les charges de travail IA, Informatica a ajouté un catalogue de gouvernance IA, une API et une fonctionnalité de découverte du lignage des données basée sur l’IA. Le premier outil « suit les modèles propriétaires Claire, les pipelines d’apprentissage automatique des clients (TensorFlow, PyTorch, Spark ML), les LLM tiers et les dérivés affinés pour garantir un déploiement responsable et conforme dans toute l’entreprise avec une visibilité centralisée », analyse Denvin Pratt. Parmi les autres avantages, il cite la notation automatisée des risques par rapport à l’IA Act européens et aux directives du NIST, la génération de fiches modèles et des cadres pour les politiques de gestion du cycle de vie.

L’API quant à elle accélère le nettoyage des données, car elle combine les contrôles de qualité des données en temps réel d’IDMC qui peuvent servir comme points d’entrée des données. « Cette approche garantit que seules les données conformes sont utilisées dans les opérations ou les systèmes d’IA, ce qui réduit les mesures correctives en aval et renforce la confiance dans les analyses. L’API rend ces vérifications réactives et automatisées, ce qui est idéal pour les architectures cloud modernes », a déclaré Robert Kramer, analyste principal chez Moor Insights and Strategy.

IDMC supporte les serveurs MCP

Dans le lot de mises à jour, Informatica annonce la prise en charge des serveurs MCP (model context platform) par IDMC. « Les clients peuvent désormais créer et gérer leurs serveurs MCP pour se connecter à n’importe quel actif sur la plateforme cloud d’Informatica (tel que MDM) géré sur Cloud Application Integration », a déclaré la société dans un communiqué.Selon Michael Ni, de Constellation Research, le support du MCP devient une exigence incontournable pour les fournisseurs de gestion de données, car les entreprises ont besoin d’un moyen fiable pour exposer des actifs de données fiables aux agents IA.

« En intégrant les données régies, en particulier les données de référence, dans le MCP, les systèmes IA peuvent découvrir et interagir avec le contexte métier faisant autorité en temps réel, ce qui améliore leur précision et leur fiabilité » explique l’analyste. Les fournisseurs MDM traditionnels, tels que Stibo et Talend, ne se sont pas encore engagés publiquement à prendre en charge MCP. Parmi les autres mises à jour de la plateforme IDMC, citons la prise en charge de connecteurs supplémentaires d’IA générative pour l’intégration d’applications et la disponibilité de Claire Copilot pour l’intégration des données.