Amazon SageMaker Data and AI Governance

Découvrez, gérez et collaborez sur les données et l’IA en toute sécurité

Présentation

La nouvelle génération d’Amazon SageMaker simplifie la découverte, la gouvernance et la collaboration en matière de données et d’IA dans votre environnement, vos modèles d’IA et vos applications. Avec Amazon SageMaker Catalog, basé sur Amazon DataZone, les utilisateurs peuvent découvrir et accéder en toute sécurité à des données et à des modèles approuvés à l’aide de la recherche sémantique avec des métadonnées créées par l’IA générative, ou vous pouvez simplement demander à Amazon Q Developer en langage naturel de trouver vos données. Les utilisateurs peuvent définir et appliquer des politiques d’accès de manière cohérente à l’aide d’un modèle d’autorisation unique avec des contrôles d’accès ultraprécis de manière centralisée dans Amazon SageMaker Unified Studio (version préliminaire). Partagez et collaborez en toute simplicité sur les données et les actifs d’IA grâce à des flux de publication et d’abonnement simplifiés. Avec SageMaker, vous pouvez sauvegarder et protéger vos modèles d’IA à l’aide des barrières de protection Amazon Bedrock et mettre en œuvre des politiques d’IA responsable. Instaurez la confiance au sein de votre organisation grâce à la surveillance et à l’automatisation de la qualité des données, à la détection des données sensibles et au lignage des données et du machine learning (ML).

Avantages

Découvrez vos données et vos ressources d’IA mises à l’échelle grâce à SageMaker Catalog, basé sur Amazon DataZone. Améliorez la découverte des données grâce à l’IA générative pour enrichir automatiquement vos données et vos métadonnées en fonction du contexte commercial, permettant ainsi à tous les utilisateurs de trouver, de comprendre et d’utiliser facilement les données. Partagez vos données, vos modèles d’IA, vos invites et vos ressources d’IA générative en filtrant par noms de tables et de colonnes ou par termes du glossaire métier. Recommandez automatiquement des colonnes applicables et des applications analytiques pertinentes pour chaque jeu de données, afin de pouvoir utiliser les bonnes données pour créer rapidement les bons modèles. Soutenez les modèles de gouvernance centralisés et décentralisés grâce à un partage transparent des données et de l’IA sur la base de flux de travail de publication et d’abonnement au sein d’une expérience unique en cliquant sur « Projects ».

Gagnez en confiance grâce à une visibilité en temps réel de la qualité des données et au lignage des données et du ML dans SageMaker. Automatisez le profilage des données et les recommandations relatives à la qualité des données, surveillez les règles de qualité des données et recevez des alertes. Résolvez les problèmes de qualité des données difficiles à trouver en utilisant des approches d’une part basées sur des règles et d’autre part de ML pour réconcilier les entités afin de fournir des données de haute qualité qui permettront de prendre des décisions métier en toute confiance. Améliorez la transparence des pipelines de données et des projets d’IA grâce à la surveillance intégrée des modèles pour détecter les biais ou rendre compte de la manière dont les fonctionnalités contribuent à la prédiction modélisée.
Centralisez la sécurité des données et de l’IA dans SageMaker grâce à des contrôles d’accès ultra-précis, à une classification des données et à des barrières de protection pour garantir une utilisation appropriée des données, de l’analytique et des modèles d’IA. Définissez les autorisations une seule fois et appliquez-les à l’ensemble des données et des modèles. Grâce à l’intégration native d’Amazon Bedrock IDE (version préliminaire), les clients peuvent utiliser les barrières de protection Amazon Bedrock dans leur application d’IA générative en bloquant le contenu préjudiciable, en filtrant les hallucinations et en activant des mesures de protection personnalisables en matière de confidentialité, de sécurité et de précision. Identifiez automatiquement les informations sensibles dans vos pipelines à l’aide d’Amazon Comprehend.
Respectez les normes d’audit et de conformité réglementaire en matière d’utilisation des données, de consignation et de surveillance des modèles. Favorisez une utilisation acceptable de vos actifs analytiques et d’IA au sein de toute votre entreprise grâce à une isolation basée sur les projets. Comprenez l’utilisation des données et modélisez l’utilisation de votre lakehouse de données pour une sécurité renforcée. Utilisez Amazon SageMaker Clarify pour contrôler les biais, la précision et la robustesse des modèles, conformément à vos normes d’IA responsable. Alignez les coûts sur les initiatives commerciales et obtenez une vision claire de vos investissements commerciaux.

Caractéristiques

Des données sélectionnées pour le contexte et la capacité de localisation

SageMaker Catalog présente un contexte métier à vos métadonnées techniques et vous permet de les enrichir à l’aide du contexte métier. Vous pouvez rendre les données visibles grâce au contexte métier afin que tous vos utilisateurs puissent les trouver, les comprendre et leur faire confiance rapidement et facilement.

Recommandations en matière de métadonnées automatisées

Automatisez l’ajout de descriptions et de noms commerciaux aux données afin de comprendre facilement le contexte et d’éviter d’avoir à utiliser des noms techniques cryptiques. Cette automatisation est alimentée par de grands modèles de langage (LLM) pour une précision et une cohérence accrues.

Garantissez un niveau constant de sécurité de l'IA dans toutes vos applications

Les barrières de protection Amazon Bedrock permettent d’évaluer les entrées des utilisateurs et les réponses des modèles de fondation (FM) en fonction de politiques spécifiques à chaque cas d’utilisation, et fournissent un niveau de protection supplémentaire indépendamment des FM sous-jacents.

Auditez et suivez rapidement les modèles

Auditez et dépannez rapidement les performances de tous les modèles, points de terminaison et tâches de surveillance des modèles grâce à une vue unifiée. Suivez les déviations par rapport au comportement prévu du modèle, ainsi que les tâches de surveillance manquantes ou inactives, grâce à des alertes automatiques.

Qualité des données

Grâce aux statistiques de qualité des données, les consommateurs de données peuvent consulter les métriques de qualité des données provenant d’AWS ou de systèmes tiers. Les consommateurs de données peuvent faire confiance aux sources de données qu’ils utilisent pour prendre des décisions et bénéficier d’un contexte de qualité des données lors de leurs recherches d’actifs. Les producteurs de données et les équipes informatiques peuvent également utiliser des API pour intégrer les statistiques de qualité des données provenant de systèmes tiers dans un portail unifié, hors console.

Lignage des données et du ML

Comprendre l’évolution des données et des modèles au fil du temps. Le lignage peut renforcer la confiance et les connaissances d’une organisation en matière de données et d’IA en aidant les consommateurs de données à comprendre d’où proviennent les données, comment elles ont évolué et leur consommation. Vous pouvez réduire le temps consacré au mappage des données et des ressources d’IA et leurs liens, à dépanner et à développer des pipelines, et à appliquer des pratiques de gouvernance des données et de l’IA.