Governance dei dati e dell'IA di Amazon SageMaker

Scopri, gestisci e collabora su dati e IA in modo sicuro

Panoramica

La nuova generazione di Amazon SageMaker semplifica l'individuazione, la governance e la collaborazione per i dati e l'IA nel tuo lakehouse, nei modelli di intelligenza artificiale e nelle applicazioni. Con Amazon SageMaker Catalog, creato su Amazon DataZone, gli utenti possono individuare e accedere in modo sicuro a dati e modelli approvati utilizzando la ricerca semantica con metadati creati dall'IA generativa, oppure possono semplicemente chiedere ad Amazon Q Developer con linguaggio naturale di trovare i propri dati. Gli utenti possono definire e applicare le policy di accesso in modo coerente utilizzando un unico modello di autorizzazione con controlli di accesso granulari centralmente in Amazon SageMaker Unified Studio (anteprima). Condividi e collabora senza problemi su dati e risorse di IA attraverso flussi di lavoro di semplice pubblicazione e sottoscrizione. Con SageMaker, puoi salvaguardare e proteggere i tuoi modelli di IA con guardrail Amazon Bedrock e implementare policy di IA responsabile. Crea fiducia in tutta l'organizzazione con il monitoraggio e l'automazione della qualità dei dati, il rilevamento dei dati sensibili e il lineage di dati e machine learning (ML).

Vantaggi

Rileva i dati e le risorse IA su larga scala con SageMaker Catalog, basato su Amazon Datazone. Migliora il rilevamento dei dati con l'IA generativa per arricchire automaticamente i dati e i metadati con il contesto aziendale, facilitando la ricerca, la comprensione e l'utilizzo dei dati da parte di tutti gli utenti. Condividi dati, modelli di intelligenza artificiale, prompt e risorse di IA generativa filtrando per nomi di tabelle e colonne o termini del glossario aziendale. Suggerisci automaticamente colonne di valore e applicazioni analitiche pertinenti per ogni set di dati, consentendo l'uso dei dati giusti per creare rapidamente i modelli giusti. Supporta modelli di governance centralizzati e decentralizzati con una condivisione fluida di dati e intelligenza artificiale attraverso flussi di lavoro di pubblicazione e sottoscrizione in un'unica esperienza attraverso i progetti.

Ottieni fiducia grazie alla visibilità in tempo reale della qualità dei dati e della derivazione di dati e ML in SageMaker. Automatizza la profilazione dei dati e le raccomandazioni sulla qualità dei dati, monitora le regole sulla qualità dei dati e ricevi avvisi. Risolvi i problemi di qualità dei dati difficili da trovare utilizzando approcci basati su regole e ML per riconciliare le entità in modo da poter fornire dati di alta qualità per prendere decisioni aziendali sicure. Promuovi la trasparenza nelle pipeline di dati e nei progetti di intelligenza artificiale con il monitoraggio integrato dei modelli per rilevare distorsioni o segnalare in che modo le funzionalità contribuiscono alla previsione tramite modello.
Centralizza la sicurezza dei dati e dell'IA in SageMaker con controlli di accesso granulari, classificazione dei dati e guardrail per garantire che i dati, le analisi e i modelli di intelligenza artificiale siano utilizzati in modo appropriato. Definisci le autorizzazioni una sola volta e applicale su dati e modelli. Con Amazon Bedrock IDE (anteprima) integrato in modo nativo, i clienti possono utilizzare Guardrail di Amazon Bedrock nella loro applicazione di IA generativa bloccando i contenuti dannosi, filtrando le allucinazioni e abilitando protezioni personalizzabili per la privacy, la sicurezza e l'accuratezza. Identifica automaticamente le informazioni sensibili all'interno delle tue pipeline utilizzando Amazon Comprehend.
Soddisfa l'audit e la conformità normativa con l'utilizzo dei dati e la registrazione e il monitoraggio dei modelli. Supporta un uso accettabile delle tue risorse di analisi e intelligenza artificiale in tutta l'azienda con l'isolamento basato sui progetti. Comprendi l'utilizzo di dati e modelli nel tuo lakehouse per una maggiore sicurezza. Usa Amazon SageMaker Clarify per monitorare distorsioni, precisione e robustezza dei modelli, in linea con i tuoi standard di IA responsabile. Allinea i costi alle iniziative aziendali e fornisce una visione chiara degli investimenti aziendali.

Caratteristiche

Dati selezionati per la contestualizzazione e la facilità di ricerca

Il catalogo SageMaker aggiunge un contesto aziendale ai metadati tecnici e può essere arricchito con il contesto aziendale. Puoi rendere i dati visibili con il contesto aziendale affinché tutti gli utenti possano trovarli, comprenderli e fidarsi di essi in modo semplice e rapido.

Suggerimenti automatici sui metadati

L'aggiunta di nomi e descrizioni delle aziende ai dati è automatizzata, agevolando la comprensione del contesto ed evitando nomi tecnici che possono risultare criptici. Questa automazione è supportata da modelli linguistici di grandi dimensioni (LLM) per aumentare la precisione e la coerenza.

Offri un livello costante di sicurezza dell'IA in tutte le tue applicazioni

I guardrail di Amazon Bedrock consentono di valutare gli input degli utenti e le risposte dei modelli di fondazione (FM) in base a policy specifiche dei casi d'uso, fornendo un ulteriore livello di protezione indipendentemente dagli FM sottostanti.

Verifica e monitora rapidamente i modelli

Verifica e risoluzione rapide delle prestazioni di tutti i modelli, gli endpoint e i processi di monitoraggio dei modelli attraverso una vista unificata. Tracciamento delle deviazioni dal comportamento previsto del modello, nonché dei processi di monitoraggio mancanti o inattivi, con avvisi automatici.

Qualità dei dati

Con le statistiche sulla qualità dei dati, i consumatori di dati possono visualizzare i parametri di qualità provenienti da sistemi di terze parti o di AWS. I consumatori di dati possono fidarsi delle origini dati che utilizzano per le decisioni e avere un contesto di qualità dei dati mentre ricercano le risorse. I produttori di dati e i team IT possono anche utilizzare le API per incorporare le statistiche sulla qualità dei dati provenienti da sistemi di terze parti in un portale unificato fuori dalla console.

Derivazione di dati e ML

Comprendi il movimento dei dati e i modelli nel tempo. La derivazione può aumentare l'attendibilità e la comprensione dei dati e dell'IA dell'organizzazione aiutando i clienti a capire da dove provengono i dati, come sono cambiati e il loro consumo. Puoi ridurre il tempo impiegato nella mappatura di risorse di dati e IA e delle sue relazioni, nella risoluzione dei problemi e nello sviluppo di pipeline, così come nell'applicazione delle pratiche di governance dei dati e dell'IA.