Domande frequenti sull'elaborazione dei dati di Amazon SageMaker

Domande generali

SageMaker Data Processing analizza, prepara, integra e orchestra i dati con le funzionalità di elaborazione di Amazon Athena, Amazon EMR, AWS Glue e Flusso di lavoro gestito da Amazon per Apache Airflow (MWAA). Puoi utilizzare framework di elaborazione dati open source come Apache Spark, analizzare dati su larga scala con Trino e creare facilmente analisi in tempo reale con Apache Flink e Apache Spark.

SageMaker Data Processing riunisce Amazon EMR, Athena, AWS Glue e Amazon MWAA.

SageMaker Data Processing ti aiuta a esplorare i dati, creare relativi processi di trasformazione, orchestrare e implementare pipeline di dati su larga scala. Migliora le prestazioni, ottenendo approfondimenti più rapidi rispetto ai tradizionali sistemi open source con versioni convenienti e compatibili grazie alle API open source di Apache Spark, Apache Airflow, Apache Flink, Trino e altre. SageMaker Data Processing fornisce l'accesso alle origini dati in Amazon SageMaker Lakehouse tramite integrazioni Zero-ETL, funzionalità di query federate e connettori.

Migrazione e accesso

No, non è necessario eseguire la migrazione a SageMaker. Puoi continuare a utilizzare Amazon EMR, Athena, AWS Glue e Amazon MWAA come fai oggi. Tuttavia, ti consigliamo di iniziare a usare SageMaker per sfruttare strumenti unificati, governance dei dati integrata e architetture SageMaker Lakehouse semplificate.

Non è presente alcun impatto sul codice, sulle query, sui processi e sulle altre risorse che hai creato e utilizzato con Amazon EMR, Athena o AWS Glue. Se preferisci, puoi continuare a utilizzare questi servizi per nuovi carichi di lavoro. Le risorse create in questi servizi, come Amazon EMR su cluster Amazon Elastic Compute Cloud (Amazon EC2), sono visibili in SageMaker per semplificare lo sviluppo di applicazioni di analisi e IA. Le esperienze di sviluppo integrate esistenti in Amazon EMR, AWS Glue e Athena continueranno a esserci oltre a una nuova esperienza di sviluppo all'interno di SageMaker.

La versione più recente di AWS Glue, AWS Glue 5.0, è disponibile in SageMaker. AWS Glue 5.0 accelera i carichi di lavoro di elaborazione dei dati e offre il runtime più recente Apache Spark 3.5.2 ottimizzato per le prestazioni, in modo da poter sviluppare, eseguire e scalare per approfondimenti più rapidi. Per ulteriori informazioni, visita la pagina di AWS Glue.

Prezzi

Ogni servizio AWS utilizzato tramite SageMaker è soggetto a prezzi individuali. Per maggiori dettagli, consulta la pagina dei prezzi di AWS per Athena, Amazon EMR, AWS Glue e Amazon MWAA.