El procesamiento de datos de SageMaker analiza, prepara, integra y orquesta sus datos con las capacidades de procesamiento de Amazon Athena, Amazon EMR, AWS Glue y Amazon Managed Workflows para Apache Airflow (Amazon MWAA). Puede usar los marcos de procesamiento de datos de código abierto, como Apache Spark, analizar datos a escala con Trino y crear análisis en tiempo real sin problemas con Apache Flink y Apache Spark.
El procesamiento de datos de SageMaker reúne Amazon EMR, Athena, AWS Glue y Amazon MWAA.
El procesamiento de datos de SageMaker permite explorar datos, crear trabajos de transformación de datos, orquestar e implementar canalizaciones de datos a escala. Mejora el rendimiento y genera información más rápida que los sistemas de código abierto tradicionales con versiones rentables y compatibles con la API de código abierto de Apache Spark, Apache Airflow, Apache Flink y Trino, entre otras. El procesamiento de datos de SageMaker brinda acceso a sus orígenes de datos en Amazon SageMaker Lakehouse mediante integraciones sin ETL, capacidades de consulta federada y conectores.
No, no necesita migrar a SageMaker. Puede seguir usando Amazon EMR, Athena, AWS Glue y Amazon MWAA como lo hace en la actualidad. Sin embargo, le recomendamos que comience a utilizar SageMaker para aprovechar las herramientas unificadas, la gobernanza de datos integrada y las arquitecturas simplificadas de SageMaker Lakehouse.
No afecta al código, las consultas, los trabajos ni otros recursos actuales que haya creado y utilizado con Amazon EMR, Athena o AWS Glue. Si lo prefiere, puede seguir utilizando estos servicios para nuevas cargas de trabajo. Los recursos creados en estos servicios, como Amazon EMR en clústeres de Amazon Elastic Compute Cloud (Amazon EC2), están visibles en SageMaker para simplificar el desarrollo de aplicaciones de análisis e IA. Las experiencias de desarrollo existentes, integradas en Amazon EMR, AWS Glue y Athena, seguirán existiendo, además de una nueva experiencia de desarrollo en SageMaker.
La versión más reciente de AWS Glue, AWS Glue 5.0, está disponible en SageMaker. AWS Glue 5.0 acelera las cargas de trabajo de procesamiento de datos y ofrece la versión ejecutable más reciente de Apache Spark 3.5.2, con un tiempo de ejecución optimizado, para que pueda desarrollar, ejecutar, escalar y obtener información más rápidamente. Para obtener más información, visite AWS Glue.
Cada servicio de AWS que utilice a través de SageMaker está sujeto a sus propios precios. Para obtener más información, consulte la página de precios de AWS para Athena, Amazon EMR, AWS Glue y Amazon MWAA.