FAQ sur Amazon SageMaker Data Processing

Questions d’ordre général

SageMaker Data Processing analyse, prépare, intègre et orchestre vos données grâce aux fonctionnalités de traitement d’Amazon Athena, Amazon EMR, AWS Glue et Amazon Managed Workflows pour Apache Airflow (Amazon MWAA). Vous pouvez utilise des cadres de traitement de données open source tels qu’Apache Spark, analyser des données à grande échelle avec Trino et créer une analytique en temps réel de manière fluide avec Apache Flink et Apache Spark.

SageMaker Data Processing réunit Amazon EMR, Athena, AWS Glue et Amazon MWAA.

SageMaker Data Processing vous aide à explorer les données, à créer des tâches de transformation des données, à orchestrer et à déployer des pipelines de données à grande échelle. Il améliore les performances et fournit des informations plus rapidement que les systèmes open source traditionnels grâce à des versions rentables et compatibles avec les API open source d’Apache Spark, Apache Airflow, Apache Flink, Trino, etc. SageMaker Data Processing permet d’accéder à vos sources de données dans Amazon SageMaker via des intégrations zéro ETL, des fonctionnalités de requêtes fédérées et des connecteurs.

Migration et accès

Non, vous n’avez pas besoin de migrer vers SageMaker. Vous pouvez continuer à utiliser Amazon EMR, Athena, AWS Glue et Amazon MWAA comme vous le faites aujourd’hui. Cependant, nous vous recommandons de commencer à utiliser SageMaker pour utiliser des outils unifiés, de la gouvernance des données intégrée et des architectures SageMaker Lakehouse simplifiées.

Cela n’a aucun impact sur le code actuel, les requêtes, les tâches et les autres ressources que vous avez créés et utilisés avec Amazon EMR, Athena ou AWS Glue. Vous pouvez continuer à utiliser ces services pour les nouvelles charges de travail, si vous le souhaitez. Les ressources créées dans ces services, comme Amazon EMR sur les clusters Amazon Elastic Compute Cloud (Amazon EC2), sont visibles dans SageMaker afin de simplifier le développement d’applications d’analytique et d’IA. Les expériences de développement existantes intégrées à Amazon EMR, AWS Glue et Athena continueront d’exister, en plus d’une nouvelle expérience de développement au sein de SageMaker.

La dernière version d’AWS Glue, AWS Glue 5.0, est disponible dans SageMaker. AWS Glue 5.0 accélère les charges de travail liées au traitement des données et fournit la dernière exécution Apache Spark 3.5.2 optimisée pour les performances, afin que vous puissiez développer, exécuter et mettre à l’échelle pour obtenir des informations plus rapides. Pour en savoir plus, consultez la page AWS Glue.

Tarification

Chaque service AWS que vous utilisez via SageMaker est soumis à sa propre tarification. Pour plus de détails, consultez la page de tarification AWS pour Athena, Amazon EMR, AWS Glue et Amazon MWAA.