Amazon EMR

Einfache Ausführung und Skalierung von Apache Spark, Hive, Presto und anderen Big-Data-Workloads

Einführung in EMR Serverless

Amazon EMR Serverless ist eine neue Option in Amazon EMR, mit der Dateningenieure und Analysen einfach und kostengünstig Anwendungen ausführen können, die mit Open-Source-Big-Data-Frameworks wie Apache Spark, Hive oder Presto entwickelt wurden, ohne dass Cluster optimiert, betrieben, gesichert oder verwaltet werden müssen.

Vorteile

Führen Sie Big-Data-Anwendungen und Daten-Analysen im Petabyte-Bereich schneller und zu weniger als der Hälfte der Kosten von On-Premises-Lösungen aus.

Erstellen Sie Anwendungen mit den neuesten Open-Source-Frameworks, die auf angepassten Amazon EC2-Clustern, Amazon EKS, AWS Outposts oder Amazon EMR Serverless ausgeführt werden können.

Erreichen Sie bis zu 2x- schnellere Zeit-zur-Erkenntnis mit leistungsoptimierten und Open-Source-API-kompatiblen, Versionen von Spark, Hive und Presto.

Entwickeln, visualisieren und debuggen Sie Ihre Anwendungen mithilfe von EMR Notebooks und bekannten Open-Source-Tools in EMR Studio.

Anwendungsfälle

Führen Sie mithilfe von statistischen Algorithmen und Prognose-Modellen Daten-Verarbeitung auf großer Skala und What-If-Analysen durch, um versteckte Muster, Korrelationen, Markttrends und Kundenvorlieben zu erkennen.
Extrahieren Sie Daten aus einer Vielzahl von Quellen, verarbeiten Sie sie in großem Umfang, und stellen Sie sie sowohl für Anwendungen als auch für Benutzer zur Verfügung.
Analysieren Sie Ereignisse aus Streaming-Datenquellen in Echtzeit, um langlaufende, hochverfügbare und fehlertolerante Streaming-Data-Pipelines zu erstellen.
Analysieren Sie Daten in EMR integrierten Open-Source-ML-Frameworks wie Apache Spark MLlib, TensorFlow und Apache MXNet. Verbinden Sie sich mit Amazon SageMaker Studio für Modelltraining, Analyse und Berichte auf großer Skala.

Mehr von AWS erkunden