Amazon EMR auf AWS Outposts

Warum EMR auf Outposts?

AWS Outposts bieten AWS-Services, Infrastruktur und Betriebsmodelle für praktisch jedes Rechenzentrum, jeden Co-Location-Bereich oder jede On-Premises-Einrichtung. Amazon EMR ist auf AWS Outposts verfügbar und ermöglicht es Ihnen, Apache Hadoop-, Apache Hive-, Apache Spark- und Presto-Cluster in Ihren lokalen Umgebungen einzurichten, bereitzustellen, zu verwalten und zu skalieren, genau wie in der Cloud. Amazon EMR bietet kosteneffiziente Kapazitäten in Outposts und automatisiert zeitraubende Verwaltungsaufgaben, darunter Infrastrukturbereitstellung, Cluster-Einrichtung, Konfiguration und Optimierung. So können Sie sich ganz auf Ihre Anwendungen konzentrieren.

Sie können schnell und einfach verwaltete EMR-Cluster vor Ort mit derselben AWS-Managementkonsole, APIs und CLI für EMR erstellen. EMR-Cluster, die in einer Outpost-Instanz gestartet werden, werden in der AWS-Konsole wie jeder andere Cluster angezeigt, werden aber in Ihrer Outpost-Instanz ausgeführt.

Vorteile

Sobald Ihre Outpost-Instanz eingerichtet ist, können Sie vor Ort einen neuen EMR-Cluster starten und innerhalb weniger Minuten eine Verbindung mit dem vorhandenen HDFS-Speicher herstellen. So können Sie schnell reagieren, wenn On-Premise-Systeme zusätzliche Verarbeitungskapazität benötigen. Die Erweiterung der Kapazität von Hadoop- und Spark-Clustern vor Ort trägt dazu bei, die Arbeitslastforderungen bei hoher Auslastung zu decken und SLAs aufrechtzuerhalten.
Wenn Sie dabei sind, Daten und Apache Hadoop-Workloads in die Cloud migrieren und EMR verwenden möchten, bevor Ihre Migration abgeschlossen ist, können Sie mit AWS Outposts lokale EMR-Cluster starten, die eine Verbindung mit Ihrem vorhandenen HDFS-Speicher herstellen. Anschließend können Sie Ihre Daten im Rahmen einer Weiterentwicklung zu einer Cloud-Architektur schrittweise zu Amazon S3 migrieren.
Apache Hadoop, Apache Hive, Apache Spark und Presto werden häufig zur Verarbeitung, Transformation und Analyse von Daten verwendet, die Teil einer größeren Datenarchitektur sind. Für Daten, die aus Governance-, Compliance- oder anderen Gründen vor Ort bleiben müssen, können Sie EMR nutzen, um Anwendungen wie Apache Hadoop und Apache Spark vor Ort in der Nähe Ihrer Daten bereitzustellen und auszuführen. Dadurch wird die Notwendigkeit reduziert, große Mengen an On-Premise-Daten in die Cloud zu übertragen, sodass die Gesamtzeit für die Verarbeitung dieser Daten reduziert wird.