Amazon SageMaker Lakehouse

透過統一、開放且安全的資料湖倉儲,簡化分析和 AI

什麼是 SageMaker Lakehouse?

Amazon SageMaker Lakehouse 會在 Amazon Simple Storage Service (Amazon S3) 資料湖和 Amazon Redshift 資料倉儲中整合所有資料,協助您在單一資料複本上建置強大的分析和 AI/ML 應用程式。SageMaker Lakehouse 提供彈性,可讓您使用與所有 Apache Iceberg 相容的工具和引擎來就地存取和查詢資料。透過定義精細許可來保護 Lakehouse 中的資料,這些許可在所有分析和機器學習 (ML) 工具與引擎中強制執行。透過零 ETL 整合,將來自營運資料庫和應用程式的資料近乎即時地匯入您的資料湖。此外,透過第三方資料來源之間的聯合查詢功能就地存取和查詢資料。

優勢

使用 SageMaker Lakehouse 統一 Amazon S3 資料湖和 Amazon Redshift 資料倉儲中的所有資料。透過零 ETL 整合,將來自營運資料庫和應用程式的資料近乎即時地匯入資料湖。您可以使用數百個連接器整合來自各種來源的資料。此外,您可透過第三方資料來源之間的聯合查詢功能就地存取和查詢資料。
使用與 Apache Iceberg 相容的所有工具在單個資料副本上靈活地就地存取和查詢資料。您可以使用自己選擇的分析工具和引擎,例如 SQL、Apache Spark、商業智慧 (BI) 和 AI/ML 工具,並與儲存在 Amazon S3 資料湖或 Amazon Redshift 資料倉儲中的資料進行協作。使用 SageMaker Lakehouse 與您現有的資料架構相結合,可讓您使用偏好的儲存格式和查詢引擎 (與 Apache Iceberg 相容)。
使用整合的精細存取控制來保護您的資料,這些存取控制在所有分析工具和引擎中的所有資料之間強制執行。定義一次許可,並可以放心地在整個組織中共用資料。

使用案例

藉助單一資料副本統一 Amazon S3 資料湖和 Amazon Redshift 資料倉儲中的所有資料,以滿足您的分析和 AI 計劃的需求。透過整合式存取控制,SageMaker Lakehouse 可讓您定義精細許可,並在整個組織之間安全地共用單一資料副本。
透過零 ETL 整合,存取 SageMaker Lakehouse 中的營運資料庫和應用程式的近乎即時資料。透過各種 AWS 服務以及支援 Apache Iceberg 的開放原始碼和第三方工具與引擎,就地存取和查詢您的資料。
將來自多個 Amazon Redshift 資料倉儲的現有資料引入 SageMaker Lakehouse,以查詢和合併儲存在 Redshift 叢集和工作群組中的資料。擴展擷取、轉換和載入 (ETL) 程序、BI 報告和按需分析的工作負載,而無需管理多個資料共用。