在 S3 中大規模儲存表格式資料
Amazon S3 Tables 可提供首個具有內建 Apache Iceberg 支援的雲端物件存放區,並且簡化大規模儲存表格式資料。持續資料表最佳化會在背景自動掃描和重寫資料表資料,與未受管 Iceberg 資料表相比,查詢效能可提高 3 倍。並且這種效能最佳化將隨時間不斷改進。此外,與儲存在通用 S3 儲存貯體中的 Iceberg 資料表相比,包含針對 Iceberg 工作負載最佳化的 S3 資料表的每秒交易處理量可提高 10 倍。如需有關 S3 資料表查詢效能改進的詳細資訊,請參閱此部落格。
藉助適用於 Apache Iceberg 標準的 S3 Tables 支援,您可以透過熱門的 AWS 和第三方查詢引擎 (包括 Amazon Athena、Redshift、EMR 和 Apache Spark) 輕鬆查詢自己的表格式資料。使用 S3 Tables 將表格式資料 (例如每日購買交易、串流感測器資料或廣告曝光) 作為 S3 中的 Iceberg 資料表儲存,並使用自動資料表維護隨著資料的發展最佳化效能和成本。閱讀部落格以進一步了解。
優勢
運作方式
S3 Tables 提供專用 S3 儲存,用於以 Apache Parquet 格式儲存結構化資料。在資料表儲存貯體中,您可以直接在 S3 中建立資料表作為一級資源。這些資料表可以使用以身分或資源為基礎的政策中定義的資料表層級許可來進行保護,並且可以透過支援 Apache Iceberg 標準的應用程式或工具來存取。當您在資料表儲存貯體中建立資料表時,S3 中的基礎資料會儲存為 Parquet 資料。然後,S3 會維護所需的中繼資料,以便您的應用程式可查詢該 Parquet 資料。資料表儲存貯體包括用戶端資料庫,而查詢引擎會使用該資料庫來導覽和更新資料表儲存貯體中資料表的 Iceberg 中繼資料。此程式庫與用於資料表操作的更新的 S3 API 結合,可讓多個用戶端安全地讀取和寫入資料表。隨著時間的推移,S3 會透過重寫或「壓縮」物件來自動最佳化基礎 Parquet 資料。壓縮可最佳化 S3 上的資料,以提高查詢效能並最大程度地降低成本。 如需進一步了解,請閱讀使用者戶指南
客戶
-
Genesys
Genesys 是 AI 支援體驗協同運作方面的全球雲端領導者。透過進階的 AI、數位化和員工參與管理功能,Genesys 協助 100 多個國家/地區的 8,000 多個組織提供個人化、富有同理心的客戶和員工體驗,同時可從提高的業務敏捷性和成果中受益。
-
SnapLogic
SnapLogic 是 AI 主導整合的先驅。SnapLogic 生成式整合平台加速了整個企業的數位轉型,以設計、部署和管理 AI 代理程式與整合,從而自動執行任務、做出即時決策並輕鬆整合到現有工作流程中。
-
Zus Health
Zus 是一個共用健康資料平台,旨在透過 API、內嵌式元件和直接 EHR 整合提供易於使用的患者資料,從而加速醫療保健資料互通性。