Amazon S3 中繼資料 (預覽版)

利用近乎即時的物件中繼資料加速資料探索

在 S3 中尋找和組織所需的資料

Amazon S3 中繼資料 (預覽版) 可讓物件中繼資料更易於存取和查詢,從而充分發揮 S3 資料的潛力。針對儲存在 S3 中的物件顯示、儲存和查詢豐富的中繼資料,以便您快速找到業務分析、即時推論應用程式等所需的資料。S3 中繼資料支援物件中繼資料,其中包括系統定義的詳細資訊 (例如物件的大小和來源),並支援自訂中繼資料,這可讓您透過標籤來使用產品 SKU、交易 ID 或內容評級等資訊為物件進行註解。 詳細閱讀部落格

優勢

在 S3 中的多達數萬億個物件內快速尋找和擷取所需的資料。

使用標籤為您的物件新增業務特定的中繼資料注釋,以改善資料組織和可搜尋性。

旨在自動擷取和組織受管 S3 Tables 中的物件中繼資料,並內建對 Apache Iceberg 的支援。

通過 S3 Tables 預覽版與 AWS Glue Data Catalog 的整合,使用熟悉的 AWS 服務 (如 Amazon Athena、Redshift、EMR 和 QuickSight) 分析中繼資料。S3 Metadata 與熱門的開放原始碼工具相容。

使用案例

使用豐富的中繼資料來編目儲存的資料,以便輕鬆探索和使用。

追蹤和管理 AI 產生的影片,包括影片的來源、製作時間以及與 Amazon Bedrock 搭配使用的 AI 模型。

分析物件中繼資料,識別節省成本和提升效能的機會。

快速識別和分析用於商業智慧和決策的相關資料集。

透過自訂中繼資料註解改善資料整理和合規性。

客戶

  • Cambridge Mobile Telematics

    Cambridge Mobile Telematics (CMT) 是全球最大的遠端資訊處理服務供應商。它的使命是使全球範圍內的道路和駕駛員更加安全。該公司的 AI 驅動平台 DriveWell Fusion® 收集來自數百萬台 IoT 裝置 (包括智慧手機、專有標籤、聯網汽車、行車記錄儀和第三方裝置) 的感測器資料,並將它們與內容資料融合,以建立車輛和駕駛員行為的統一檢視。

    在 CMT,我們儲存和分析來自全球行動 IoT 裝置的數 PB 資料,以提高駕駛員和道路行駛的安全。隨著我們規模的擴大,定位特定資料以開發新的洞見和模型變得越來越具有挑戰性。S3 Metadata,尤其是其自訂中繼資料功能,可讓我們注釋所有資料並在受管的可查詢資料表中維護中繼資料。現在,尋找相關資料僅需執行一個高效且符合成本效益的 SQL 查詢。這使得 S3 Metadata 成為變個性工具,助力我們為客戶帶來新的功能。

    Cambridge Mobile Telematics 資訊長 Tim Vogel
  • PayPal

    25 年多以來,PayPal 一直致力於變革全球商業。PayPal 打造創新體驗,使資金轉移、銷售和購物變得簡單、個人化和安全,從而幫助大約 200 個市場的消費者和企業加入全球經濟並在其中發展壯大。

    S3 Metadata 為我們提供了一種簡單、直接的機制,可以使用 Amazon Athena 和 Amazon QuickSight 等標準工具分析數萬億個 S3 物件。藉助此功能,我們可以利用時間做出決策,而不是建置複雜的資料管道來存取和查詢 S3 物件中繼資料。

    PayPal 大型企業平台工程副總裁 Jon Southall
  • Roche

    Roche 是一家生物科技公司,其結合藥品和診斷技術,實現個人化醫療的進步並改善人們的生活。

    S3 Metadata 加速推進我們的生成式 AI 計劃。當我們為團隊建置 LLM 應用程式 (例如內部聊天機器人) 時,PDF 等非結構化資料變得越來越有價值。我們需要將大量網域特定的文件插入到擷取增強生成 (RAG) 應用程式中,以便聊天機器人根據 Roche 的特定業務環境進行量身打造。但是,這也意味著我們需要管理越來越多的非結構化資料。我們需要一個中繼資料系統來有效地描述我們的非結構化資料,以便使用者可以快速篩選大型資料湖來識別其正在建置的特定生成式 AI 應用程式的相關資料集。使用 S3 Metadata,僅需在 AWS 管理主控台中按幾下即可建置功能強大的中繼資料系統。隨著我們持續擷取更多非結構化資料,S3 Metadata 會自動顯示中繼資料,並保持其最新狀態。我們還使用自己的 Lambda 來擷取業務特定的中繼資料,例如根據與 Roche 相關的分類法對文件進行分類,並將這些中繼資料與 S3 Metadata 資料表一起儲存在同一個 Glue 型錄中,以便透過簡單的 SQL 連結取得所需的所有中繼資料。S3 Metadata 可協助我們更快地建置生成式 AI 應用程式,這使我們能夠專注於建置而非整理資料。

    Roche 製藥商業工程主管 Yannick Misteli
  • SmugMug / Flickr

    SmugMug 和 Flickr 提供攝影師可以從中上傳和共用照片與影片的線上平台。該公司在其應用程式上儲存數十億張照片和影片。

    設想一下乘坐時光機穿越您的 Amazon S3 資料。在 SmugMug 和 Flickr,我們於 S3 中儲存客戶超過 22 年的照片,涵蓋數千億個物件。全新的 S3 Metadata 功能可協助我們輕鬆且經濟高效地探索 S3 物件中繼資料,以及透過查詢中繼資料 (例如隨時間推移的物件大小) 來了解我們的資料如何演變,該操作以前涉及將昂貴的資料庫查詢與物件清單結合。了解我們的攝影師如何使用我們的儲存空間,協助我們進一步達成透過攝影的力量建設更美好世界的承諾。

    SmugMug 首席工程師 Andrew Shieh
  • Solink 為各種規模的企業提供值得信賴的雲端影片安全系統。其硬體和軟體有助於為 40 多個國家/地區數萬個地點的 IT、損失預防、營運和安全團隊提供資訊可見性。

    Solink 每月處理超過 5 億小時的影片,將安全影片鏡頭與來自 350 多個來源的關鍵業務資料相整合。AWS 支援我們所依賴的基礎設施,而 Amazon S3 Metadata 將更進一步提供即時洞見,增強我們的內容管理,從監控儲存和用量到追蹤客戶組態變更的即時影響。

    Solink 技術長 Martin Soukup
  • Commvault

    Commvault 是網路恢復能力方面的黃金標準,協助超過 100,000 個組織確保資料安全,同時保持業務恢復能力並向前發展。如今,Commvault 提供了唯一的網路恢復能力平台,其中結合了企業範圍內最佳的資料安全性和快速恢復能力,適用於任何地點的任何工作負載,且總體擁有成本 (TCO) 最低。

    Amazon S3 已成為各種資料類型的領先雲端儲存供應商。Amazon S3 Metadata 將使 Commvault 等供應商能夠主動協助識別和保護敏感資訊,同時協助實現資料分層等元素的自動化,並增強我們共同客戶的成果。S3 Metadata 促進高效的資料組織並有助於簡化資料探索,從而可以對物件進行詳細註解,這對於雲端優先網路恢復能力至關重要。

    Commvault 技術與 AI 長 Pranay Ahlawat
  • New Relic

    New Relic 智慧可觀測性平台為客戶提供軟體環境每個部分的深度效能分析。客戶可以輕鬆檢視和分析大量資料,並即時取得可行的洞見。

    作為可觀測性領域的領導者,New Relic 的資料引擎每天處理大約 1.3 EB 的 Amazon S3 資料。S3 Metadata 將透過自動產生豐富的物件中繼資料來加速我們的創新,從而簡化團隊執行產品實驗和建置概念證明所需的資料探索,例如制定對客戶有益的新指標。S3 Metadata 將使我們建置和維護強大中繼資料系統的工作量從數百小時減少到僅需在 S3 管理主控台中按幾下即可,從而工程師能夠專注于資料分析而非資料組織。

    New Relic 技術長 Siva Padisetty