為什麼選擇 Amazon EC2 Trn2 執行個體和 UltraServer?
Amazon EC2 Trn2 執行個體由 16 個 AWS Trainium2 晶片提供支援,專為生成式 AI 而建置,是用於訓練和部署具有數千億到數萬億以上參數的模型的最強大 EC2 執行個體。Trn2 執行個體的價格效能比目前一代 GPU 型 EC2 P5e 和 P5en 執行個體更好 30-40%。藉助 Trn2 執行個體,您可以取得最先進的訓練和推論效能,同時降低成本,因此您可以縮短訓練時間、更快地反覆運作,以及提供 AI 支援的即時體驗。您可以使用 Trn2 執行個體來訓練和部署模型,包括大型語言模型 (LLM)、多模態模型和擴散轉換器,以此建置下一代生成式 AI 應用程式。
若要減少最强大、要求最高的模型的訓練時間並實現劃時代的回應時間 (每個字符的延遲),所需運算能力和記憶體可能會超出單一執行個體所能提供的上限。Trn2 UltraServer 使用 NeuronLink,這是我們專有的晶片間互連,可連線四個 Trn2 執行個體中的 64 個 Trainium2 晶片,將單個節點中可用的運算、記憶體和聯網頻寬增加四倍,並為 AWS 上的深度學習和生成式 AI 工作負載提供突破性的效能。對於推論而言,UltraServer 可協助提供業界領先的回應時間,進而創造出最佳的即時體驗。對於訓練而言,與獨立執行個體相比,UltraServers 會透過更快的協同通訊來提高模型平行性的模型訓練速度和效率。
您可以輕鬆開始使用 Trn2 執行個體和 Trn2 UltraServer,其中原生支援 PyTorch 和 JAX 等熱門機器學習 (ML) 架構。
優勢
功能
客戶和合作夥伴見證
以下是客戶和合作夥伴如何計劃透過 Amazon EC2 Trn2 執行個體實現業務目標的範例。
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
Itaú Unibanco 的宗旨是改善客戶與資金之間的關係,對他們的生活產生積極的影響,同時擴大他們的轉型機會。在 Itaú Unibanco,我們相信每位客戶都是獨一無二的,我們專注于透過直觀的數位旅程來滿足他們的需求,以及利用 AI 的強大功能不斷適應他們的消費習慣。
-
NinjaTech AI
Ninja 是提供無限生產力的一體化 AI 代理程式:一次簡單訂閱,即可無限制存取全球最出色的 AI 模型以及頂級 AI 技能,例如:寫作、編碼、腦力激盪、影像產生、線上研究。Ninja 是提供「超級代理程式」的代理平台,該平台使用混合代理程式,具有與前沿基礎模型相當的世界級準確性 (並且在某些類別中超越後者)。Ninja 的代理技術需要最高效能的加速器,以提供客戶期望的獨特即時體驗。
-
Ricoh
RICOH 機器學習團隊開發工作場所解決方案和數位轉型服務,旨在管理和最佳化企業解決方案中的資訊流。
-
PyTorch
-
Refact.ai
Refact.ai 提供全面的 AI 工具,例如由擷取增強生成 (RAG) 支援的程式碼自動完成功能,同時提供更準確的建議,以及使用專有和開放原始碼模型的內容感知聊天。
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
Anyscale 是 Ray 背後的公司,後者是為企業提供 ML 和生成式 AI 計劃支援的 AI 運算引擎。藉助 RayTurbo 驅動的 Anyscale 統一 AI 平台,透過最佳化資源使用率,客戶的資料處理速度提高 4.5 倍,使用 LLM 進行批次推論的成本降低 10 倍,擴展速度提高 5 倍,反覆運作速度提高 12 倍,並且線上模型推論的成本節省 50%。
-
Datadog
-
Hugging Face
-
Lightning AI
PyTorch Lightning 和 Lightning Studios 的建立者 Lightning AI 為企業級 AI 提供了最直觀、一體化的 AI 開發平台。Lightning 提供完整的程式碼、低程式碼和無程式碼工具,可以快速地建置代理程式、AI 應用程式和生成式 AI 解決方案。它專為實現靈活性而設計,可以在您的雲端或我們的雲端上無縫執行,利用 300 多萬個強大開發人員社群的專業知識與支援。
-
Domino Data Lab
Domino 在各個環境上協調所有資料科學成品,包括 AWS 上的基礎架構、資料和服務,為 Amazon SageMaker 提供治理和協作功能,以支援企業資料科學團隊。Domino 可透過 AWS Marketplace,以 SaaS 或自我管理方式提供。
入門
產品詳細資訊
執行個體大小 | 適用於 EC2 UltraServers | Trainium2 晶片 | 加速器 記憶體 |
vCPU | 記憶體 (TB) |
執行個體儲存體 (TB) | 網路頻寬 (Tbps) | EBS 頻寬 (Gbps) |
trn2.48xlarge | 否 | 16 | 1.5 TB | 192 | 2 TB | 4 x 1.92 NVMe SSD | 3.2 | 80 |
trn2u.48xlarge | 是 (預覽版) | 16 | 1.5 TB | 192 | 2 TB | 4 x 1.92 NVMe SSD | 3.2 | 80 |