Amazon EC2 Trn2 インスタンスと UltraServers を利用すべき理由
16 個の AWS Trainium2 チップを搭載した Amazon EC2 Trn2 インスタンスは、生成 AI 専用に構築されており、数千億から数兆を超えるパラメータを持つモデルのトレーニングとデプロイのための最も強力な EC2 インスタンスです。Trn2 インスタンスは、現世代の GPU ベースの EC2 P5e および P5en インスタンスよりも 30~40% 優れた料金パフォーマンスを実現します。Trn2 インスタンスを使用すると、コストを削減しながら最先端のトレーニングと推論パフォーマンスを実現することができるため、トレーニング時間の短縮、イテレーションの迅速化、AI を活用したリアルタイムのエクスペリエンスの提供が可能になります。Trn2 インスタンスを使用して、大規模言語モデル (LLM)、マルチモーダルモデル、拡散トランスフォーマーなどのモデルのトレーニングとデプロイを行い、次世代の生成 AI アプリケーションを構築できます。
最も要求の厳しい最先端のモデルでトレーニング時間を短縮し、画期的な応答時間 (トークンの待ち時間当たり) を実現するには、1 つのインスタンスでは提供できないほどのコンピューティングとメモリが必要になる場合があります。Trn2 UltraServers は、当社独自のチップ間インターコネクトである NeuronLink を使用して、4 つの Trn2 インスタンスに 64 個の Trainium2 チップを接続します。これにより、1 つのノードで利用できるコンピューティング、メモリ、ネットワーク帯域幅が 4 倍になり、AWS 上で深層学習と生成 AI ワークロードの飛躍的なパフォーマンスが実現します。推論に関しては、UltraServers は業界トップクラスの応答時間を実現し、最高のリアルタイム体験を実現するのに役立ちます。トレーニングに関しては、UltraServers はスタンドアロンインスタンスと比較して、モデルの並列処理のための集団通信が高速になるため、モデルトレーニングの速度と効率が向上します。
PyTorch や JAX などの一般的な機械学習 (ML) フレームワークのネイティブサポートを利用して、Trn2 インスタンスと Trn2 UltraServers を簡単に使い始めることができます。
利点
特徴
お客様とパートナーの声
お客様とパートナーがどのように Amazon EC2 Trn2 インスタンスを利用してビジネス目標を達成する計画を立てているかの例をいくつかご紹介します。
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
Itaú Unibanco の目的は、人とお金との関係を改善し、人々の生活にプラスの影響を与えながら、トランスフォーメーションの機会を拡大することです。Itaú Unibanco では、お客様一人ひとりがユニークな存在であると捉えており、AI の力を活用してコンスタントに消費者の動向に適応する直感的なデジタルジャーニーを通じてお客様のニーズを満たすことに力を入れています。
-
NinjaTech AI
Ninja は、Unlimited Productivity にとってオールインワンの AI エージェントです。1 つのサブスクリプションで、世界最高の AI モデルに無制限にアクセスでき、書き込み、コーディング、ブレインストーミング、画像生成、オンラインリサーチなどの最も有用な AI スキルにもアクセスできます。Ninja はエージェント型プラットフォームであり、フロンティア基盤モデルに匹敵する (一部のカテゴリーではそれを上回っている) 世界クラスの精度を持つエージェントを組み合わせた「SuperAgent」を提供しています。Ninja の Agentic テクノロジーは、お客様が期待するユニークなリアルタイム体験を提供するために、最高性能のアクセラレーターを必要とします。
-
Ricoh
リコーの機械学習チームは、エンタープライズソリューション全体の情報の流れを管理および最適化するように設計されたワークプレイスソリューションとデジタルトランスフォーメーションサービスを開発しています。
-
PyTorch
-
Refact.ai
Refact.ai には、Retrieval-Augmented Generation (RAG) を利用したコードオートコンプリートなどの包括的な AI ツールが用意されています。これにより、より正確な提案が可能になり、独自モデルとオープンソースモデルの両方を使用してコンテキストに応じたチャットが可能になります。
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
Anyscale は、企業向けに機械学習と生成 AI イニシアチブを促進する AI コンピューティングエンジンである Ray を開発している企業です。RayTurbo を利用した Anyscale の統合 AI プラットフォームでは、リソースの利用を最適化することで、データ処理が最大 4.5 倍速くなり、LLM によるバッチ推論のコストが 10 分の一になり、スケーリングが 5 倍速くなり、イテレーションが 12 倍速くなり、オンラインモデル推論のコストを 50% 削減できます。
-
Datadog
-
Hugging Face
-
Lightning AI
PyTorch Lightning と Lightning Studios の開発元である Lightning AI は、エンタープライズグレードの AI 向けの最も直感的なオールインワン AI 開発プラットフォームを提供しています。Lightning には、エージェント、AI アプリケーション、生成 AI ソリューションを迅速に構築するためのフルコード、ローコード、ノーコードのツールが用意されています。柔軟性を重視して設計されており、300 万人以上の強力なデベロッパーコミュニティの専門知識とサポートを活用して、お客様のクラウドでも当社のクラウドでもシームレスに実行できます。
-
Domino Data Lab
Domino は、環境全体で AWS 上のインフラストラクチャ、データ、サービスなど、すべてのデータサイエンスのアーティファクトをオーケストレートし、ガバナンスとコラボレーション機能で Amazon SageMaker を補完して、企業のデータサイエンスチームをサポートしています。Domino は、AWS Marketplace を介して SaaS またはセルフマネージドとして利用できます。
開始方法
製品の詳細
インスタンスサイズ | EC2 UltraServers で利用可能 | Trainium2 チップ | アクセラレーター メモリ |
vCPU | メモリ (TB) |
インスタンスストレージ (TB) | ネットワーク帯域幅 (Tbps) | EBS 帯域幅 (Gbps) |
trn2.48xlarge | 無 | 16 | 1.5 TB | 192 | 2 TB | 4 x 1.92 NVMe SSD | 3.2 | 80 |
trn2u.48xlarge | 有 (プレビュー) | 16 | 1.5 TB | 192 | 2 TB | 4 x 1.92 NVMe SSD | 3.2 | 80 |