Perché utilizzare le istanze Trn2 e gli UltraServer di Amazon EC2?
Le istanze Trn2 di Amazon EC2, alimentate da 16 chip AWS Trainium2, sono create appositamente per l'IA generativa e sono le istanze EC2 più potenti per l'addestramento e l'implementazione di modelli con un numero di parametri che va da centinaia di miliardi fino a oltre un trilione. Le istanze Trn2 offrono un rapporto prezzo/prestazioni migliore del 30-40% rispetto all'attuale generazione di istanze EC2 P5e e P5en basate su GPU. Con le istanze Trn2, puoi ottenere prestazioni di addestramento e inferenza all'avanguardia abbassando al contempo i costi, in modo da ridurre i tempi di formazione, iterare più velocemente e offrire esperienze in tempo reale basate sull'intelligenza artificiale. Puoi utilizzare le istanze Trn2 per addestrare e implementare modelli che includono modelli linguistici di grandi dimensioni (LLM), modelli multimodali e trasformatori di diffusione al fine di creare applicazioni di IA generativa di nuova generazione.
Per ridurre i tempi di addestramento e garantire tempi di risposta straordinari (latenza per token) per i modelli più esigenti e all'avanguardia, potrebbero essere necessari più calcoli e memoria di quelli che può fornire una singola istanza. Gli UltraServer Trn2 utilizzano NeuronLink, la nostra interconnessione chip-to-chip proprietaria, per connettere 64 chip Trainium2 su quattro istanze Trn2, quadruplicando la larghezza di banda di rete, il calcolo e la memoria disponibili in un singolo nodo e offrendo prestazioni straordinarie su AWS per carichi di lavoro di deep learning e IA generativa. Per l'inferenza, gli UltraServer consentono di fornire tempi di risposta leader del settore per creare le migliori esperienze in tempo reale. Per l'addestramento, gli UltraServer aumentano la velocità e l'efficienza dell'addestramento dei modelli, grazie a una comunicazione collettiva più rapida per il parallelismo dei modelli rispetto alle istanze autonome.
Puoi iniziare facilmente con le istanze Trn2 e gli UltraServer Trn2 con il supporto nativo per i framework di machine learning (ML) più diffusi come PyTorch e JAX.
Vantaggi
Caratteristiche
Testimonianze dei partner e dei clienti
Ecco alcuni esempi di come clienti e partner prevedono di raggiungere i loro obiettivi aziendali con le istanze Trn2 di Amazon EC2.
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
Lo scopo di Itaú Unibanco è quello di migliorare il rapporto delle persone con il denaro, creando un impatto positivo sulla loro vita e ampliando le loro opportunità di trasformazione. In Itaú Unibanco, crediamo che ogni cliente sia unico e ci concentriamo sul soddisfare le sue esigenze attraverso percorsi digitali intuitivi, che sfruttano la potenza dell'IA per adattarsi costantemente alle loro abitudini di consumo.
-
NinjaTech AI
Ninja è un agente IA all-in-one per una produttività illimitata: un semplice abbonamento, accesso illimitato ai migliori modelli di IA del mondo insieme alle migliori competenze di IA come: scrittura, codifica, brainstorming, generazione di immagini, ricerca online. Ninja è una piattaforma di agenti e offre “SuperAgent” che utilizza una combinazione di agenti con una precisione di livello mondiale paragonabile (e in alcune categorie superiore) ai modelli di fondazione di frontiera. La tecnologia agentica di Ninja richiede gli acceleratori dalle prestazioni più elevate, per offrire le esperienze in tempo reale univoche che i nostri clienti si aspettano.
-
Ricoh
Il team di machine learning di RICOH sviluppa soluzioni per l'ambiente di lavoro e servizi di trasformazione digitale progettati per gestire e ottimizzare il flusso di informazioni tra le nostre soluzioni aziendali.
-
PyTorch
-
Refact.ai
Refact.ai offre strumenti di intelligenza artificiale completi come il completamento automatico del codice basato su Retrieval-Augmented Generation (RAG), che fornisce suggerimenti più accurati e una chat sensibile al contesto utilizzando modelli proprietari e open source.
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
Anyscale è l'organizzazione che ha creato Ray, un motore di calcolo IA che alimenta le iniziative di ML e IA generativa per le aziende. Con la piattaforma di IA unificata di Anyscale basata su RayTurbo, i clienti ottengono un'elaborazione dei dati fino a 4,5 volte più veloce, un'inferenza batch 10 volte inferiore con LLM, una scalabilità 5 volte più veloce, un'iterazione 12 volte più veloce e un risparmio sui costi del 50% per l'inferenza dei modelli online ottimizzando l'utilizzo delle risorse.
-
Datadog
-
Hugging Face
-
Lightning AI
Lightning AI, il creatore di PyTorch Lightning e Lightning Studios, offre la piattaforma di sviluppo IA più intuitiva e completa per l'intelligenza artificiale di livello aziendale. Lightning fornisce strumenti a codice completo, a uso ridotto di codice e senza codice per creare agenti, applicazioni di intelligenza artificiale e soluzioni di IA generativa, in tempi rapidissimi. Progettato per la flessibilità, funziona senza problemi sul tuo cloud o sul nostro sfruttando l'esperienza e il supporto di una forte community di sviluppatori di oltre 3 milioni di persone.
-
Domino Data Lab
Domino orchestra tutti gli artefatti di data science, inclusi infrastruttura, dati e servizi su AWS in tutti gli ambienti, integrando Amazon SageMaker con funzionalità di governance e collaborazione per supportare i team di data science aziendali. Domino è disponibile in formula SaaS o autogestita tramite AWS Marketplace.
Nozioni di base
Dettagli prodotto
Dimensioni istanza | Disponibile in UltraServer EC2 | Chip Trainium2 | Memoria acceleratore |
vCPU | Memoria (TB) |
Archiviazione dell’istanza (TB) | Larghezza di banda della rete (Tb/s) | Larghezza di banda EBS (Gb/s) |
trn2.48xlarge | No | 16 | 1,5 TB | 192 | 2 TB | 4 x 1.92 SSD NVMe | 3,2 | 80 |
trn2u.48xlarge | Sì (Anteprima) | 16 | 1,5 TB | 192 | 2 TB | 4 x 1.92 SSD NVMe | 3,2 | 80 |