Che cos'è SageMaker HyperPod?
Amazon SageMaker HyperPod rimuove i carichi indifferenziati necessari per la creazione di modelli di IA generativa. Aiuta a scalare rapidamente le attività di sviluppo del modello come addestramento, messa a punto o inferenza su un cluster di centinaia o migliaia di acceleratori IA. SageMaker HyperPod consente la governance centralizzata di tutte le attività di sviluppo del modello, offrendoti piena visibilità e controllo sulla priorità delle diverse attività e sul modo in cui le risorse di calcolo vengono assegnate a ciascuna attività, aiutandoti a massimizzare l'utilizzo di GPU e AWS Trainium del tuo cluster e ad accelerare l'innovazione.
Con SageMaker HyperPod, puoi distribuire e parallelizzare in modo efficiente il carico di lavoro di addestramento su tutti gli acceleratori. SageMaker HyperPod applica automaticamente le migliori configurazioni di formazione per i modelli più diffusi disponibili al pubblico, per aiutarti a raggiungere rapidamente prestazioni ottimali. Inoltre, monitora anche continuamente il tuo cluster per eventuali guasti dell'infrastruttura, ripara automaticamente il problema e ripristina i carichi di lavoro senza intervento umano, il tutto aiutandoti a risparmiare fino al 40% del tempo di formazione.
Vantaggi di SageMaker HyperPod
Presentazione della governance delle attività in SageMaker HyperPod
Massimizza l'utilizzo e ottieni la visibilità completa delle risorse di calcolo, riducendo al contempo i costi.