Amazon EC2 Trn2 인스턴스 및 UltraServer를 사용해야 하는 이유는 무엇인가요?
16개의 AWS Trainium2 칩으로 구동되는 Amazon EC2 Trn2 인스턴스는 생성형 AI용으로 특별히 구축되었으며, 수천억에서 조 단위 이상의 파라미터로 모델을 훈련하고 배포하는 데 가장 강력한 EC2 인스턴스입니다. Trn2 인스턴스는 현재 세대의 GPU 기반 EC2 P5e 및 P5en 인스턴스보다 30~40% 우수한 가격 대비 성능을 제공합니다. Trn2 인스턴스를 사용하면 비용을 절감하면서도 최첨단 훈련 및 추론 성능을 확보할 수 있으므로 훈련 시간을 단축하고, 더 빠르게 반복하고, 실시간 AI 기반 경험을 제공할 수 있습니다. Trn2 인스턴스를 사용하여 대규모 언어 모델(LLM), 멀티모달 모델, 확산 트랜스포머를 비롯한 모델을 훈련 및 배포하여 차세대 생성형 AI 애플리케이션을 구축할 수 있습니다.
가장 까다로운 최첨단 모델의 훈련 시간을 줄이고 획기적인 응답 시간(토큰당 지연 시간)을 제공하려면 단일 인스턴스가 제공할 수 있는 것보다 더 많은 컴퓨팅 및 메모리가 필요할 수 있습니다. Trn2 UltraServer는 AWS의 독자적인 칩 간 상호 연결인 NeuronLink를 사용하여 4개의 Trn2 인스턴스에 걸쳐 64개의 Trainium2 칩을 연결하여 단일 노드에서 사용 가능한 컴퓨팅, 메모리, 네트워크 대역폭을 4배로 늘리고 AWS에서 딥 러닝 및 생성형 AI 워크로드에 획기적인 성능을 제공합니다. 추론의 경우, UltraServer는 업계 최고의 응답 시간을 제공하여 최상의 실시간 경험을 제공합니다. 훈련의 경우, UltraServer는 모델 병렬 처리를 위한 더 빠른 집단 통신을 통해 독립 실행형 인스턴스와 비교해 모델 훈련 속도와 효율성을 향상시킵니다.
PyTorch, JAX와 같은 인기 있는 기계 학습(ML) 프레임워크에 대한 기본 지원을 제공하여 Trn2 인스턴스 및 Trn2 UltraServer에서 간편하게 시작할 수 있습니다.
이점
기능
고객 및 파트너 추천사
다음은 고객과 파트너가 Amazon EC2 Trn2 인스턴스를 사용하여 비즈니스 목표를 달성하려는 계획을 보여주는 몇 가지 예입니다.
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
Itaú Unibanco의 목적은 돈과 사람의 관계를 개선하여 삶에 긍정적인 영향을 미치는 동시에 변화의 기회를 확대하는 것입니다. Itaú Unibanco에서는 각 고객이 특별하다고 믿으며 AI의 강력한 기능을 활용하여 소비자 습관에 지속적으로 적응하는 직관적인 디지털 여정을 통해 고객의 요구를 충족하는 데 중점을 둡니다.
-
NinjaTech AI
Ninja는 무한한 생산성을 위한 올인원 AI 에이전트입니다. 한 번의 구독으로 세계 최고의 AI 모델에 무제한으로 액세스하면서 작문, 코딩, 브레인스토밍, 이미지 생성, 온라인 연구와 같은 최고의 AI 기술을 이용할 수 있습니다. Ninja는 에이전트 플랫폼이며 프론티어 파운데이션 모델에 필적하는 (일부 범주에서는 능가하는) 세계적 수준의 정확도를 갖춘 에이전트 혼합을 사용하는 ‘SuperAgent’를 제공합니다. Ninja의 에이전트 기술은 고객이 기대하는 고유한 실시간 경험을 제공하기 위해 최고 성능의 액셀러레이터를 필요로 합니다.
-
Ricoh
RICOH 기계 학습 팀은 엔터프라이즈 솔루션 전반의 정보 흐름을 관리하고 최적화하도록 설계된 업무 공간 솔루션 및 디지털 트랜스포메이션 서비스를 개발합니다.
-
PyTorch
-
Refact.ai
Refact.ai는 검색 증강 생성(RAG)으로 구동되는 코드 자동 완성과 같은 포괄적인 AI 도구를 제공하여 보다 정확한 제안을 제공하고 독점 모델과 오픈 소스 모델을 모두 사용하는 컨텍스트 인식 채팅을 제공합니다.
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
Anyscale은 기업을 위한 ML 및 생성형 AI 이니셔티브를 촉진하는 AI 컴퓨팅 엔진인 Ray를 개발한 회사입니다. RayTurbo로 구동되는 Anyscale의 통합 AI 플랫폼을 통해 고객은 리소스 활용도를 최적화하여 최대 4.5배 더 빠른 데이터 처리, 10배 더 저렴한 LLM을 통한 배치 추론, 5배 더 빠른 스케일링, 12배 더 빠른 반복, 50%의 온라인 모델 추론 비용 절감 효과를 볼 수 있습니다.
-
Datadog
-
Hugging Face
-
Lightning AI
PyTorch Lightning과 Lightning 스튜디오를 개발한 Lightning AI는 엔터프라이즈급 AI를 위한 가장 직관적인 올인원 AI 개발 플랫폼을 제공합니다. Lightning은 에이전트, AI 애플리케이션, 생성형 AI 솔루션을 매우 신속하게 구축할 수 있는 풀 코드, 로우 코드 및 노코드 도구를 제공합니다. 유연성을 고려하여 설계되었으며, 3백만 명 이상의 강력한 개발자 커뮤니티의 전문 지식 및 지원을 활용하여 클라우드에서 원활하게 실행됩니다.
-
Domino Data Lab
Domino는 환경 전반에서 AWS의 인프라, 데이터, 서비스를 비롯한 모든 데이터 과학 아티팩트를 오케스트레이션하면서 엔터프라이즈 데이터 과학 팀을 지원하기 위해 Amazon SageMaker를 거버넌스 및 협업 기능으로 보완하고 있습니다. Domino는 AWS Marketplace를 통해 SaaS 또는 자체 관리형으로 제공됩니다.
시작하기
제품 세부 정보
인스턴스 크기 | EC2 UltraServers에서 사용 가능 | Trainium2 칩 | 액셀러레이터 메모리 |
vCPU | 메모리 (TB) |
인스턴스 스토리지(TB) | 네트워크 대역폭(Tbps) | EBS 대역폭(Gbps) |
trn2.48xlarge | 아니요 | 16 | 1.5TB | 192 | 2TB | 4 x 1.92 NVMe SSD | 3.2 | 80 |
trn2u.48xlarge | 예(평가판) | 16 | 1.5TB | 192 | 2TB | 4 x 1.92 NVMe SSD | 3.2 | 80 |