Mengapa memilih instans dan UltraServers Trn2 Amazon EC2?
Instans Trn2 Amazon EC2, didukung oleh 16 chip AWS Trainium2, yang dibuat khusus untuk AI generatif dan merupakan instans EC2 paling andal untuk melatih dan menerapkan model dengan ratusan miliar hingga triliun+ parameter. Instans Trn2 menawarkan performa sesuai harga 30-40% lebih baik daripada instans EC2 P5e dan P5en berbasis GPU generasi saat ini. Dengan instans Trn2, Anda bisa mendapatkan pelatihan canggih dan kinerja inferensi sekaligus menurunkan biaya, sehingga Anda dapat mengurangi waktu pelatihan, melakukan pengulangan lebih cepat, dan menghadirkan pengalaman waktu nyata yang didukung AI. Anda dapat menggunakan instans Trn2 untuk melatih dan menerapkan model termasuk model bahasa besar (LLM), model multimodal, dan transformator difusi untuk membangun aplikasi AI generatif generasi berikutnya.
Untuk mempersingkat waktu pelatihan dan memberikan waktu respons terobosan (latensi per-token) untuk model canggih dengan persyaratan ketat, Anda mungkin memerlukan lebih banyak komputasi dan memori daripada yang dapat diberikan oleh satu instans. UltraServers Trn2 menggunakan NeuronLink, interkoneksi chip-ke-chip milik kami, untuk menghubungkan 64 chip Trainium2 di empat instans Trn2, yang melipatgandakan bandwidth komputasi, memori, dan jaringan yang tersedia dalam satu simpul dan menawarkan performa terobosan di AWS untuk deep learning dan beban kerja AI generatif. Kesimpulannya, UltraServers membantu memberikan waktu respons terdepan di industri untuk menciptakan pengalaman waktu nyata terbaik. Untuk pelatihan, UltraServers meningkatkan kecepatan dan efisiensi pelatihan model dengan komunikasi kolektif yang lebih cepat untuk paralelisme model dibandingkan dengan instans mandiri.
Anda dapat dengan mudah memulai instans Trn2 dan UltraServers Trn2 dengan dukungan native untuk kerangka kerja machine learning (ML) populer, seperti PyTorch dan JAX.
Manfaat
Fitur
Testimoni pelanggan dan partner
Berikut ini beberapa contoh cara pelanggan dan partner menyusun rencana untuk mencapai tujuan bisnis mereka dengan instans Trn2 Amazon EC2.
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
Tujuan Itaú Unibanco adalah untuk meningkatkan hubungan masyarakat dengan uang demi menciptakan dampak positif pada kehidupan mereka sekaligus memperluas peluang transformasi mereka. Di Itaú Unibanco, kami percaya bahwa setiap pelanggan itu unik dan kami berfokus untuk memenuhi kebutuhan mereka melalui perjalanan digital intuitif, yang memanfaatkan kekuatan AI untuk terus beradaptasi dengan kebiasaan konsumsi mereka.
-
NinjaTech AI
Ninja adalah Agen AI yang Komprehensif untuk Produktivitas Tanpa Batas: satu langganan sederhana, akses tak terbatas ke model AI terbaik di dunia beserta keterampilan AI terbaik seperti: menulis, pengodean, curah pendapat, pembuatan gambar, penelitian online. Ninja adalah platform agen yang menawarkan "SuperAgent" yang menggunakan Kombinasi Agen dengan akurasi kelas dunia yang sebanding dengan (dan dalam beberapa kategori mengalahkan) model fondasi mutakhir. Teknologi Agentic Ninja menuntut akselerator beperforma terbaik, untuk memberikan pengalaman waktu nyata unik yang diharapkan pelanggan.
-
Ricoh
Tim machine learning RICOH mengembangkan solusi tempat kerja dan layanan transformasi digital yang didesain untuk mengelola dan mengoptimalkan aliran informasi di seluruh solusi perusahaan.
-
PyTorch
-
Refact.ai
Refact.ai menawarkan alat AI yang komprehensif, seperti penyelesaian otomatis kode yang didukung oleh Retrieval-Augmented Generation (RAG), memberikan saran yang lebih akurat dan obrolan sadar konteks menggunakan model berpemilik dan sumber terbuka.
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
Anyscale adalah perusahaan yang menciptakan Ray, AI Compute Engine yang mendorong ML dan inisiatif AI Generatif untuk Perusahaan. Dengan platform AI terpadu Anyscale yang didukung oleh RayTurbo, pelanggan melihat pemrosesan data hingga 4,5x lebih cepat, inferensi batch biaya 10X lebih rendah dengan LLM, penskalaan 5x lebih cepat, iterasi 12X lebih cepat, dan penghematan biaya 50% untuk inferensi model online dengan mengoptimalkan pemanfaatan sumber daya.
-
Datadog
-
Hugging Face
-
Lightning AI
Lightning AI, pencipta PyTorch Lightning dan Lightning Studios menawarkan platform pengembangan AI komprehensif yang paling intuitif untuk AI tingkat perusahaan. Lightning menyediakan alat kode lengkap, kode rendah, dan tanpa kode untuk membangun agen, aplikasi AI, dan solusi AI generatif, secepat kilat. Dirancang untuk fleksibilitas, alat ini berjalan mulus di cloud Anda atau cloud kami yang memanfaatkan keahlian dan dukungan dari 3M+ komunitas developer yang solid.
-
Domino Data Lab
Domino mengatur semua artefak ilmu data, termasuk infrastruktur, data, dan layanan di AWS di seluruh lingkungan, melengkapi Amazon SageMaker dengan kemampuan tata kelola dan kolaborasi untuk mendukung tim ilmu data perusahaan. Domino tersedia melalui AWS Marketplace sebagai SaaS atau dikelola sendiri.
Memulai
Detail produk
Ukuran Instans | Tersedia dalam EC2 UltraServers | Cip Trainium2 | Akselerator memori |
vCPU | Memori (TB) |
Penyimpanan Instans (TB) | Bandwidth Jaringan (Gbps) | Bandwidth EBS (Gbps) |
trn2.48xlarge | Tidak | 16 | 1,5 TB | 192 | 2 TB | 4 x 1,92 SSD NVMe | 3,2 | 80 |
trn2u.48xlarge | Ya (Pratinjau) | 16 | 1,5 TB | 192 | 2 TB | 4 x 1,92 SSD NVMe | 3,2 | 80 |