Memperkenalkan Llama 3.3
Llama 3.3 adalah model instruksi hanya teks 70B yang memberikan peningkatan kinerja relatif terhadap Llama 3.1 70B–dan Llama 3.2 90B saat digunakan untuk aplikasi teks saja. Llama 3.3 70B memberikan kinerja yang serupa dengan Llama 3.1 405B, meski hanya membutuhkan sebagian kecil sumber daya komputasi.
Manfaat
Temui Llama
Selama lebih dari satu dekade terakhir, Meta telah berfokus untuk menyediakan alat bagi developer dan membina kolaborasi serta kemajuan di antara para developer, peneliti, dan organisasi. Model Llama tersedia dalam berbagai ukuran parameter, yang memungkinkan developer untuk memilih model yang paling sesuai dengan kebutuhan dan anggaran inferensi mereka. Model Llama di Amazon Bedrock membuka banyak sekali kemungkinan karena developer tidak perlu khawatir mengenai skalabilitas atau pengelolaan infrastruktur. Amazon Bedrock adalah cara turnkey yang sangat sederhana bagi developer untuk mulai menggunakan Llama.
Kasus penggunaan
Model Llama unggul dalam pemahaman gambar dan penalaran visual, nuansa bahasa, pemahaman kontekstual, dan tugas kompleks, seperti analisis data visual, pembuatan keterangan gambar, pembuatan dialog, penerjemahan dan pembuatan dialog, serta dapat menangani tugas multilangkah dengan mudah. Kasus penggunaan tambahan model Llama sangat cocok untuk tugas-tugas tertentu, seperti penalaran dan pemahaman visual yang canggih, pengambilan teks dari gambar, landasan visual, jawaban pertanyaan visual dokumen, peringkasan dan akurasi teks, klasifikasi teks, analisis sentimen dan penalaran nuansa, pemodelan bahasa, sistem dialog, pembuatan kode, dan mengikuti instruksi.
Versi model
Llama 3.3 70B
Model 70B hanya teks yang selaras dengan instruksi yang memberikan peningkatan performa relatif terhadap Llama 3.1 70B–dan ke Llama 3.2 90B saat digunakan untuk aplikasi hanya teks. Llama 3.3 70B memberikan performa yang sama dengan Llama 3.1 405B, meskipun hanya membutuhkan sebagian kecil sumber daya komputasi.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Spanyol, dan Thai.
Dukungan penyempurnaan: Tidak
Kasus penggunaan yang didukung: AI percakapan yang didesain untuk pembuatan konten, aplikasi korporasi, dan penelitian, yang menawarkan kemampuan pemahaman bahasa tingkat lanjut, termasuk ringkasan teks, klasifikasi, analisis sentimen, dan pembuatan kode. Model tersebut juga mendukung kemampuan untuk memanfaatkan output model untuk meningkatkan model lain, termasuk pembuatan data sintetis dan distilasi.
Llama 3.2 90B
Model multimodal yang mengambil input dan output teks serta gambar. Ideal untuk aplikasi yang membutuhkan kecerdasan visual canggih, seperti analisis gambar, pemrosesan dokumen, chatbot multimodal, dan sistem otonom.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
Dukungan penyempurnaan: Tidak
Kasus penggunaan yang didukung: Pemahaman gambar, penalaran visual, dan interaksi multimodal, yang memungkinkan aplikasi tingkat lanjut, seperti keterangan gambar, pengambilan gambar-teks, landasan visual, jawaban pertanyaan visual, dan jawaban pertanyaan visual dokumen, dengan kemampuan unik untuk bernalar dan menarik kesimpulan dari input visual dan tekstual.
Llama 3.2 11B
Model multimodal yang mengambil input dan output teks serta gambar. Ideal untuk aplikasi yang membutuhkan kecerdasan visual canggih, seperti analisis gambar, pemrosesan dokumen, dan chatbot multimodal.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
Dukungan penyempurnaan: Tidak
Kasus penggunaan yang didukung: Pemahaman gambar, penalaran visual, dan interaksi multimodal, yang memungkinkan aplikasi lanjutan, seperti keterangan gambar, pengambilan gambar-teks, landasan visual, jawaban pertanyaan visual, dan jawaban pertanyaan visual dokumen.
Llama 3.2 3B
Model ringan khusus teks yang dibuat untuk memberikan hasil yang sangat akurat dan relevan. Dirancang untuk aplikasi yang membutuhkan inferensi latensi rendah dan sumber daya komputasi terbatas. Ideal untuk kueri dan penulisan ulang prompt, asisten penulisan bertenaga AI seluler, dan aplikasi layanan pelanggan, terutama pada perangkat edge di mana efisiensi dan latensi rendahnya memungkinkan integrasi tanpa kendala ke dalam berbagai aplikasi, termasuk asisten penulisan bertenaga AI seluler dan chatbot layanan pelanggan.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
Dukungan penyempurnaan: Tidak
Kasus penggunaan yang didukung: Pembuatan teks lanjutan, ringkasan, analisis sentimen, kecerdasan emosional, pemahaman kontekstual, dan penalaran akal sehat.
Llama 3.2 1B
Model ringan khusus teks yang dibuat untuk memberikan respons yang cepat dan akurat. Ideal untuk perangkat edge dan aplikasi seluler. Model ini mengaktifkan kemampuan AI di perangkat sambil menjaga privasi pengguna dan meminimalkan latensi.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
Dukungan penyempurnaan: Tidak
Kasus penggunaan yang didukung: Kasus penggunaan dialog multibahasa, seperti manajemen informasi pribadi, pengambilan pengetahuan multibahasa, dan tugas penulisan ulang.
Llama 3.1 405B
Ideal untuk aplikasi tingkat korporasi, penelitian dan pengembangan, pembuatan data sintetis, serta distilasi model. Dengan kemampuan inferensi latensi yang dioptimalkan yang tersedia dalam pratinjau publik, model ini memberikan performa dan skalabilitas yang luar biasa, sehingga memungkinkan organisasi untuk mempercepat inisiatif AI mereka sambil mempertahankan output berkualitas tinggi di berbagai kasus penggunaan.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai.
Penyempurnaan yang didukung: Segera hadir
Kasus penggunaan yang didukung: Pengetahuan umum, pembuatan teks bentuk panjang, penerjemahan mesin, pemahaman kontekstual yang ditingkatkan, penalaran dan pengambilan keputusan lanjutan, penanganan ambiguitas dan ketidakpastian yang lebih baik, peningkatan kreativitas dan keragaman, kemampuan pengendalian, matematika, penggunaan alat bantu, penerjemahan multibahasa, serta pengodean.
Lama 3.1 70B
Ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, pengembangan penelitian, dan aplikasi korporasi. Dengan kemampuan inferensi latensi yang dioptimalkan baru yang tersedia di pratinjau publik, model ini menetapkan tolok ukur performa baru untuk solusi AI yang memproses input teks ekstensif, sehingga memungkinkan aplikasi merespons lebih cepat dan menangani kueri yang lebih lama dengan lebih efisien.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
Dukungan penyempurnaan: Ya
Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa.
Lama 3.1 8B
Ideal untuk daya dan sumber daya komputasi yang terbatas, waktu pelatihan yang lebih cepat, dan perangkat edge.
Token maksimum: 128 ribu
Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
Dukungan penyempurnaan: Ya
Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa.
Llama 3 70B
Ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, pengembangan penelitian, dan aplikasi perusahaan.
Token maksimum: 8K
Bahasa: Inggris
Penyempurnaan didukung: Tidak
Kasus penggunaan yang didukung: Ringkasan dan akurasi teks, klasifikasi dan nuansa teks, analisis sentimen dan penalaran nuansa, pemodelan bahasa, sistem dialog, pembuatan kode, serta instruksi yang mengikuti.
Llama 3 8B
Ideal untuk daya komputasi dan sumber daya terbatas, waktu pelatihan yang lebih cepat, dan perangkat edge.
Token maksimum: 8K
Bahasa: Inggris
Penyempurnaan didukung: Tidak
Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa
Lama 2 70B
Model yang disempurnakan dalam ukuran parameter 70B. Cocok untuk tugas skala besar, seperti pemodelan bahasa, pembuatan teks, dan sistem dialog.
Token maksimum: 4 ribu
Bahasa: Inggris
Penyempurnaan didukung: Ya
Kasus penggunaan yang didukung: Obrolan seperti asisten
Llama 2 13B
Model yang disempurnakan dalam ukuran parameter 13B. Cocok untuk tugas skala kecil, seperti klasifikasi teks, analisis sentimen, dan terjemahan bahasa.
Token maksimum: 4 ribu
Bahasa: Inggris
Penyempurnaan didukung: Ya
Kasus penggunaan yang didukung: Obrolan seperti asisten
Nomura menggunakan model Llama dari Meta di Amazon Bedrock untuk mendemokratisasikan AI generatif
Aniruddh Singh, Nomura's Executive Director dan Enterprise Architect, menguraikan perjalanan lembaga keuangan untuk mendemokratisasikan AI generatif di seluruh perusahaan menggunakan model Amazon Bedrock dan Llama dari Meta. Amazon Bedrock memberikan akses penting ke model fondasi terkemuka seperti Llama, yang memungkinkan integrasi tanpa kendala. Llama menawarkan manfaat utama bagi Nomura, yang meliputi inovasi yang lebih cepat, transparansi, pagar pembatas bias, dan performa yang tangguh di seluruh ringkasan teks, pembuatan kode, analisis log, dan pemrosesan dokumen.
TaskUs merevolusi pengalaman pelanggan menggunakan model Llama dari Meta di Amazon Bedrock
TaskUs, yang merupakan penyedia layanan digital pengalihdayaan dan pengalaman pelanggan generasi berikutnya yang terkemuka untuk perusahaan paling inovatif di dunia, membantu kliennya merepresentasikan, melindungi, dan mengembangkan merek mereka. Platform TaskGPT inovatif milik TaskUs, yang ditenagai oleh model Amazon Bedrock dan Llama dari Meta, memberdayakan rekan satu tim untuk memberikan layanan yang luar biasa. TaskUs membangun alat di TaskGPT yang memanfaatkan Amazon Bedrock dan Llama untuk parafrasa yang hemat biaya, pembuatan konten, pemahaman, dan penanganan tugas yang kompleks.