Meta Llama di Amazon Bedrock

Bangun masa depan AI dengan Llama

Memperkenalkan Llama 3.3

Llama 3.3 adalah model instruksi hanya teks 70B yang memberikan peningkatan kinerja relatif terhadap Llama 3.1 70B–dan Llama 3.2 90B saat digunakan untuk aplikasi teks saja. Llama 3.3 70B memberikan kinerja yang serupa dengan Llama 3.1 405B, meski hanya membutuhkan sebagian kecil sumber daya komputasi.

Pelatihan komprehensif Llama 3.3 70B menghasilkan pemahaman yang kuat dan kemampuan generasi di berbagai tugas. Model ini mendukung AI percakapan berkinerja tinggi yang dirancang untuk pembuatan konten, aplikasi perusahaan, dan penelitian, menawarkan kemampuan pemahaman bahasa tingkat lanjut, termasuk ringkasan teks, klasifikasi, analisis sentimen, dan pembuatan kode.

Llama 3.2 90B adalah model Meta yang paling canggih dan sangat ideal untuk aplikasi tingkat perusahaan. Llama 3.2 adalah model Llama pertama yang mendukung tugas visi, dengan arsitektur model baru yang mengintegrasikan representasi encoder gambar ke dalam model bahasa. Model ini unggul dalam pengetahuan umum, pembuatan teks panjang, terjemahan multibahasa, pengkodean, matematika, dan penalaran lanjutan. Model ini juga memperkenalkan kemampuan penalaran gambar sehingga memungkinkan pemahaman gambar dan penalaran visual yang canggih. Model ini sangat ideal untuk kasus penggunaan berikut: pembuatan keterangan gambar, pengambilan teks dari gambar, landasan visual, jawaban pertanyaan visual dan penalaran visual, serta jawaban pertanyaan visual dokumen.

Llama 3.2 11B sangat ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, dan aplikasi perusahaan yang membutuhkan penalaran visual. Model ini memiliki kinerja yang kuat dalam meringkas teks, menganalisis sentimen, membuat kode, dan mengikuti instruksi, dengan kemampuan tambahan untuk melakukan penalaran tentang gambar. Model ini sangat ideal untuk kasus penggunaan berikut: pembuatan keterangan gambar, pengambilan teks dari gambar, landasan visual, jawaban pertanyaan visual dan penalaran visual, serta jawaban pertanyaan visual dokumen.

Llama 3.2 3B menawarkan pengalaman AI yang lebih dipersonalisasi dan pemrosesan di perangkat. Llama 3.2 3B dirancang untuk aplikasi yang membutuhkan inferensi latensi rendah dan sumber daya komputasi terbatas. Model ini memiliki keunggulan di bidang peringkasan teks, klasifikasi, dan tugas penerjemahan bahasa. Model ini sangat ideal untuk kasus penggunaan berikut: aplikasi layanan pelanggan dan asisten penulisan yang didukung oleh AI seluler.

Llama 3.2 1B adalah model paling ringan dalam koleksi model Llama 3.2, serta sangat cocok untuk pengambilan dan peringkasan untuk perangkat edge juga aplikasi seluler. Model ini mengaktifkan kemampuan AI di perangkat sambil menjaga privasi pengguna dan meminimalkan latensi. Model ini sangat ideal untuk kasus penggunaan berikut: manajemen informasi pribadi dan pengambilan pengetahuan multibahasa.

Manfaat

Llama 3.2 menawarkan pengalaman AI yang lebih dipersonalisasi dan pemrosesan di perangkat. Model Llama 3.2 dirancang agar lebih efisien, dengan pengurangan latensi dan peningkatan kinerja, sehingga cocok untuk berbagai penerapan.
Panjang konteks 128 Ribu memungkinkan Llama menangkap hubungan yang lebih bervariasi dalam data.
Model Llama dilatih pada 15 triliun token dari sumber data publik online untuk memahami seluk-beluk bahasa lebih baik.
Llama 3.2 tersedia dalam berbagai bahasa dan mendukung delapan bahasa, termasuk Bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
API terkelola milik Amazon Bedrock membuat penggunaan model Llama lebih mudah dari sebelumnya. Organisasi dari semua ukuran dapat mengakses keunggulan Llama tanpa khawatir tentang infrastruktur yang mendasarinya. Karena Amazon Bedrock bersifat nirserver, Anda tidak perlu mengelola infrastruktur apa pun, dan Anda dapat mengintegrasikan serta melakukan deployment kemampuan AI generatif Llama dengan aman ke dalam aplikasi Anda menggunakan layanan AWS yang sudah Anda ketahui. Artinya, Anda dapat fokus pada keahlian terbaik Anda—membangun aplikasi AI Anda.

Temui Llama

Selama lebih dari satu dekade terakhir, Meta telah berfokus untuk menyediakan alat bagi developer dan membina kolaborasi serta kemajuan di antara para developer, peneliti, dan organisasi. Model Llama tersedia dalam berbagai ukuran parameter, yang memungkinkan developer untuk memilih model yang paling sesuai dengan kebutuhan dan anggaran inferensi mereka. Model Llama di Amazon Bedrock membuka banyak sekali kemungkinan karena developer tidak perlu khawatir mengenai skalabilitas atau pengelolaan infrastruktur. Amazon Bedrock adalah cara turnkey yang sangat sederhana bagi developer untuk mulai menggunakan Llama.

Kasus penggunaan

Model Llama unggul dalam pemahaman gambar dan penalaran visual, nuansa bahasa, pemahaman kontekstual, dan tugas kompleks, seperti analisis data visual, pembuatan keterangan gambar, pembuatan dialog, penerjemahan dan pembuatan dialog, serta dapat menangani tugas multilangkah dengan mudah. Kasus penggunaan tambahan model Llama sangat cocok untuk tugas-tugas tertentu, seperti penalaran dan pemahaman visual yang canggih, pengambilan teks dari gambar, landasan visual, jawaban pertanyaan visual dokumen, peringkasan dan akurasi teks, klasifikasi teks, analisis sentimen dan penalaran nuansa, pemodelan bahasa, sistem dialog, pembuatan kode, dan mengikuti instruksi.

Versi model

Llama 3.3 70B

Model 70B hanya teks yang selaras dengan instruksi yang memberikan peningkatan performa relatif terhadap Llama 3.1 70B–dan ke Llama 3.2 90B saat digunakan untuk aplikasi hanya teks. Llama 3.3 70B memberikan performa yang sama dengan Llama 3.1 405B, meskipun hanya membutuhkan sebagian kecil sumber daya komputasi.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Spanyol, dan Thai.

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: AI percakapan yang didesain untuk pembuatan konten, aplikasi korporasi, dan penelitian, yang menawarkan kemampuan pemahaman bahasa tingkat lanjut, termasuk ringkasan teks, klasifikasi, analisis sentimen, dan pembuatan kode. Model tersebut juga mendukung kemampuan untuk memanfaatkan output model untuk meningkatkan model lain, termasuk pembuatan data sintetis dan distilasi.

Llama 3.2 90B

Model multimodal yang mengambil input dan output teks serta gambar. Ideal untuk aplikasi yang membutuhkan kecerdasan visual canggih, seperti analisis gambar, pemrosesan dokumen, chatbot multimodal, dan sistem otonom.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Pemahaman gambar, penalaran visual, dan interaksi multimodal, yang memungkinkan aplikasi tingkat lanjut, seperti keterangan gambar, pengambilan gambar-teks, landasan visual, jawaban pertanyaan visual, dan jawaban pertanyaan visual dokumen, dengan kemampuan unik untuk bernalar dan menarik kesimpulan dari input visual dan tekstual.

Baca blog

Llama 3.2 11B

Model multimodal yang mengambil input dan output teks serta gambar. Ideal untuk aplikasi yang membutuhkan kecerdasan visual canggih, seperti analisis gambar, pemrosesan dokumen, dan chatbot multimodal.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Pemahaman gambar, penalaran visual, dan interaksi multimodal, yang memungkinkan aplikasi lanjutan, seperti keterangan gambar, pengambilan gambar-teks, landasan visual, jawaban pertanyaan visual, dan jawaban pertanyaan visual dokumen.

Baca blog

Llama 3.2 3B

Model ringan khusus teks yang dibuat untuk memberikan hasil yang sangat akurat dan relevan. Dirancang untuk aplikasi yang membutuhkan inferensi latensi rendah dan sumber daya komputasi terbatas. Ideal untuk kueri dan penulisan ulang prompt, asisten penulisan bertenaga AI seluler, dan aplikasi layanan pelanggan, terutama pada perangkat edge di mana efisiensi dan latensi rendahnya memungkinkan integrasi tanpa kendala ke dalam berbagai aplikasi, termasuk asisten penulisan bertenaga AI seluler dan chatbot layanan pelanggan.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Pembuatan teks lanjutan, ringkasan, analisis sentimen, kecerdasan emosional, pemahaman kontekstual, dan penalaran akal sehat.

Baca blog

Llama 3.2 1B

Model ringan khusus teks yang dibuat untuk memberikan respons yang cepat dan akurat. Ideal untuk perangkat edge dan aplikasi seluler. Model ini mengaktifkan kemampuan AI di perangkat sambil menjaga privasi pengguna dan meminimalkan latensi.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Kasus penggunaan dialog multibahasa, seperti manajemen informasi pribadi, pengambilan pengetahuan multibahasa, dan tugas penulisan ulang.

Baca blog

Llama 3.1 405B

Ideal untuk aplikasi tingkat korporasi, penelitian dan pengembangan, pembuatan data sintetis, serta distilasi model. Dengan kemampuan inferensi latensi yang dioptimalkan yang tersedia dalam pratinjau publik, model ini memberikan performa dan skalabilitas yang luar biasa, sehingga memungkinkan organisasi untuk mempercepat inisiatif AI mereka sambil mempertahankan output berkualitas tinggi di berbagai kasus penggunaan.

Token maksimum
: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai.

Penyempurnaan yang didukung: Segera hadir

Kasus penggunaan yang didukung: Pengetahuan umum, pembuatan teks bentuk panjang, penerjemahan mesin, pemahaman kontekstual yang ditingkatkan, penalaran dan pengambilan keputusan lanjutan, penanganan ambiguitas dan ketidakpastian yang lebih baik, peningkatan kreativitas dan keragaman, kemampuan pengendalian, matematika, penggunaan alat bantu, penerjemahan multibahasa, serta pengodean.

Baca blog

Lama 3.1 70B

Ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, pengembangan penelitian, dan aplikasi korporasi. Dengan kemampuan inferensi latensi yang dioptimalkan baru yang tersedia di pratinjau publik, model ini menetapkan tolok ukur performa baru untuk solusi AI yang memproses input teks ekstensif, sehingga memungkinkan aplikasi merespons lebih cepat dan menangani kueri yang lebih lama dengan lebih efisien.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa.

Baca blog

Lama 3.1 8B

Ideal untuk daya dan sumber daya komputasi yang terbatas, waktu pelatihan yang lebih cepat, dan perangkat edge.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa.

Baca blog

Llama 3 70B

Ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, pengembangan penelitian, dan aplikasi perusahaan. 

Token maksimum: 8K

Bahasa: Inggris

Penyempurnaan didukung: Tidak

Kasus penggunaan yang didukung: Ringkasan dan akurasi teks, klasifikasi dan nuansa teks, analisis sentimen dan penalaran nuansa, pemodelan bahasa, sistem dialog, pembuatan kode, serta instruksi yang mengikuti.

Baca blog

Llama 3 8B

Ideal untuk daya komputasi dan sumber daya terbatas, waktu pelatihan yang lebih cepat, dan perangkat edge.

Token maksimum: 8K

Bahasa: Inggris

Penyempurnaan didukung: Tidak

Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa

Baca blog

Lama 2 70B

Model yang disempurnakan dalam ukuran parameter 70B. Cocok untuk tugas skala besar, seperti pemodelan bahasa, pembuatan teks, dan sistem dialog.

Token maksimum: 4 ribu

Bahasa: Inggris

Penyempurnaan didukung: Ya

Kasus penggunaan yang didukung: Obrolan seperti asisten

Baca blog

Llama 2 13B

Model yang disempurnakan dalam ukuran parameter 13B. Cocok untuk tugas skala kecil, seperti klasifikasi teks, analisis sentimen, dan terjemahan bahasa.

Token maksimum: 4 ribu

Bahasa: Inggris

Penyempurnaan didukung: Ya

Kasus penggunaan yang didukung: Obrolan seperti asisten

Baca blog

Nomura menggunakan model Llama dari Meta di Amazon Bedrock untuk mendemokratisasikan AI generatif

 

Aniruddh Singh, Nomura's Executive Director dan Enterprise Architect, menguraikan perjalanan lembaga keuangan untuk mendemokratisasikan AI generatif di seluruh perusahaan menggunakan model Amazon Bedrock dan Llama dari Meta. Amazon Bedrock memberikan akses penting ke model fondasi terkemuka seperti Llama, yang memungkinkan integrasi tanpa kendala. Llama menawarkan manfaat utama bagi Nomura, yang meliputi inovasi yang lebih cepat, transparansi, pagar pembatas bias, dan performa yang tangguh di seluruh ringkasan teks, pembuatan kode, analisis log, dan pemrosesan dokumen. 

TaskUs merevolusi pengalaman pelanggan menggunakan model Llama dari Meta di Amazon Bedrock

TaskUs, yang merupakan penyedia layanan digital pengalihdayaan dan pengalaman pelanggan generasi berikutnya yang terkemuka untuk perusahaan paling inovatif di dunia, membantu kliennya merepresentasikan, melindungi, dan mengembangkan merek mereka. Platform TaskGPT inovatif milik TaskUs, yang ditenagai oleh model Amazon Bedrock dan Llama dari Meta, memberdayakan rekan satu tim untuk memberikan layanan yang luar biasa. TaskUs membangun alat di TaskGPT yang memanfaatkan Amazon Bedrock dan Llama untuk parafrasa yang hemat biaya, pembuatan konten, pemahaman, dan penanganan tugas yang kompleks.