Eksperimen Machine Learning menggunakan Amazon SageMaker dengan MLflow

Kelola model machine learning dan eksperimen aplikasi AI generatif secara efisien dalam skala besar menggunakan MLflow

Mengapa menggunakan Amazon SageMaker dengan MLflow?

Amazon SageMaker menawarkan kemampuan MLflow terkelola untuk machine learning (ML) dan eksperimen AI generatif. Kemampuan ini memudahkan ilmuwan data dalam menggunakan MLflow di SageMaker untuk pelatihan, pendaftaran, dan deployment model. Admin dapat dengan cepat menyiapkan lingkungan MLflow yang aman dan dapat diskalakan di AWS. Ilmuwan data dan developer ML dapat secara efisien melacak eksperimen ML dan menemukan model yang tepat untuk masalah bisnis.

Manfaat Amazon SageMaker dengan MLflow

Ilmuwan Data dapat menggunakan MLflow untuk melacak semua metrik yang dihasilkan selama penyempurnaan model fondasi, mengevaluasi model, menguji model dengan data sampel, membandingkan output dari setiap model secara berdampingan di UI MLflow, dan mendaftarkan model yang tepat untuk kasus penggunaannya. Setelah mendaftarkan model, rekayasawan ML dapat melakukan deployment model ke inferensi SageMaker.
Anda tidak perlu mengelola infrastruktur apa pun yang diperlukan untuk melakukan host MLflow. Ilmuwan Data dapat menggunakan semua kemampuan sumber terbuka MLflow tanpa perlu mengkhawatirkan biaya tambahan infrastruktur. Hal ini menghemat waktu dan biaya saat menyiapkan lingkungan ilmu data. MLflow terintegrasi dengan Amazon Identity and Access Management (IAM), yang memungkinkan Anda mengatur Kontrol Akses Berbasis Peran (RBAC) untuk Server Pelacakan MLflow.
Model yang terdaftar di MLflow akan secara otomatis didaftarkan ke Registri Model Amazon SageMaker dengan Kartu Model Amazon SageMaker terkait. Hal ini memungkinkan para ilmuwan data untuk mengalihkan model mereka kepada rekayasawan ML untuk deployment produksi tanpa mengubah konteks. Rekayasawan ML dapat melakukan deployment model dari MLflow ke titik akhir SageMaker tanpa membuat kontainer khusus atau mengemas ulang artefak model MLflow.
Seiring dengan berkembangnya proyek MLflow, pelanggan SageMaker AI akan mendapatkan keuntungan dari inovasi sumber terbuka dari komunitas MLflow sekaligus menikmati manajemen infrastruktur yang disediakan oleh AWS.

Lacak eksperimen dari mana saja

Eksperimen ML dilakukan di lingkungan yang beragam, termasuk notebook lokal, IDE, kode pelatihan berbasis cloud, atau IDE terkelola di Amazon SageMaker Studio. Dengan SageMaker AI dan MLflow, Anda dapat menggunakan lingkungan yang Anda pilih untuk melatih model, melacak eksperimen di MLflow, dan meluncurkan UI MLflow secara langsung atau melalui SageMaker Studio untuk analisis.

Eksperimen Log

Berkolaborasi dalam eksperimen model

Kolaborasi tim yang efektif sangat penting untuk proyek ilmu data yang sukses. SageMaker Studio memungkinkan Anda mengelola dan mengakses Server Pelacakan MLflow dan eksperimen, yang memungkinkan anggota tim untuk berbagi informasi dan memastikan hasil eksperimen yang konsisten sehingga membuat kolaborasi lebih mudah.

Mengelola metadata eksperimen ML secara terpusat

Evaluasi eksperimen

Mengidentifikasi model terbaik dari beberapa iterasi memerlukan analisis dan perbandingan pada performa model. MLflow menawarkan visualisasi seperti plot pencar, diagram batang, dan histogram untuk membandingkan iterasi pelatihan. Selain itu, MLflow memungkinkan evaluasi model untuk bias dan kesetaraan.

Evaluasi eksperimen ML Anda

Kelola model MLflow secara terpusat

Beberapa tim sering menggunakan MLflow untuk mengelola eksperimen mereka, yang menggunakan hanya beberapa model sebagai kandidat untuk produksi. Organisasi membutuhkan cara mudah untuk melacak semua model kandidat guna membuat keputusan berdasarkan informasi tentang model mana yang akan dilanjutkan ke produksi. MLflow terintegrasi secara mulus dengan Registri Model SageMaker, yang memungkinkan organisasi untuk melihat model mereka yang terdaftar di MLflow muncul secara otomatis di Registri Model SageMaker, lengkap dengan Kartu Model SageMaker untuk tata kelola. Integrasi ini memungkinkan ilmuwan data dan rekayasawan ML menggunakan alat yang berbeda untuk tugas masing-masing: MLflow untuk eksperimen dan Registri Model SageMaker untuk mengelola siklus hidup produksi dengan silsilah model yang komprehensif.

Bagikan pembaruan dan hasil

Melakukan deployment Model MLflow ke titik akhir SageMaker

Deployment model dari MLflow ke Titik Akhir SageMaker berjalan lancar sehingga menghilangkan kebutuhan dalam membuat kontainer kustom untuk penyimpanan model. Integrasi ini memungkinkan pelanggan memanfaatkan kontainer inferensi SageMaker yang dioptimalkan sekaligus mempertahankan pengalaman MLflow yang memudahkan pengguna untuk mencatat dan mendaftarkan model.

Perbanyak dan audit eksperimen ML