Ikhtisar solusi -

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Ikhtisar solusi

Kerangka kerja ML yang dapat diskalakan

Dalam bisnis dengan jutaan pelanggan yang tersebar di berbagai lini bisnis, alur kerja ML memerlukan integrasi data yang dimiliki dan dikelola oleh tim siloed menggunakan alat yang berbeda untuk membuka nilai bisnis. Bank berkomitmen untuk melindungi data nasabah mereka. Demikian pula, infrastruktur yang digunakan untuk pengembangan model ML juga tunduk pada standar keamanan yang tinggi. Keamanan tambahan ini menambah kompleksitas lebih lanjut dan berdampak pada waktu untuk menilai model ML baru. Dalam kerangka kerja ML yang dapat diskalakan, Anda dapat menggunakan toolset standar yang dimodernisasi untuk mengurangi upaya yang diperlukan untuk menggabungkan berbagai alat dan menyederhanakan proses untuk model ML baru. route-to-live

Secara tradisional, manajemen dan dukungan kegiatan ilmu data di industri FS dikendalikan oleh tim platform pusat yang mengumpulkan persyaratan, menyediakan sumber daya, dan memelihara infrastruktur untuk tim data di seluruh organisasi. Untuk meningkatkan skala penggunaan ML dalam tim federasi di seluruh organisasi, Anda dapat menggunakan kerangka kerja ML yang dapat diskalakan untuk menyediakan kemampuan swalayan bagi pengembang model dan jaringan pipa baru. Hal ini memungkinkan pengembang ini untuk menyebarkan infrastruktur modern, pra-disetujui, standar, dan aman. Pada akhirnya, kemampuan swalayan ini mengurangi ketergantungan organisasi Anda pada tim platform terpusat dan mempercepat waktu untuk menilai pengembangan model ML.

Kerangka kerja ML yang dapat diskalakan memungkinkan konsumen data (misalnya, ilmuwan data atau insinyur ML) untuk membuka nilai bisnis dengan memberi mereka kemampuan untuk melakukan hal berikut:

  • Jelajahi dan temukan data yang telah disetujui sebelumnya yang diperlukan untuk pelatihan model

  • Dapatkan akses ke data yang disetujui sebelumnya dengan cepat dan mudah

  • Gunakan data yang telah disetujui sebelumnya untuk membuktikan kelayakan model

  • Lepaskan model yang telah terbukti ke produksi untuk digunakan orang lain

Diagram berikut menyoroti end-to-end alur kerangka kerja dan rute yang disederhanakan untuk hidup untuk kasus penggunaan ML.

AWS Service Catalog shared account connecting to development, test, and production accounts.

Dalam konteks yang lebih luas, konsumen data menggunakan akselerator tanpa server yang disebut data.all untuk sumber data di beberapa danau data dan kemudian menggunakan data untuk melatih model mereka, seperti yang diilustrasikan oleh diagram berikut.

Data flow diagram showing MLOps and other applications interacting with data producers and consumers.

Pada tingkat yang lebih rendah, kerangka kerja ML yang dapat diskalakan berisi yang berikut:

Hub pusat untuk metadata

Data.all adalah akselerator tanpa server yang dapat Anda integrasikan dengan data lake AWS yang ada untuk mengumpulkan metadata ke hub pusat. easy-to-useUI sederhana di data.all menampilkan metadata yang terkait dengan kumpulan data dari beberapa danau data yang ada. Hal ini memungkinkan pengguna non-teknis dan teknis untuk mencari, menelusuri, dan meminta akses ke data berharga yang dapat digunakan di laboratorium ML mereka. Data. Semua menggunakan AWS Lake Formation,, AWS Lambda Amazon Elastic Container Service (Amazon ECS) AWS Fargate,, Amazon Service, OpenSearch dan. AWS Glue

SageMaker validasi

Untuk membuktikan kemampuan SageMaker AI di berbagai pemrosesan data dan arsitektur ML, tim yang menerapkan kemampuan memilih, bersama dengan tim kepemimpinan perbankan, menggunakan kasus dengan kompleksitas yang bervariasi dari berbagai divisi pelanggan perbankan. Data kasus penggunaan dikaburkan dan tersedia di bucket data Amazon Simple Storage Service (Amazon S3) lokal di akun pengembangan kasus penggunaan untuk fase pembuktian kemampuan.

Saat migrasi model dari lingkungan pelatihan asli ke arsitektur SageMaker AI selesai, data lake yang dihosting cloud akan membuat data tersedia untuk dibaca oleh model produksi. Prediksi yang dihasilkan oleh model produksi kemudian ditulis kembali ke danau data.

Setelah kasus penggunaan kandidat dimigrasikan, kerangka kerja HTML yang dapat diskalakan mengambil garis dasar awal untuk metrik target. Anda dapat membandingkan baseline dengan pengaturan waktu lokal sebelumnya atau penyedia cloud lainnya sebagai bukti peningkatan waktu yang diaktifkan oleh kerangka kerja MS yang dapat diskalakan.