Menggunakan File Manifes Masukan - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan File Manifes Masukan

Setiap baris dalam file manifes masukan adalah entri yang berisi objek, atau referensi ke objek, untuk diberi label. Entri juga dapat berisi label dari pekerjaan sebelumnya dan untuk beberapa jenis tugas, informasi tambahan.

Data input dan file manifes harus disimpan di Amazon Simple Storage Service (Amazon S3). Masing-masing memiliki persyaratan penyimpanan dan akses khusus, sebagai berikut:

  • Bucket Amazon S3 yang berisi data input harus berada di AWS Wilayah yang sama tempat Anda menjalankan Amazon SageMaker Ground Truth. Anda harus memberi Amazon SageMaker akses ke data yang disimpan di bucket Amazon S3 sehingga dapat membacanya. Untuk informasi selengkapnya tentang bucket Amazon S3, lihat Bekerja dengan bucket Amazon S3.

  • File manifes harus berada di AWS Wilayah yang sama dengan file data, tetapi tidak harus berada di lokasi yang sama dengan file data. Ini dapat disimpan di bucket Amazon S3 apa pun yang dapat diakses oleh peran AWS Identity and Access Management (IAM) yang Anda tetapkan ke Ground Truth saat Anda membuat pekerjaan pelabelan.

catatan

Jenis tugas cloud titik 3D dan bingkai video memiliki persyaratan dan atribut manifes input yang berbeda.

Untuk jenis tugas cloud titik 3D, lihatMembuat File Manifes Input untuk Pekerjaan Pelabelan Cloud Titik 3D.

Untuk jenis tugas bingkai video, lihatBuat File Manifes Masukan Bingkai Video.

Manifes adalah file yang dikodekan UTF-8 di mana setiap baris adalah objek JSON yang lengkap dan valid. Setiap baris dibatasi oleh jeda baris standar,\natau\ r\n. Karena setiap baris harus menjadi objek JSON yang valid, Anda tidak dapat memiliki karakter pemisah baris yang tidak terlolos. Untuk informasi selengkapnya tentang format data, lihat JSON Lines.

Setiap objek JSON dalam file manifes tidak boleh lebih besar dari 100.000 karakter. Tidak ada atribut tunggal dalam suatu objek yang dapat lebih besar dari 20.000 karakter. Nama atribut tidak dapat dimulai dengan $ (tanda dolar).

Setiap objek JSON dalam file manifes harus berisi salah satu kunci berikut: source-ref atausource. Nilai kunci ditafsirkan sebagai berikut:

  • source-ref— Sumber objek adalah objek Amazon S3 yang ditentukan dalam nilai. Gunakan nilai ini ketika objek adalah objek biner, seperti gambar.

  • sourceSumber objek adalah nilai. Gunakan nilai ini ketika objek adalah nilai teks.

Berikut ini adalah contoh file manifes untuk file yang disimpan di bucket Amazon S3:

{"source-ref": "S3 bucket location 1"} {"source-ref": "S3 bucket location 2"} ... {"source-ref": "S3 bucket location n"}

Gunakan source-ref kunci untuk file gambar untuk kotak pembatas, klasifikasi gambar (tunggal dan multi-label), segmentasi semantik, dan klip video untuk pekerjaan pelabelan klasifikasi video. Pekerjaan pelabelan cloud titik 3D dan bingkai video juga menggunakan source-ref kunci tetapi pekerjaan pelabelan ini memerlukan informasi tambahan dalam file manifes input. Untuk informasi lebih lanjut, lihat Data Masukan Awan Titik 3D dan Data Masukan Bingkai Video.

Berikut ini adalah contoh file manifes dengan data input yang disimpan dalam manifes:

{"source": "Lorem ipsum dolor sit amet"} {"source": "consectetur adipiscing elit"} ... {"source": "mollit anim id est laborum"}

Gunakan source kunci untuk klasifikasi teks tunggal dan multi-label dan pekerjaan pelabelan pengenalan entitas bernama.

Anda dapat menyertakan pasangan kunci-nilai lainnya dalam file manifes. Pasangan ini diteruskan ke file output tidak berubah. Ini berguna ketika Anda ingin menyampaikan informasi di antara aplikasi Anda. Untuk informasi selengkapnya, lihat Data Keluaran.