Daftar pekerjaan inferensi batch - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Daftar pekerjaan inferensi batch

catatan

Inferensi Batch dalam pratinjau dan dapat berubah sewaktu-waktu. Inferensi Batch saat ini hanya tersedia melalui API. Akses API batch melalui SDK berikut.

Kami menyarankan Anda membuat lingkungan virtual untuk menggunakan SDK. Karena API inferensi batch tidak tersedia di SDK terbaru, sebaiknya hapus instalan SDK versi terbaru dari lingkungan virtual sebelum menginstal versi dengan API inferensi batch. Untuk contoh yang dipandu, lihatSampel Kode.

Request format
GET /model-invocation-jobs?maxResults=maxResults&nameContains=nameContains&nextToken=nextToken&sortBy=sortBy&sortOrder=sortOrder&statusEquals=statusEquals&submitTimeAfter=submitTimeAfter&submitTimeBefore=submitTimeBefore HTTP/1.1
Response format
HTTP/1.1 200 Content-type: application/json { "invocationJobSummaries": [ { "clientRequestToken": "string", "endTime": "string", "inputDataConfig": { "s3InputDataConfig": { "s3Uri": "string", "s3InputFormat": "JSONL" } }, "jobArn": "string", "jobName": "string", "lastModifiedTime": "string", "message": "string", "modelId": "string", "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "string" } }, "roleArn": "string", "status": "Submitted | InProgress | Completed | Failed | Stopping | Stopped", "submitTime": "string" } ], "nextToken": "string" }

Untuk mendapatkan informasi tentang pekerjaan inferensi batch, kirim file. ListModelInvocationJobs Anda dapat mengatur spesifikasi berikut.

  • Filter untuk hasil dengan menentukan status, waktu pengiriman, atau substring atas nama pekerjaan. Anda dapat menentukan status berikut.

    • Submitted

    • InProgress

    • Completed

    • Failed

    • Stopping

    • Stopped

  • Urutkan berdasarkan waktu pekerjaan itu dibuat (CreationTime). Anda dapat mengurutkan Ascending atau Descending memesan.

  • Jumlah maksimum hasil yang akan dikembalikan sebagai respons. Jika ada lebih banyak hasil daripada nomor yang Anda tetapkan, respons akan mengembalikan permintaan nextToken yang dapat Anda kirim dalam ListModelInvocationJobs permintaan lain untuk melihat kumpulan pekerjaan berikutnya.

Respons mengembalikan daftar InvocationJobSummary objek. Setiap objek berisi informasi tentang pekerjaan inferensi batch.