Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Titik akhir dan kuota Amazon Bedrock
Untuk terhubung secara terprogram ke AWS layanan, Anda menggunakan titik akhir. AWS layanan menawarkan jenis titik akhir berikut di beberapa atau semua AWS Wilayah yang didukung layanan: titik akhir, IPv4 titik akhir tumpukan ganda, dan titik akhir FIPS. Beberapa layanan menyediakan titik akhir global. Untuk informasi selengkapnya, lihat AWS titik akhir layanan.
Kuota layanan, juga disebut sebagai batas, adalah jumlah maksimum sumber daya layanan atau operasi untuk AWS akun Anda. Untuk informasi selengkapnya, lihat AWS kuota layanan.
Berikut ini adalah titik akhir layanan dan kuota layanan untuk layanan ini.
Titik akhir layanan Amazon Bedrock
Pesawat kontrol Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Amazon Bedrock untuk mengelola, melatih, dan menerapkan model. Gunakan titik akhir ini untuk operasi Amazon Bedrock API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
AS Timur (Ohio) | us–east-2 |
bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com |
HTTPS HTTPS |
AS Timur (Virginia Utara) | us-east-1 |
bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com |
HTTPS HTTPS |
AS Barat (California Utara) | us-west-1 |
bedrock.us-west-1.amazonaws.com bedrock-fips.us-west-1.amazonaws.com |
HTTPS HTTPS |
US West (Oregon) | us-west-2 |
bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com |
HTTPS HTTPS |
Asia Pasifik (Hyderabad) | ap-south-2 | bedrock.ap-south-2.amazonaws.com | HTTPS |
Asia Pasifik (Melbourne) | ap-southeast-4 | bedrock.ap-southeast-4.amazonaws.com | HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 | bedrock.ap-south-1.amazonaws.com | HTTPS |
Asia Pasifik (Osaka) | ap-northeast-3 | bedrock.ap-northeast-3.amazonaws.com | HTTPS |
Asia Pasifik (Seoul) | ap-northeast-2 | bedrock.ap-northeast-2.amazonaws.com | HTTPS |
Asia Pasifik (Singapura) | ap-southeast-1 | bedrock.ap-southeast-1.amazonaws.com | HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 | bedrock.ap-southeast-2.amazonaws.com | HTTPS |
Asia Pasifik (Tokyo) | ap-northeast-1 | bedrock.ap-northeast-1.amazonaws.com | HTTPS |
Canada (Central) | ca-central-1 |
bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com |
HTTPS HTTPS |
Eropa (Frankfurt) | eu-central-1 | bedrock.eu-central-1.amazonaws.com | HTTPS |
Eropa (Irlandia) | eu-west-1 | bedrock.eu-west-1.amazonaws.com | HTTPS |
Europe (London) | eu-west-2 | bedrock.eu-west-2.amazonaws.com | HTTPS |
Eropa (Milan) | eu-south-1 | bedrock.eu-south-1.amazonaws.com | HTTPS |
Eropa (Paris) | eu-west-3 | bedrock.eu-west-3.amazonaws.com | HTTPS |
Eropa (Spanyol) | eu-south-2 | bedrock.eu-south-2.amazonaws.com | HTTPS |
Eropa (Stockholm) | eu-north-1 | bedrock.eu-north-1.amazonaws.com | HTTPS |
Eropa (Zürich) | eu-central-2 | bedrock.eu-central-2.amazonaws.com | HTTPS |
Amerika Selatan (Sao Paulo) | sa-east-1 | bedrock.sa-east-1.amazonaws.com | HTTPS |
AWS GovCloud (AS-Timur) | us-gov-east-1 |
bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com |
HTTPS HTTPS |
AWS GovCloud (AS-Barat) | us-gov-west-1 |
bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS |
Waktu proses Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Amazon Bedrock untuk membuat permintaan inferensi untuk model yang dihosting di Amazon Bedrock. Gunakan titik akhir ini untuk operasi Amazon Bedrock Runtime API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
AS Timur (Ohio) | us–east-2 |
bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com |
HTTPS HTTPS |
AS Timur (Virginia Utara) | us-east-1 |
bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com |
HTTPS HTTPS |
US West (Oregon) | us-west-2 |
bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com |
HTTPS HTTPS |
Asia Pasifik (Hyderabad) | ap-south-2 | bedrock-runtime.ap-south-2.amazonaws.com | HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 | bedrock-runtime.ap-south-1.amazonaws.com | HTTPS |
Asia Pasifik (Osaka) | ap-northeast-3 | bedrock-runtime.ap-northeast-3.amazonaws.com | HTTPS |
Asia Pasifik (Seoul) | ap-northeast-2 | bedrock-runtime.ap-northeast-2.amazonaws.com | HTTPS |
Asia Pasifik (Singapura) | ap-southeast-1 | bedrock-runtime.ap-southeast-1.amazonaws.com | HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 | bedrock-runtime.ap-southeast-2.amazonaws.com | HTTPS |
Asia Pacific (Tokyo) | ap-northeast-1 | bedrock-runtime.ap-northeast-1.amazonaws.com | HTTPS |
Canada (Central) | ca-central-1 |
bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com |
HTTPS HTTPS |
Eropa (Frankfurt) | eu-central-1 | bedrock-runtime.eu-central-1.amazonaws.com | HTTPS |
Eropa (Irlandia) | eu-west-1 | bedrock-runtime.eu-west-1.amazonaws.com | HTTPS |
Europe (London) | eu-west-2 | bedrock-runtime.eu-west-2.amazonaws.com | HTTPS |
Eropa (Milan) | eu-south-1 | bedrock-runtime.eu-south-1.amazonaws.com | HTTPS |
Eropa (Paris) | eu-west-3 | bedrock-runtime.eu-west-3.amazonaws.com | HTTPS |
Eropa (Spanyol) | eu-south-2 | bedrock-runtime.eu-south-2.amazonaws.com | HTTPS |
Eropa (Stockholm) | eu-north-1 | bedrock-runtime.eu-north-1.amazonaws.com | HTTPS |
Eropa (Zürich) | eu-central-2 | bedrock-runtime.eu-central-2.amazonaws.com | HTTPS |
Amerika Selatan (Sao Paulo) | sa-east-1 | bedrock-runtime.sa-east-1.amazonaws.com | HTTPS |
AWS GovCloud (AS-Timur) | us-gov-east-1 |
bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com |
HTTPS HTTPS |
AWS GovCloud (AS-Barat) | us-gov-west-1 |
bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS |
Agen untuk waktu pembuatan Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Agen untuk Amazon Bedrock untuk membuat dan mengelola agen dan basis pengetahuan. Gunakan titik akhir ini untuk Agen untuk operasi Amazon Bedrock API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
US East (N. Virginia) | us-east-1 | bedrock-agent.us-east-1.amazonaws.com | HTTPS |
bedrock-agent-fips.us-east-1.amazonaws.com | HTTPS | ||
US West (Oregon) | us-west-2 | bedrock-agent.us-west-2.amazonaws.com | HTTPS |
bedrock-agent-fips.us-west-2.amazonaws.com | HTTPS | ||
Asia Pacific (Singapore) | ap-southeast-1 | bedrock-agent.ap-southeast-1.amazonaws.com | HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 | bedrock-agent.ap-southeast-2.amazonaws.com | HTTPS |
Asia Pacific (Tokyo) | ap-northeast-1 | bedrock-agent.ap-northeast-1.amazonaws.com | HTTPS |
Canada (Central) | ca-central-1 | bedrock-agent.ca-central-1.amazonaws.com | HTTPS |
Europe (Frankfurt) | eu-central-1 | bedrock-agent.eu-central-1.amazonaws.com | HTTPS |
Europe (Ireland) | eu-west-1 | bedrock-agent.eu-west-1.amazonaws.com | HTTPS |
Europe (London) | eu-west-2 | bedrock-agent.eu-west-2.amazonaws.com | HTTPS |
Europe (Paris) | eu-west-3 | bedrock-agent.eu-west-3.amazonaws.com | HTTPS |
Asia Pacific (Mumbai) | ap-south-1 | bedrock-agent.ap-south-1.amazonaws.com | HTTPS |
South America (São Paulo) | sa-east-1 | bedrock-agent.sa-east-1.amazonaws.com | HTTPS |
Agen untuk runtime Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Agen untuk Amazon Bedrock untuk memanggil agen dan menanyakan basis pengetahuan. Gunakan titik akhir ini untuk Agen untuk operasi Amazon Bedrock Runtime API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
US East (N. Virginia) | us-east-1 | bedrock-agent-runtime.us-east-1.amazonaws.com | HTTPS |
bedrock-agent-runtime-fips.us-east-1.amazonaws.com | HTTPS | ||
US West (Oregon) | us-west-2 | bedrock-agent-runtime.us-west-2.amazonaws.com | HTTPS |
bedrock-agent-runtime-fips.us-west-2.amazonaws.com | HTTPS | ||
Asia Pacific (Singapore) | ap-southeast-1 | bedrock-agent-runtime.ap-tenggara 1.amazonaws.com | HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 | bedrock-agent-runtime.ap-tenggara 2.amazonaws.com | HTTPS |
Asia Pacific (Tokyo) | ap-northeast-1 | bedrock-agent-runtime.ap-northeast-1.amazonaws.com | HTTPS |
Canada (Central) | ca-central-1 | bedrock-agent-runtime.ca-central-1.amazonaws.com | HTTPS |
Europe (Frankfurt) | eu-central-1 | bedrock-agent-runtime.eu-central-1.amazonaws.com | HTTPS |
Europe (Paris) | eu-west-3 | bedrock-agent-runtime.eu-west-3.amazonaws.com | HTTPS |
Europe (Ireland) | eu-west-1 | bedrock-agent-runtime.eu-west-1.amazonaws.com | HTTPS |
Europe (London) | eu-west-2 | bedrock-agent-runtime.eu-west-2.amazonaws.com | HTTPS |
Asia Pacific (Mumbai) | ap-south-1 | bedrock-agent-runtime.ap-selatan-1.amazonaws.com | HTTPS |
South America (São Paulo) | sa-east-1 | bedrock-agent-runtime.sa-timur-1.amazonaws.com | HTTPS |
Otomatisasi Data Batuan Dasar Amazon APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung oleh Otomasi Data untuk Amazon Bedrock. Titik akhir yang menggunakan kata runtime
memanggil cetak biru dan proyek untuk mengekstrak informasi dari file. Gunakan titik akhir ini untuk operasi Amazon Bedrock Data Automation Runtime API. Titik akhir tanpa runtime
digunakan untuk membuat cetak biru dan proyek untuk memberikan panduan ekstraksi. Gunakan titik akhir ini untuk operasi Buildtime API Otomasi Data Amazon Bedrock
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
US East (N. Virginia) | us-east-1 |
bedrock-data-automation.us-east-1.amazonaws.com bedrock-data-automation-runtime.us-east-1.api.aws bedrock-data-automation-runtime.us-east-1.amazonaws.com bedrock-data-automation.us-east-1.api.aws bedrock-data-automation-fips.us-east-1.amazonaws.com bedrock-data-automation-runtime-fips.us-east-1.api.aws bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com bedrock-data-automation-fips.us-east-1.api.aws |
HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS |
US West (Oregon) | us-west-2 |
bedrock-data-automation.us-west-2.amazonaws.com bedrock-data-automation-runtime.us-west-2.api.aws bedrock-data-automation-runtime.us-west-2.amazonaws.com bedrock-data-automation.us-west-2.api.aws bedrock-data-automation-fips.us-west-2.amazonaws.com bedrock-data-automation-runtime-fips.us-west-2.api.aws bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com bedrock-data-automation-fips.us-west-2.api.aws |
HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 |
bedrock-data-automation.ap-south-1.amazonaws.com bedrock-data-automation-runtime.ap-south-1.amazonaws.com |
HTTPS HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 |
bedrock-data-automation.ap-southeast-2.amazonaws.com bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com |
HTTPS HTTPS |
Eropa (Frankfurt) | eu-central-1 |
bedrock-data-automation.eu-central-1.amazonaws.com bedrock-data-automation-runtime.eu-central-1.amazonaws.com |
HTTPS HTTPS |
Eropa (Irlandia) | eu-west-1 |
bedrock-data-automation.eu-west-1.amazonaws.com bedrock-data-automation-runtime.eu-west-1.amazonaws.com |
HTTPS HTTPS |
Europe (London) | eu-west-2 |
bedrock-data-automation.eu-west-2.amazonaws.com bedrock-data-automation-runtime.eu-west-2.amazonaws.com |
HTTPS HTTPS |
Kuota layanan Amazon Bedrock
Tip
Karena Amazon Bedrock memiliki sejumlah besar kuota, kami sarankan Anda melihat kuota layanan menggunakan konsol alih-alih menggunakan tabel di bawah ini. Buka kuota Amazon Bedrock
Nama | Default | Dapat disesuaikan | Deskripsi |
---|---|---|---|
(Penalaran Otomatis) Anotasi dalam kebijakan | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum anotasi dalam kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) CancelAutomatedReasoningPolicyBuildWorkflow permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan CancelAutomatedReasoningPolicyBuildWorkflow API per detik. |
(Penalaran Otomatis) Build bersamaan per kebijakan | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum build bersamaan per kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) Pembuatan kebijakan bersamaan per akun | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum kebijakan Penalaran Otomatis bersamaan dibuat dalam satu akun. |
(Penalaran Otomatis) CreateAutomatedReasoningPolicy permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan CreateAutomatedReasoningPolicy API per detik. |
(Penalaran Otomatis) CreateAutomatedReasoningPolicyTestCase permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan CreateAutomatedReasoningPolicyTestCase API per detik. |
(Penalaran Otomatis) CreateAutomatedReasoningPolicyVersion permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan CreateAutomatedReasoningPolicyVersion API per detik. |
(Penalaran Otomatis) DeleteAutomatedReasoningPolicy permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan DeleteAutomatedReasoningPolicy API per detik. |
(Penalaran Otomatis) DeleteAutomatedReasoningPolicyBuildWorkflow permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan DeleteAutomatedReasoningPolicyBuildWorkflow API per detik. |
(Penalaran Otomatis) DeleteAutomatedReasoningPolicyTestCase permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan DeleteAutomatedReasoningPolicyTestCase API per detik. |
(Penalaran Otomatis) ExportAutomatedReasoningPolicyVersion permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan ExportAutomatedReasoningPolicyVersion API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicy permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicy API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicyAnnotations permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicyAnnotations API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicyBuildWorkflow permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicyBuildWorkflow API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicyBuildWorkflowResultAssets permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicyBuildWorkflowResultAssets API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicyNextScenario permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicyNextScenario API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicyTestCase permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicyTestCase API per detik. |
(Penalaran Otomatis) GetAutomatedReasoningPolicyTestResult permintaan per detik | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum permintaan GetAutomatedReasoningPolicyTestResult API per detik. |
(Penalaran Otomatis) ListAutomatedReasoningPolicies permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan ListAutomatedReasoningPolicies API per detik. |
(Penalaran Otomatis) ListAutomatedReasoningPolicyBuildWorkflows permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan ListAutomatedReasoningPolicyBuildWorkflows API per detik. |
(Penalaran Otomatis) ListAutomatedReasoningPolicyTestCases permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan ListAutomatedReasoningPolicyTestCases API per detik. |
(Penalaran Otomatis) ListAutomatedReasoningPolicyTestResults permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan ListAutomatedReasoningPolicyTestResults API per detik. |
(Penalaran Otomatis) Kebijakan per akun | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kebijakan Penalaran Otomatis dalam satu akun. |
(Penalaran Otomatis) Aturan dalam kebijakan | Setiap Wilayah yang didukung: 500 | Tidak | Jumlah maksimum aturan dalam kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) Karakter dokumen sumber | Setiap Wilayah yang didukung: 122,880 | Tidak | Jumlah maksimum karakter dalam dokumen sumber untuk membuat kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) Ukuran dokumen sumber (MB) | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran dokumen sumber maksimum (MB) untuk membuat kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) StartAutomatedReasoningPolicyBuildWorkflow permintaan per detik | Setiap Wilayah yang didukung: 1 | Ya |
Jumlah maksimum permintaan StartAutomatedReasoningPolicyBuildWorkflow API per detik. |
(Penalaran Otomatis) StartAutomatedReasoningPolicyTestWorkflow permintaan per detik | Setiap Wilayah yang didukung: 1 | Ya |
Jumlah maksimum permintaan StartAutomatedReasoningPolicyTestWorkflow API per detik. |
(Penalaran Otomatis) Tes per kebijakan | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum tes per kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) Jenis per kebijakan | Setiap Wilayah yang didukung: 50 | Tidak | Jumlah maksimum jenis dalam kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) UpdateAutomatedReasoningPolicy permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan UpdateAutomatedReasoningPolicy API per detik. |
(Penalaran Otomatis) UpdateAutomatedReasoningPolicyAnnotations permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan UpdateAutomatedReasoningPolicyAnnotations API per detik. |
(Penalaran Otomatis) UpdateAutomatedReasoningPolicyTestCase permintaan per detik | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum permintaan UpdateAutomatedReasoningPolicyTestCase API per detik. |
(Penalaran Otomatis) Nilai per jenis dalam kebijakan | Setiap Wilayah yang didukung: 50 | Tidak | Jumlah maksimum nilai per jenis dalam kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) Variabel dalam kebijakan | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum variabel dalam kebijakan Penalaran Otomatis. |
(Penalaran Otomatis) Versi per kebijakan | Setiap Wilayah yang didukung: 1.000 | Tidak | Jumlah maksimum versi per kebijakan Penalaran Otomatis. |
(Otomatisasi Data) (Konsol) Ukuran file dokumen maksimum (MB) | Setiap Wilayah yang didukung: 200 | Tidak | Ukuran file maksimum untuk konsol |
(Otomatisasi Data) (Konsol) Jumlah halaman maksimum per file dokumen | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum halaman per dokumen di konsol |
(Otomatisasi Data) CreateBlueprint - Jumlah cetak biru maksimum per akun | Setiap Wilayah yang didukung: 350 | Ya |
Jumlah maksimum cetak biru per akun |
(Otomatisasi Data) CreateBlueprintVersion - Jumlah maksimum versi Blueprint per Blueprint | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum versi per cetak biru |
(Otomatisasi Data) Panjang deskripsi untuk bidang (Karakter) | Setiap Wilayah yang didukung: 300 | Tidak | Panjang maksimum deskripsi untuk bidang dalam karakter |
(Otomasi Data) InvokeDataAutomationAsync - Audio - Jumlah maksimum pekerjaan bersamaan |
us-east-1:20 us-west-2:20 Masing-masing Wilayah yang didukung lainnya: 2 |
Ya |
Jumlah maksimum Invoke Data Automation Async membuka pekerjaan untuk audio |
(Otomasi Data) InvokeDataAutomationAsync - Dokumen - Jumlah maksimum pekerjaan bersamaan |
us-east-1:25 us-west-2:25 Masing-masing Wilayah yang didukung lainnya: 5 |
Ya |
Jumlah maksimum Invoke Data Automation Async membuka pekerjaan untuk dokumen |
(Otomasi Data) InvokeDataAutomationAsync - Gambar - Jumlah maksimum pekerjaan bersamaan |
us-east-1:20 us-west-2:20 Masing-masing Wilayah yang didukung lainnya: 5 |
Ya |
Jumlah maksimum Invoke Data Automation Async membuka lowongan kerja untuk gambar |
(Otomatisasi Data) InvokeDataAutomationAsync - Jumlah maksimum pekerjaan terbuka | Setiap Wilayah yang didukung: 1.800 | Tidak | Jumlah maksimum Invoke Data Automation Async membuka lowongan kerja untuk gambar |
(Otomatisasi Data) InvokeDataAutomationAsync - Video - Jumlah maksimum pekerjaan bersamaan |
us-east-1:20 us-west-2:20 Masing-masing Wilayah yang didukung lainnya: 3 |
Ya |
Jumlah maksimum Invoke Data Automation Async membuka lowongan kerja untuk video |
(Otomatisasi Data) Kecepatan Sampel Audio Maksimum (Hz) | Setiap Wilayah yang didukung: 48.000 | Tidak | Tingkat sampel audio maksimum |
(Otomatisasi Data) Cetak Biru Maksimum per Proyek (Audio) | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum cetak biru per proyek untuk audio |
(Otomatisasi Data) Cetak Biru Maksimum per Proyek (Dokumen) | Setiap Wilayah yang didukung: 40 | Tidak | Jumlah maksimum cetak biru per proyek untuk dokumen |
(Otomatisasi Data) Cetak Biru Maksimum per Proyek (Gambar) | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum cetak biru per proyek untuk gambar |
(Otomatisasi Data) Cetak Biru Maksimum per Proyek (Video) | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum cetak biru per proyek untuk video |
(Otomatisasi Data) Ukuran Cetak Biru JSON Maksimum (Karakter) | Setiap Wilayah yang didukung: 100.000 | Tidak | Ukuran maksimum JSON dalam Karakter |
(Otomasi Data) Tingkat Maksimum Hierarki Lapangan | Setiap Wilayah yang didukung: 1 | Tidak | Tingkat jumlah maksimum hierarki bidang |
(Otomatisasi Data) Jumlah maksimum halaman per dokumen | Setiap Wilayah yang didukung: 3.000 | Tidak | Jumlah maksimum halaman per dokumen |
(Otomatisasi Data) Resolusi Maksimum | Setiap Wilayah yang didukung: 8.000 | Tidak | Resolusi maksimum untuk Gambar |
(Otomatisasi Data) Ukuran file audio maksimum (MB) | Setiap Wilayah yang didukung: 2,048 | Tidak | Ukuran file maksimum untuk Audio |
(Otomatisasi Data) Panjang audio maksimum (Menit) | Setiap Wilayah yang didukung: 240 | Tidak | Panjang maksimum untuk audio dalam hitungan menit |
(Otomatisasi Data) Ukuran file dokumen maksimum (MB) | Setiap Wilayah yang didukung: 500 | Tidak | Ukuran file maksimum |
(Otomatisasi Data) Ukuran file gambar maksimum (MB) | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran file maksimum untuk Gambar |
(Otomatisasi Data) Jumlah maksimum Cetak Biru per permintaan Inferensi Mulai (Audio) | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum cetak biru inline dalam permintaan inferensi Mulai |
(Otomatisasi Data) Jumlah maksimum Cetak Biru per permintaan Inferensi Mulai (Dokumen) | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum cetak biru inline dalam permintaan inferensi Mulai |
(Otomatisasi Data) Jumlah maksimum Cetak Biru per permintaan Inferensi Mulai (Gambar) | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum cetak biru inline dalam permintaan inferensi Mulai |
(Otomatisasi Data) Jumlah maksimum Cetak Biru per permintaan Inferensi Mulai (Video) | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum cetak biru inline dalam permintaan inferensi Mulai |
(Otomatisasi Data) Jumlah maksimum kolom daftar per Blueprint | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum kolom daftar per Blueprint |
(Otomatisasi Data) Ukuran file video maksimum (MB) | Setiap Wilayah yang didukung: 10.240 | Tidak | Ukuran file maksimum untuk Video |
(Otomatisasi Data) Panjang video maksimum (Menit) | Setiap Wilayah yang didukung: 240 | Tidak | Panjang maksimum untuk video dalam hitungan menit |
(Otomatisasi Data) Tingkat Sampel Audio Minimum (Hz) | Setiap Wilayah yang didukung: 8.000 | Tidak | Tingkat sampel audio minimum |
(Otomatisasi Data) Panjang audio minimum (Milidetik) | Setiap Wilayah yang didukung: 500 | Tidak | Panjang minimum untuk audio dalam milidetik |
(Evaluasi) Jumlah pekerjaan evaluasi model otomatis bersamaan | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum pekerjaan evaluasi model otomatis yang dapat Anda tentukan sekaligus di akun ini di Wilayah saat ini. |
(Evaluasi) Jumlah pekerjaan evaluasi model bersamaan yang menggunakan pekerja manusia | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum pekerjaan evaluasi model yang menggunakan pekerja manusia dapat Anda tentukan pada satu waktu di akun ini di Wilayah saat ini. |
(Evaluasi) Jumlah metrik khusus | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum metrik kustom yang dapat Anda tentukan dalam pekerjaan evaluasi model yang menggunakan pekerja manusia. |
(Evaluasi) Jumlah kumpulan data prompt khusus dalam pekerjaan evaluasi model berbasis manusia | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum kumpulan data prompt kustom yang dapat Anda tentukan dalam pekerjaan evaluasi model berbasis manusia di akun ini di Wilayah saat ini. |
(Evaluasi) Jumlah dataset per pekerjaan | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum kumpulan data yang dapat Anda tentukan dalam pekerjaan evaluasi model otomatis. Ini termasuk kumpulan data prompt khusus dan bawaan. |
(Evaluasi) Jumlah pekerjaan evaluasi | Setiap Wilayah yang didukung: 5.000 | Tidak | Jumlah maksimum pekerjaan evaluasi model yang dapat Anda buat di akun ini di Wilayah saat ini. |
(Evaluasi) Jumlah metrik per kumpulan data | Setiap Wilayah yang didukung: 3 | Tidak | Jumlah maksimum metrik yang dapat Anda tentukan per kumpulan data dalam pekerjaan evaluasi model otomatis. Ini termasuk metrik khusus dan bawaan. |
(Evaluasi) Jumlah model dalam pekerjaan evaluasi model yang menggunakan pekerja manusia | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum model yang dapat Anda tentukan dalam pekerjaan evaluasi model yang menggunakan pekerja manusia. |
(Evaluasi) Jumlah model dalam pekerjaan evaluasi model otomatis | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum model yang dapat Anda tentukan dalam pekerjaan evaluasi model otomatis. |
(Evaluasi) Jumlah permintaan dalam kumpulan data prompt khusus | Setiap Wilayah yang didukung: 1.000 | Tidak | Jumlah maksimum permintaan yang dapat berisi kumpulan data prompt kustom. |
(Evaluasi) Ukuran prompt | Setiap Wilayah yang didukung: 4 | Tidak | Ukuran maksimum (dalam KB) dari prompt individu dalam kumpulan data prompt khusus. |
(Evaluasi) Waktu tugas untuk pekerja | Setiap Wilayah yang didukung: 30 | Tidak | Panjang maksimum (dalam hari) waktu yang dimiliki seorang pekerja untuk menyelesaikan tugas. |
(Aliran) Node agen per aliran | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum node agen. |
(Aliran) Node kolektor per aliran | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum node kolektor. |
(Aliran) Kondisi node per aliran | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum node kondisi. |
(Arus) Kondisi per kondisi node | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum kondisi per node kondisi. |
(Mengalir) CreateFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateFlow permintaan per detik. |
(Mengalir) CreateFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateFlowAlias permintaan per detik. |
(Mengalir) CreateFlowVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateFlowVersion permintaan per detik. |
(Mengalir) DeleteFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteFlow permintaan per detik. |
(Mengalir) DeleteFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteFlowAlias permintaan per detik. |
(Mengalir) DeleteFlowVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteFlowVersion permintaan per detik. |
(Alias) Alias aliran per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum alias aliran. |
(Arus) Eksekusi aliran per akun | Setiap Wilayah yang didukung: 1.000 | Ya |
Jumlah maksimum eksekusi aliran per akun. |
(Aliran) Versi aliran per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum versi aliran. |
(Arus) Arus per akun | Setiap Wilayah yang didukung: 100 | Ya |
Jumlah maksimum arus per akun. |
(Mengalir) GetFlow permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetFlow permintaan per detik. |
(Mengalir) GetFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetFlowAlias permintaan per detik. |
(Mengalir) GetFlowVersion permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetFlowVersion permintaan per detik. |
(Aliran) Node kode sebaris per aliran | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum node kode inline per aliran. |
(Aliran) Node masukan per aliran | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum node input aliran. |
(Aliran) Node iterator per aliran | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum node iterator. |
(Arus) Node dasar pengetahuan per aliran | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum node basis pengetahuan. |
(Aliran) Node fungsi Lambda per aliran | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum node fungsi Lambda. |
(Aliran) Lex node per aliran | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum node Lex. |
(Mengalir) ListFlowAliases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListFlowAliases permintaan per detik. |
(Mengalir) ListFlowVersions permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListFlowVersions permintaan per detik. |
(Mengalir) ListFlows permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListFlows permintaan per detik. |
(Aliran) Node keluaran per aliran | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum node output aliran. |
(Mengalir) PrepareFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum PrepareFlow permintaan per detik. |
(Aliran) Node prompt per aliran | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum node prompt. |
(Aliran) Node pengambilan S3 per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node pengambilan S3. |
(Aliran) Node penyimpanan S3 per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node penyimpanan S3. |
(Aliran) Total node per aliran | Setiap Wilayah yang didukung: 40 | Tidak | Jumlah maksimum node dalam aliran. |
(Mengalir) UpdateFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateFlow permintaan per detik. |
(Mengalir) UpdateFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateFlowAlias permintaan per detik. |
(Mengalir) ValidateFlowDefinition permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum ValidateFlowDefinition permintaan per detik. |
(Pagar pembatas) Kebijakan Penalaran Otomatis per pagar pembatas | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum kebijakan Penalaran Otomatis per pagar pembatas. |
(Pagar pembatas) Panjang kueri pentanahan kontekstual dalam satuan teks | Setiap Wilayah yang didukung: 1 | Tidak | Panjang maksimum, dalam satuan teks, dari kueri untuk landasan kontekstual |
(Pagar pembatas) Panjang respons landasan kontekstual dalam satuan teks | Setiap Wilayah yang didukung: 5 | Tidak | Panjang maksimum, dalam satuan teks, dari respons untuk landasan kontekstual |
(Pagar pembatas) Panjang sumber pentanahan kontekstual dalam satuan teks |
us-east-1:100 us-west-2:100 Masing-masing Wilayah yang didukung lainnya: 50 |
Tidak | Panjang maksimum, dalam satuan teks, dari sumber grounding untuk grounding kontekstual |
(Pagar pembatas) Contoh frasa per Topik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum contoh topik yang dapat dimasukkan per topik |
(Pagar pembatas) Pagar per akun | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum pagar pembatas dalam akun |
(Pagar pembatas) Unit teks kebijakan filter ApplyGuardrail konten sesuai permintaan per detik |
us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Konten per detik |
(Pagar pembatas) Unit teks kebijakan filter ApplyGuardrail konten sesuai permintaan per detik (standar) |
us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Konten per detik. Ini berlaku untuk model kebijakan konten standar. |
(Pagar pembatas) Unit teks kebijakan topik yang ApplyGuardrail ditolak sesuai permintaan per detik |
us-east-1:50 us-west-2:50 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan topik Ditolak per detik |
(Pagar pembatas) Unit teks kebijakan topik yang ApplyGuardrail ditolak sesuai permintaan per detik (standar) |
us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan topik Ditolak per detik. Ini berlaku untuk model kebijakan topik standar. |
(Pagar pembatas) Sesuai permintaan Unit teks kebijakan filter informasi ApplyGuardrail sensitif tingkat ledakan |
us-east-1:400 Masing-masing Wilayah yang didukung lainnya: 25 |
Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter informasi sensitif dalam satu ledakan. |
(Pagar pembatas) Unit teks kebijakan filter informasi ApplyGuardrail sensitif sesuai permintaan per detik |
us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter informasi sensitif per detik |
(Pagar pembatas) Tingkat ledakan unit teks kebijakan filter ApplyGuardrail Word sesuai permintaan |
us-east-1:400 Masing-masing Wilayah yang didukung lainnya: 25 |
Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Word dalam satu burst. |
(Pagar pembatas) Unit teks kebijakan filter ApplyGuardrail Word sesuai permintaan per detik |
us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Word per detik |
(Pagar pembatas) Tingkat ledakan unit teks kebijakan ApplyGuardrail landasan kontekstual sesuai permintaan | Setiap Wilayah yang didukung: 106 | Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan grounding kontekstual dalam satu ledakan. |
(Pagar pembatas) Unit teks kebijakan landasan ApplyGuardrail kontekstual sesuai permintaan per detik | Setiap Wilayah yang didukung: 106 | Ya |
Jumlah maksimum unit teks yang dapat diproses untuk kebijakan grounding kontekstual per detik |
(Pagar pembatas) Permintaan sesuai permintaan per detik ApplyGuardrail |
us-east-1:50 us-west-2:50 Masing-masing Wilayah yang didukung lainnya: 25 |
Ya |
Jumlah maksimum panggilan ApplyGuardrail API yang diizinkan per detik |
(Pagar pembatas) Entitas Regex di Filter Informasi Sensitif | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum regex filter pagar pembatas yang dapat dimasukkan dalam kebijakan informasi sensitif |
(Pagar pembatas) Panjang regex dalam karakter | Setiap Wilayah yang didukung: 500 | Tidak | Panjang maksimum, dalam karakter, dari filter pagar pembatas regex |
(Pagar pembatas) Topik per pagar pembatas | Setiap Wilayah yang didukung: 30 | Tidak | Jumlah maksimum topik yang dapat didefinisikan di seluruh kebijakan topik pagar pembatas |
(Pagar pembatas) Versi per pagar pembatas | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum versi yang dapat dimiliki pagar pembatas |
(Pagar pembatas) Panjang kata dalam karakter | Setiap Wilayah yang didukung: 100 | Tidak | Panjang maksimum kata, dalam karakter, dalam daftar kata yang diblokir |
(Pagar pembatas) Kebijakan kata per kata | Setiap Wilayah yang didukung: 10.000 | Tidak | Jumlah maksimum kata yang dapat dimasukkan dalam daftar kata yang diblokir |
(Basis Pengetahuan) Bersamaan IngestKnowledgeBaseDocuments dan DeleteKnowledgeBaseDocuments permintaan per akun | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum IngestKnowledgeBaseDocuments dan DeleteKnowledgeBaseDocuments permintaan yang dapat berjalan pada saat yang sama di akun. |
(Basis Pengetahuan) Pekerjaan konsumsi bersamaan per akun | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama di akun. |
(Basis Pengetahuan) Pekerjaan konsumsi bersamaan per sumber data | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama untuk sumber data. |
(Basis Pengetahuan) Pekerjaan konsumsi bersamaan per basis pengetahuan | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama untuk basis pengetahuan. |
(Basis Pengetahuan) CreateDataSource permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan CreateDataSource API per detik. |
(Basis Pengetahuan) CreateKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan CreateKnowledgeBase API per detik. |
(Basis Pengetahuan) Sumber data per basis pengetahuan | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum sumber data per basis pengetahuan. |
(Basis Pengetahuan) DeleteDataSource permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan DeleteDataSource API per detik. |
(Basis Pengetahuan) DeleteKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan DeleteKnowledgeBase API per detik. |
(Basis Pengetahuan) DeleteKnowledgeBaseDocuments permintaan per detik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum permintaan DeleteKnowledgeBaseDocuments API per detik. |
(Basis Pengetahuan) File untuk ditambahkan atau diperbarui per pekerjaan konsumsi | Setiap Wilayah yang didukung: 5.000.000 | Tidak | Jumlah maksimum file baru dan yang diperbarui yang dapat dicerna per pekerjaan konsumsi. |
(Basis Pengetahuan) File yang akan dihapus per pekerjaan konsumsi | Setiap Wilayah yang didukung: 5.000.000 | Tidak | Jumlah maksimum file yang dapat dihapus per pekerjaan konsumsi. |
(Basis Pengetahuan) File untuk dicerna per IngestKnowledgeBaseDocuments pekerjaan. | Setiap Wilayah yang didukung: 25 | Tidak | Jumlah maksimum dokumen yang dapat dicerna per IngestKnowledgeBaseDocuments permintaan. |
(Basis Pengetahuan) GenerateQuery permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan GenerateQuery API per detik. |
(Basis Pengetahuan) GetDataSource permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan GetDataSource API per detik. |
(Basis Pengetahuan) GetIngestionJob permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan GetIngestionJob API per detik. |
(Basis Pengetahuan) GetKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan GetKnowledgeBase API per detik. |
(Basis Pengetahuan) GetKnowledgeBaseDocuments permintaan per detik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum permintaan GetKnowledgeBaseDocuments API per detik. |
(Basis Pengetahuan) IngestKnowledgeBaseDocuments permintaan per detik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum permintaan IngestKnowledgeBaseDocuments API per detik. |
(Basis Pengetahuan) IngestKnowledgeBaseDocuments ukuran muatan total | Setiap Wilayah yang didukung: 6 | Tidak | Ukuran maksimum (dalam MB) dari total muatan dalam IngestKnowledgeBaseDocuments permintaan. |
(Basis Pengetahuan) Ukuran file pekerjaan menelan | Setiap Wilayah yang didukung: 50 | Tidak | Ukuran maksimum (dalam MB) file dalam pekerjaan konsumsi. |
(Basis Pengetahuan) Ukuran pekerjaan konsumsi | Setiap Wilayah yang didukung: 100 | Tidak | Ukuran maksimum (dalam GB) dari pekerjaan konsumsi. |
(Basis Pengetahuan) Basis pengetahuan per akun | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum basis pengetahuan per akun. |
(Basis Pengetahuan) ListDataSources permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListDataSources API per detik. |
(Basis Pengetahuan) ListIngestionJobs permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListIngestionJobs API per detik. |
(Basis Pengetahuan) ListKnowledgeBaseDocuments permintaan per detik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum permintaan ListKnowledgeBaseDocuments API per detik. |
(Basis Pengetahuan) ListKnowledgeBases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListKnowledgeBases API per detik. |
(Basis Pengetahuan) Jumlah maksimum file untuk parser BDA | Setiap Wilayah yang didukung: 1.000 | Tidak | Jumlah maksimum file yang dapat digunakan dengan Amazon Bedrock Data Automation sebagai parser. |
(Basis Pengetahuan) Jumlah maksimum file untuk Model Foundation sebagai parser | Setiap Wilayah yang didukung: 1.000 | Tidak | Jumlah maksimum file yang dapat digunakan dengan Foundation Models sebagai parser. |
(Basis Pengetahuan) Permintaan Rerank per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan API Rerank per detik. |
(Basis Pengetahuan) Ambil permintaan per detik | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum permintaan Retrieve API per detik. |
(Basis Pengetahuan) RetrieveAndGenerate permintaan per detik | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum permintaan RetrieveAndGenerate API per detik. |
(Basis Pengetahuan) RetrieveAndGenerateStream permintaan per detik | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum permintaan RetrieveAndGenerateStream API per detik. |
(Basis Pengetahuan) StartIngestionJob permintaan per detik | Setiap Wilayah yang didukung: 0.1 | Tidak | Jumlah maksimum permintaan StartIngestionJob API per detik. |
(Basis Pengetahuan) UpdateDataSource permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan UpdateDataSource API per detik. |
(Basis Pengetahuan) UpdateKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan UpdateKnowledgeBase API per detik. |
(Basis Pengetahuan) Ukuran kueri pengguna | Setiap Wilayah yang didukung: 1.000 | Tidak | Ukuran maksimum (dalam karakter) dari kueri pengguna. |
(Kustomisasi model) Model khusus per akun | Setiap Wilayah yang didukung: 100 | Ya |
Jumlah maksimum model kustom dalam akun. |
(Kustomisasi model) Penerapan model kustom yang sedang berlangsung | Setiap Wilayah yang didukung: 2 | Ya |
Jumlah maksimum penerapan model kustom yang sedang berlangsung |
(Kustomisasi model) Ukuran file input maksimum untuk pekerjaan kustomisasi distilasi | Setiap Wilayah yang didukung: 2 Gigabytes | Tidak | Ukuran file input maksimum untuk pekerjaan kustomisasi distilasi. |
(Kustomisasi model) Panjang baris maksimum untuk pekerjaan kustomisasi distilasi | Setiap Wilayah yang didukung: 16 Kilobyte | Tidak | Panjang baris maksimum dalam file input untuk pekerjaan kustomisasi distilasi. |
(Kustomisasi model) Jumlah maksimum permintaan untuk pekerjaan kustomisasi distilasi | Setiap Wilayah yang didukung: 15.000 | Tidak | Jumlah maksimum permintaan yang diperlukan untuk pekerjaan kustomisasi distilasi. |
(Kustomisasi model) Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova Micro V1 | Setiap Wilayah yang didukung: 32.000 | Tidak | Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova Micro V1. |
(Kustomisasi model) Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova V1 | Setiap Wilayah yang didukung: 32.000 | Tidak | Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova V1. |
(Kustomisasi model) Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Anthropic Claude 3 haiku 20240307 V1 | Setiap Wilayah yang didukung: 32.000 | Tidak | Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Anthropic Claude 3 haiku 20240307 V1. |
(Kustomisasi model) Panjang konteks fine tuning model siswa maksimum untuk Llama 3.1 70B Instruksikan pekerjaan kustomisasi distilasi V1 | Setiap Wilayah yang didukung: 16.000 | Tidak | Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Llama 3.1 70B Instruct V1. |
(Kustomisasi model) Panjang konteks fine tuning model siswa maksimum untuk Llama 3.1 8B Instruksikan pekerjaan kustomisasi distilasi V1 | Setiap Wilayah yang didukung: 32.000 | Tidak | Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Llama 3.1 8B Instruct V1. |
(Kustomisasi model) Jumlah minimum permintaan untuk pekerjaan kustomisasi distilasi | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum permintaan yang diperlukan untuk pekerjaan kustomisasi distilasi. |
(Kustomisasi model) Pekerjaan kustomisasi terjadwal | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum pekerjaan kustomisasi terjadwal. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Amazon Nova Lite | Setiap Wilayah yang didukung: 20.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Amazon Nova Lite. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Amazon Nova Micro | Setiap Wilayah yang didukung: 20.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Amazon Nova Micro. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Amazon Nova Pro | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Amazon Nova Pro. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Claude 3 Haiku v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Claude 3 Haiku. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Claude 3-5-Haiku v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Claude 3-5-Haiku. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Meta Llama 2 13B v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Meta Llama 2 13B. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Meta Llama 2 70B v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Meta Llama 2 70B. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.1 70B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.1 70B Instruct Fine-tuning. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.1 8B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.1 8B Instruct Fine-tuning. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.2 11B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Meta Llama 3.2 11B Instruct Fine-tuning. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.2 1B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.2 1B Instruct Fine-tuning. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.2 3B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.2 3B Instruct Fine-tuning. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.2 90B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.2 90B Instruct Fine-tuning. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Image Generator G1 V1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Generator Gambar Titan. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Image Generator G1 V2 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Fine-tuning Titan Image Generator V2. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Multimodal Embeddings G1 v1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Multimodal Embeddings. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk Titan Text G1 - Express v1 Lanjutan pekerjaan Pra-Pelatihan | Setiap Wilayah yang didukung: 100.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Pra-Pelatihan Lanjutan Titan Text Express. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Express v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Express. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Titan Text G1 - Lite v1 Lanjutan Pra-Pelatihan | Setiap Wilayah yang didukung: 100.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Pra-Pelatihan Lanjutan Titan Text Lite. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Lite v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Lite. |
(Kustomisasi model) Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Premier v1 | Setiap Wilayah yang didukung: 20.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Premier. |
(Kustomisasi model) Jumlah total penerapan model kustom | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah total penerapan model kustom |
(Manajemen cepat) CreatePrompt permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreatePrompt permintaan per detik. |
(Manajemen cepat) CreatePromptVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreatePromptVersion permintaan per detik. |
(Manajemen cepat) DeletePrompt permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeletePrompt permintaan per detik. |
(Manajemen cepat) GetPrompt permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetPrompt permintaan per detik. |
(Manajemen cepat) ListPrompts permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListPrompts permintaan per detik. |
(Manajemen cepat) Prompt per akun | Setiap Wilayah yang didukung: 500 | Ya |
Jumlah maksimum petunjuk. |
(Manajemen cepat) UpdatePrompt permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdatePrompt permintaan per detik. |
(Manajemen cepat) Versi per prompt | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum versi per prompt. |
APIs per Agen | Setiap Wilayah yang didukung: 11 | Ya |
Jumlah maksimum APIs yang dapat Anda tambahkan ke Agen. |
Kelompok aksi per Agen | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum grup aksi yang dapat Anda tambahkan ke Agen. |
Agen Kolaborator untuk Agen | Setiap Wilayah yang didukung: 1.000 | Ya |
Jumlah maksimum agen kolaborator yang dapat Anda tambahkan ke Agen. |
Agen per akun | Setiap Wilayah yang didukung: 1.000 | Ya |
Jumlah maksimum Agen dalam satu akun. |
AssociateAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 6 | Tidak | Jumlah maksimum permintaan AssociateAgentKnowledgeBase API per detik. |
Alias terkait per Agen | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum alias yang dapat Anda kaitkan dengan Agen. |
Basis pengetahuan terkait per Agen | Setiap Wilayah yang didukung: 2 | Ya |
Jumlah maksimum basis pengetahuan yang dapat Anda kaitkan dengan Agen. |
Ukuran file input inferensi Batch (dalam GB) untuk Amazon Nova Premier | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Amazon Nova Premier. |
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3 Haiku | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Claude 3 Haiku. |
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3 Opus | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3 Opus. |
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3 Soneta | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3 Soneta. |
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3.5 Haiku | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3.5 Haiku. |
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3.5 Soneta | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3.5 Soneta. |
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3.5 Sonnet v2 | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3.5 Soneta v2. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 405B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.1 405B. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 70B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.1 70B. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 8B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.1 8B. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 11B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.2 11B. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 1B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch Llama 3.2 1B Instruct. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 3B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.2 3B. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 90B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.2 90B. |
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.3 70B | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.3 70B. |
Ukuran file input inferensi Batch (dalam GB) untuk Llama 4 Maverick | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Llama 4 Maverick. |
Ukuran file input inferensi Batch (dalam GB) untuk Llama 4 Scout | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Llama 4 Scout. |
Ukuran file input inferensi Batch (dalam GB) untuk Mistral Large 2 (24,07) | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Mistral Large 2 (24,07). |
Ukuran file input inferensi Batch (dalam GB) untuk Mistral Small | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Mistral Small. |
Ukuran file input inferensi Batch (dalam GB) untuk Nova Lite V1 | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Nova Lite V1. |
Ukuran file input inferensi Batch (dalam GB) untuk Nova Micro V1 | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Nova Micro V1. |
Ukuran file input inferensi Batch (dalam GB) untuk Nova Pro V1 | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Nova Pro V1. |
Ukuran file input inferensi Batch (dalam GB) untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Titan Multimodal Embeddings G1. |
Ukuran file input inferensi Batch untuk Titan Text Embeddings V2 (dalam GB) | Setiap Wilayah yang didukung: 1 | Tidak | Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Titan Text Embeddings V2. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Amazon Nova Premier | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Amazon Nova Premier. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3 Haiku | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3 Haiku. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3 Opus | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3 Opus. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3 Soneta | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3 Soneta. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3.5 Haiku | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3.5 Soneta | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3.5 Sonnet v2 | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 405B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 70B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 8B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 11B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 1B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 1B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 3B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 90B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.3 70B | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Llama 4 Maverick | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Llama 4 Maverick. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Llama 4 Scout | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Llama 4 Scout. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Mistral Large 2 (24,07) | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Mistral Large 2 (24.07). |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Mistral Small | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Mistral Small. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Nova Lite V1 | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Nova Lite V1. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Nova Micro V1 | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Nova Micro V1. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Nova Pro V1 | Setiap Wilayah yang didukung: 100 | Tidak | Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Nova Pro V1. |
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1. |
Ukuran pekerjaan inferensi Batch untuk Titan Text Embeddings V2 (dalam GB) | Setiap Wilayah yang didukung: 5 | Tidak | Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2. |
Karakter dalam instruksi Agen | Setiap Wilayah yang didukung: 20.000 | Tidak | Jumlah maksimum karakter dalam instruksi untuk Agen. |
Pekerjaan impor model bersamaan | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum pekerjaan impor model yang sedang berlangsung secara bersamaan. |
CreateAgent permintaan per detik | Setiap Wilayah yang didukung: 6 | Tidak | Jumlah maksimum permintaan CreateAgent API per detik. |
CreateAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 12 | Tidak | Jumlah maksimum permintaan CreateAgentActionGroup API per detik. |
CreateAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan CreateAgentAlias API per detik. |
Permintaan inferensi model Lintas Wilayah per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku. |
Permintaan inferensi model Lintas Wilayah per menit untuk Anthropic Claude 3.5 Sonnet V2 |
us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model Lintas Wilayah per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 4.000.000 | Ya |
Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3.5 Haiku. |
Token inferensi model Lintas Wilayah per menit untuk Anthropic Claude 3.5 Sonnet V2 |
us-west-2:4.000.000 Masing-masing Wilayah yang didukung lainnya: 800.000 |
Ya |
Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Sonnet V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Amazon Nova Lite |
us-east-1:2.000 us-east-2:2.000 us-west-1:2.000 us-west-2:2.000 Masing-masing Wilayah yang didukung lainnya: 200 |
Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Amazon Nova Micro |
us-east-1:2.000 us-east-2:2.000 us-west-2:2.000 Masing-masing Wilayah yang didukung lainnya: 200 |
Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Amazon Nova Premier V1 | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Premier V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Amazon Nova Pro |
us-east-1:200 us-east-2:200 us-west-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude 3 Haiku |
us-east-1:2.000 us-west-2:2.000 ap-northeast-1:400 ap-southeast-1:400 Masing-masing Wilayah yang didukung lainnya: 800 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Haiku. |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude 3 Opus | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3 Opus. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude 3 Soneta |
us-east-1:1.000 us-west-2:1.000 Masing-masing Wilayah yang didukung lainnya: 200 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Soneta. |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude 3.5 Soneta |
us-west-2:500 ap-northeast-1:40 ap-southeast-1:40 eu-central-1:40 eu-west-1:40 eu-west-3:40 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude 3.7 Soneta V1 |
us-east-1:250 us-east-2:250 us-west-2:250 eu-central-1:100 eu-north-1:100 eu-west-1:100 eu-west-3:100 Masing-masing Wilayah yang didukung lainnya: 50 |
Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.7 Soneta V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude Opus 4 V1 | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude Opus 4 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude Opus 4.1 | Setiap Wilayah yang didukung: 50 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude Opus 4.1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude Sonnet 4 V1 | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude Sonnet 4 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk DeepSeek R1 V1 | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk DeepSeek R1 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 405B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.1 8B | Setiap Wilayah yang didukung: 1.600 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 8B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 1.600 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.2 1B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 1.600 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.3 70B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.3 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Meta Llama 4 Maverick V1 | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 4 Maverick V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Meta Llama 4 Scout V1 | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 4 Scout V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Mistral Pixtral Large 25.02 V1 | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Mistral Pixtral Large 25.02 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Twelve Labs Pegasus | Setiap Wilayah yang didukung: 120 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Twelve Labs Pegasus. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Writer AI Palmyra X4 V1 | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Writer AI Palmyra X4 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model lintas wilayah per menit untuk Writer AI Palmyra X5 V1 | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Writer AI Palmyra X5 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Amazon Nova Lite |
us-east-1:4.000.000 us-east-2:4.000.000 us-west-1:4.000.000 us-west-2:4.000.000 Masing-masing Wilayah yang didukung lainnya: 200.000 |
Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Amazon Nova Micro |
us-east-1:4.000.000 us-east-2:4.000.000 us-west-2:4.000.000 Masing-masing Wilayah yang didukung lainnya: 200.000 |
Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Amazon Nova Premier V1 | Setiap Wilayah yang didukung: 800.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Premier V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Amazon Nova Pro |
us-east-1:800.000 us-east-2:800.000 us-west-1:800.000 us-west-2:800.000 Masing-masing Wilayah yang didukung lainnya: 200.000 |
Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude 3 Haiku |
us-east-1:4.000.000 us-west-2:4.000.000 ap-northeast-1:400.000 ap-southeast-1:400.000 Masing-masing Wilayah yang didukung lainnya: 600.000 |
Ya |
Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Haiku. |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude 3 Opus | Setiap Wilayah yang didukung: 800.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3 Opus. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude 3 Soneta |
us-east-1:2.000.000 us-west-2:2.000.000 Masing-masing Wilayah yang didukung lainnya: 400.000 |
Ya |
Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Soneta. |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude 3.5 Soneta |
us-west-2:4.000.000 ap-northeast-1:400.000 ap-southeast-1:400.000 eu-central-1:400.000 eu-west-1:400.000 eu-west-3:400.000 Masing-masing Wilayah yang didukung lainnya: 800.000 |
Ya |
Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude 3.7 Soneta V1 |
us-east-1:1.000.000 us-east-2:1.000.000 us-west-2:1.000.000 eu-central-1:100.000 eu-north-1:100.000 eu-west-1:100.000 eu-west-3:100.000 Masing-masing Wilayah yang didukung lainnya: 50.000 |
Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.7 Soneta V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude Opus 4 V1 | Setiap Wilayah yang didukung: 200.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude Opus 4 V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude Opus 4.1 | Setiap Wilayah yang didukung: 100.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude Opus 4.1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Anthropic Claude Sonnet 4 V1 | Setiap Wilayah yang didukung: 200.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude Sonnet 4 V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk DeepSeek R1 V1 | Setiap Wilayah yang didukung: 200.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk DeepSeek R1 V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 800.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 405B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 70B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.1 8B | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.2 1B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.3 70B | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.3 70B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Meta Llama 4 Maverick V1 | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 4 Maverick V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Meta Llama 4 Scout V1 | Setiap Wilayah yang didukung: 600.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 4 Scout V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Mistral Pixtral Large 25.02 V1 | Setiap Wilayah yang didukung: 80.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Mistral Pixtral Large 25.02 V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Writer AI Palmyra X4 V1 | Setiap Wilayah yang didukung: 150.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Writer AI Palmyra X4 V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model lintas wilayah per menit untuk Writer AI Palmyra X5 V1 | Setiap Wilayah yang didukung: 150.000 | Ya |
Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Writer AI Palmyra X5 V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Model khusus dengan status pembuatan per akun | Setiap Wilayah yang didukung: 2 | Ya |
Jumlah maksimum model kustom dengan status pembuatan. |
DeleteAgent permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan DeleteAgent API per detik. |
DeleteAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan DeleteAgentActionGroup API per detik. |
DeleteAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan DeleteAgentAlias API per detik. |
DeleteAgentVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan DeleteAgentVersion API per detik. |
DisassociateAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 4 | Tidak | Jumlah maksimum permintaan DisassociateAgentKnowledgeBase API per detik. |
Grup tindakan yang diaktifkan per agen | Setiap Wilayah yang didukung: 15 | Ya |
Jumlah maksimum grup tindakan yang dapat Anda aktifkan di Agen. |
Titik akhir per profil inferensi | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum titik akhir dalam profil inferensi. Titik akhir didefinisikan oleh model dan wilayah tempat permintaan permintaan ke model dikirim. |
GetAgent permintaan per detik | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum permintaan GetAgent API per detik. |
GetAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum permintaan GetAgentActionGroup API per detik. |
GetAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan GetAgentAlias API per detik. |
GetAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum permintaan GetAgentKnowledgeBase API per detik. |
GetAgentVersion permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan GetAgentVersion API per detik. |
Model impor per akun | Setiap Wilayah yang didukung: 3 | Ya |
Jumlah maksimum model yang diimpor dalam akun. |
Profil inferensi per akun | Setiap Wilayah yang didukung: 1.000 | Ya |
Jumlah maksimum profil inferensi dalam akun. |
ListAgentActionGroups permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListAgentActionGroups API per detik. |
ListAgentAliases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListAgentAliases API per detik. |
ListAgentKnowledgeBases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListAgentKnowledgeBases API per detik. |
ListAgentVersions permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListAgentVersions API per detik. |
ListAgents permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan ListAgents API per detik. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Amazon Nova Premier | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Amazon Nova Premier. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3 Haiku | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Haiku. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3 Opus | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Opus. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3 Soneta | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Soneta. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3.5 Haiku | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3.5 Soneta | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3.5 Soneta v2 | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 1B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch Llama 3.2 1B Instruct. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Llama 4 Maverick | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Llama 4 Maverick. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Llama 4 Scout | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Llama 4 Scout. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Mistral Large 2 (24.07) | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Large 2 (24.07). |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Mistral Small | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Small. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Nova Lite V1 | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Lite V1. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Nova Micro V1 | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Micro V1. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Nova Pro V1 | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Pro V1. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1. |
Jumlah minimum catatan per pekerjaan inferensi batch untuk Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2. |
Token maksimum pemanggilan model per hari untuk Amazon Nova Premier V1 (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 576.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk Amazon Nova Premier V1. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk Anthropic Claude 3.7 Sonnet V1 (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 720.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk Anthropic Claude 3.7 Sonnet V1. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk Anthropic Claude Opus 4 V1 (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 144.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk Anthropic Claude Opus 4 V1. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk Anthropic Claude Opus 4.1 (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 72.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk Anthropic Claude Opus 4.1. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk Anthropic Claude Sonnet 4 V1 (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 144.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk Anthropic Claude Sonnet 4 V1. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk DeepSeek R1 V1 (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 144.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk DeepSeek R1 V1. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk OpenAI GPT OSS 120B (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 1.440.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk OpenAI GPT OSS 120B. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Token maks pemanggilan model per hari untuk OpenAI GPT OSS 20B (dua kali lipat untuk panggilan lintas wilayah) | Setiap Wilayah yang didukung: 1.440.000.000 | Tidak | Token maksimum harian untuk inferensi model untuk OpenAI GPT OSS 20B. Menggabungkan jumlah token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream. Dua kali lipat untuk panggilan lintas wilayah; tidak berlaku jika terjadi peningkatan TPM yang disetujui. |
Unit model tanpa komitmen Throughput yang disediakan di seluruh model dasar | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat didistribusikan di seluruh Throughput yang Disediakan tanpa komitmen untuk model dasar |
Unit model tanpa komitmen Throughput yang disediakan di seluruh model kustom | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat didistribusikan di seluruh Throughput yang Disediakan tanpa komitmen untuk model kustom |
Unit model per model yang disediakan untuk AI21 Labs Jurassic-2 Mid | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Labs Jurassic-2 Mid. AI21 |
Unit model per model yang disediakan untuk AI21 Labs Jurassic-2 Ultra | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Labs Jurassic-2 Ultra. AI21 |
Unit model per model yang disediakan untuk Amazon Nova Canvas | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Nova Canvas. |
Unit model per model yang disediakan untuk Amazon Titan Embeddings G1 - Teks | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Embeddings G1 - Teks. |
Unit model per model yang disediakan untuk Amazon Titan Image Generator G1 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Image Generator G1. |
Unit model per model yang disediakan untuk Amazon Titan Image Generator G2 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Image Generator G2. |
Unit model per model yang disediakan untuk Amazon Titan Lite V1 4K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Lite V1 4K. |
Unit model per model yang disediakan untuk Amazon Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Multimodal Embeddings G1. |
Unit model per model yang disediakan untuk Amazon Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Embeddings V2. |
Unit model per model yang disediakan untuk Amazon Titan Text G1 - Express 8K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text G1 - Express 8K. |
Unit model per model yang disediakan untuk Amazon Titan Text Premier V1 32K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Premier V1 32K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Haiku 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Haiku 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Haiku 48K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Haiku 48K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Soneta 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Soneta 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Soneta 28K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Soneta 28K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Haiku 16K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Haiku 16K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Haiku 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Haiku 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Haiku 64K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Haiku 64K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 18K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 51K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 51K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 18K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 51K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 51K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.7 V1.0 Soneta 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.7 V1.0 Soneta 18K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.7 V1.0 Soneta 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.7 V1.0 Soneta 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.7 V1.0 Soneta 51K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.7 V1.0 Soneta 51K. |
Unit model per model yang disediakan untuk Anthropic Claude Instant V1 100K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude Instant V1 100K. |
Unit model per model yang disediakan untuk Anthropic Claude V2 100K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2 100K. |
Unit model per model yang disediakan untuk Anthropic Claude V2 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2 18K. |
Unit model per model yang disediakan untuk Anthropic Claude V2.1 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2.1 18K. |
Unit model per model yang disediakan untuk Anthropic Claude V2.1 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2.1 200K. |
Unit model per model yang disediakan untuk Cohere Command | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command. |
Unit model per model yang disediakan untuk Cohere Command Light | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command Light. |
Unit model per model yang disediakan untuk Cohere Command R | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command R 128k. |
Unit model per model yang disediakan untuk Cohere Command R Plus | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command R Plus 128k. |
Unit model per model yang disediakan untuk Cohere Embed English | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Embed English. |
Unit model per model yang disediakan untuk Cohere Embed Multilingual | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Embed Multilingual. |
Unit model per model yang disediakan untuk Meta Llama 2 13B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 13B. |
Unit model per model yang disediakan untuk Meta Llama 2 70B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 70B. |
Unit model per model yang disediakan untuk Meta Llama 2 Chat 13B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 Chat 13B. |
Unit model per model yang disediakan untuk Meta Llama 2 Chat 70B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 Chat 70B. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3 70B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3 70B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3 8B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3 8B Instruct. |
Unit model per model yang disediakan untuk Meta Llama 3.1 70B Instruct | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.1 70B Instruct. |
Unit model per model yang disediakan untuk Meta Llama 3.1 8B Instruct | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.1 8B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3.2 11B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.2 11B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.2 1B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.2 3B Instruct. |
Unit model per model yang disediakan untuk Meta Llama 3.2 90B Instruct | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.2 90B Instruct. |
Unit model per model yang disediakan untuk Mistral Large 2407 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Mistral Large 2407. |
Unit model per model yang disediakan untuk Mistral Small | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Mistral Small. |
Unit model per model yang disediakan untuk Stability.ai Difusi Stabil XL 0.8 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Stability.ai Stable Diffusion XL 0.8 |
Unit model per model yang disediakan untuk Stability.ai Difusi Stabil XL 1.0 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Stability.ai Stable Diffusion XL 1.0. |
Unit model per model yang disediakan untuk varian panjang konteks 128k untuk Amazon Nova Micro | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 128k untuk Amazon Nova Micro |
Unit model per model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Lite | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Lite |
Unit model per model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Micro | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Micro |
Unit model per model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Pro | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Pro |
Unit model per model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Lite | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Lite |
Unit model per model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Pro | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Pro. |
Unit model, dengan komitmen, untuk Disediakan Sepanjang dibuat untuk Meta Llama 4 Scout 17B Instruct 10M | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke Provisioned Throughput yang dibuat untuk Meta Llama 4 Scout 17B Instruct 10M, dengan komitmen. |
Unit model, dengan komitmen, untuk Disediakan Sepanjang dibuat untuk Meta Llama 4 Scout 17B Instruct 128K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke Provisioned Throughput yang dibuat untuk Meta Llama 4 Scout 17B Instruct 128K, dengan komitmen. |
Unit model, dengan komitmen, untuk Provisioned Through dibuat untuk Meta Maverick 4 Scout 17B Instruct 128K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke Provisioned Throughput yang dibuat untuk Meta Llama 4 Maverick 17B Instruct 128K, dengan komitmen. |
Unit model, dengan komitmen, untuk Provisioned Through dibuat untuk Meta Maverick 4 Scout 17B Instruct 1M | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke Provisioned Throughput yang dibuat untuk Meta Llama 4 Maverick 17B Instruct 1M, dengan komitmen. |
Jumlah router prompt khusus per akun | Setiap Wilayah yang didukung: 500 | Tidak | Jumlah maksimum router prompt khusus yang dapat Anda buat per akun per wilayah. |
Permintaan inferensi model sesuai permintaan dan dioptimalkan latensi per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum permintaan sesuai permintaan dan dioptimalkan latensi yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 405B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan dan dioptimalkan latensi per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum permintaan sesuai permintaan dan dioptimalkan latensi yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan dan dioptimalkan latensi per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 40.000 | Tidak | Jumlah maksimum token sesuai permintaan dan dioptimalkan latensi yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan dan dioptimalkan latensi per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 40.000 | Tidak | Jumlah maksimum token sesuai permintaan dan dioptimalkan latensi yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan InvokeModel bersamaan sesuai permintaan untuk Amazon Nova Reel1.0 | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum permintaan inferensi model bersamaan yang dapat Anda kirimkan untuk Amazon Nova Reel 1.0. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan InvokeModel bersamaan sesuai permintaan untuk Amazon Nova Reel1.1 | Setiap Wilayah yang didukung: 3 | Tidak | Jumlah maksimum permintaan inferensi model bersamaan yang dapat Anda kirimkan untuk Amazon Nova Reel 1.1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan InvokeModel bersamaan sesuai permintaan untuk Amazon Nova Sonic | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum permintaan bersamaan yang dapat Anda kirimkan untuk inferensi model untuk Amazon Nova Sonic. |
Permintaan InvokeModel bersamaan sesuai permintaan untuk Twelve Labs Marengo | Setiap Wilayah yang didukung: 30 | Tidak | Jumlah maksimum InvokeModel permintaan bersamaan yang dapat Anda kirimkan untuk inferensi model untuk Twelve Labs Marengo. |
Permintaan InvokeModel bersamaan sesuai permintaan untuk Twelve Labs Pegasus | Setiap Wilayah yang didukung: 30 | Tidak | Jumlah maksimum InvokeModel permintaan bersamaan yang dapat Anda kirimkan untuk inferensi model untuk Twelve Labs Pegasus. |
Permintaan inferensi model yang dioptimalkan latensi sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse,, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3.5 Haiku ConverseStream, jika optimasi latensi dikonfigurasi. |
Token inferensi model yang dioptimalkan latensi sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 500.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse,, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3.5 Haiku ConverseStream, jika optimasi latensi dikonfigurasi. |
Permintaan bersamaan inferensi model sesuai permintaan untuk Luma Ray V2 | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum permintaan bersamaan yang dapat Anda kirimkan untuk inferensi model untuk Luma Ray V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Large | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Large. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel |
Permintaan inferensi model sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Mini | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Mini. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi AI21 Labs Jamba | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel |
Permintaan inferensi model sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Mid | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk AI21 Labs Jurassic-2 Mid |
Permintaan inferensi model sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Ultra | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk AI21 Labs Jurassic-2 Ultra |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Nova Canvas | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Canvas. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Nova Lite |
us-east-1:1.000 eu-west-2:1.000 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Nova Micro |
us-east-1:1.000 eu-west-2:1.000 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Nova Pro |
ap-southeast-2:50 ca-central-1:50 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Rerank 1.0 | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Rerank 1.0. |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Image Generator G1 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1. |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Image Generator G1 V2 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Titan Image Generator G1 V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Multimodal Embeddings G1. |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Text Embeddings | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings V2 |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Text Express | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan untuk InvokeModelWithResponseStream Amazon Titan Text Express |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Text Lite | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan untuk InvokeModelWithResponseStream Amazon Titan Text Lite |
Permintaan inferensi model sesuai permintaan per menit untuk Amazon Titan Text Premier | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan untuk InvokeModelWithResponseStream Amazon Titan Text Premier |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3 Haiku |
us-east-1:1.000 us-west-2:1.000 ap-northeast-1:200 ap-southeast-1:200 Masing-masing Wilayah yang didukung lainnya: 400 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Haiku. |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3 Opus | Setiap Wilayah yang didukung: 50 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3 Opus. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3 Soneta |
us-east-1:500 us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Soneta. |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku |
us-west-1:400 Masing-masing Wilayah yang didukung lainnya: 1.000 |
Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Haiku. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.5 Soneta |
us-east-1:50 us-east-2:50 us-west-2:250 ap-northeast-2:50 ap-south-1:50 ap-southeast-2:50 Masing-masing Wilayah yang didukung lainnya: 20 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet V2 |
us-west-2:250 Masing-masing Wilayah yang didukung lainnya: 50 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.7 Sonnet V1 | Setiap Wilayah yang didukung: 125 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.7 Soneta V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude Instant |
us-east-1:1.000 us-west-2:1.000 Masing-masing Wilayah yang didukung lainnya: 400 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse,, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic ConverseStream Claude Instant |
Permintaan inferensi model sesuai permintaan per menit untuk Anthropic Claude V2 |
us-east-1:500 us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse,, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic ConverseStream Claude V2 |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Command | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command. |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Command Light | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command Light. |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Command R | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command R 128k. |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Command R Plus | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command R Plus 128k. |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Embed English | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Cohere Embed English. |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Embed Multilingual | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Cohere Embed Multilingual. |
Permintaan inferensi model sesuai permintaan per menit untuk Cohere Rerank 3.5 | Setiap Wilayah yang didukung: 250 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Cohere Rerank 3.5. |
Permintaan inferensi model sesuai permintaan per menit untuk Meta Llama 2 13B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 13B. |
Permintaan inferensi model sesuai permintaan per menit untuk Meta Llama 2 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 70B. |
Permintaan inferensi model sesuai permintaan per menit untuk Meta Llama 2 Chat 13B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 Chat 13B. |
Permintaan inferensi model sesuai permintaan per menit untuk Meta Llama 2 Chat 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 Chat 70B. |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3 8B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3 8B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 405B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 8B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 11B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 11B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.2 1B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 90B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 90B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.3 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.3 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Mistral 7B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Mistral mistral-7 0 b-instruct-v |
Permintaan inferensi model sesuai permintaan per menit untuk Mistral AI Mistral Small | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit untuk Mistral AI Mistral Small |
Permintaan inferensi model sesuai permintaan per menit untuk Mistral Large | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit untuk Mistral mistral-large 2402-v1 |
Permintaan inferensi model sesuai permintaan per menit untuk Mistral Large 2407 | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Mistral Large 2407. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Mistral Mixtral 8x7b | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Mistral mixtral-8x7b-v0 |
Permintaan inferensi model sesuai permintaan per menit untuk OpenAI GPT OSS 120B | Setiap Wilayah yang didukung: 250 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk OpenAI GPT OSS 120B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk OpenAI GPT OSS 20B | Setiap Wilayah yang didukung: 250 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk OpenAI GPT OSS 20B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Diffusion 3 Large | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3 Large. |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Diffusion 3 Medium | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3 Medium |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Diffusion 3.5 Large | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3.5 Large. |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Diffusion XL 0.8 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion XL 0.8 |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Diffusion XL 1.0 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion XL 1.0 |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Image Core | Setiap Wilayah yang didukung: 90 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Image Core. |
Permintaan inferensi model sesuai permintaan per menit untuk Stability.ai Stable Image Ultra | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Image Ultra. |
Permintaan inferensi model sesuai permintaan per menit untuk Twelve Labs Pegasus | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Twelve Labs Pegasus. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Large | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Large. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse dan. InvokeModel |
Token inferensi model sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Mini | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Mini. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse dan. InvokeModel |
Token inferensi model sesuai permintaan per menit untuk Instruksi AI21 Labs Jamba | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi AI21 Labs Jamba. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan InvokeModel |
Token inferensi model sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Mid | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk AI21 Labs Jurassic-2 Mid. |
Token inferensi model sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Ultra | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk AI21 Labs Jurassic-2 Ultra. |
Token inferensi model sesuai permintaan per menit untuk Amazon Nova Lite |
us-east-1:2.000.000 eu-west-2:2.000.000 Masing-masing Wilayah yang didukung lainnya: 100.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Amazon Nova Micro |
us-east-1:2.000.000 eu-west-2:2.000.000 Masing-masing Wilayah yang didukung lainnya: 100.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Amazon Nova Pro |
ap-southeast-2:100.000 ca-central-1:100.000 Masing-masing Wilayah yang didukung lainnya: 400.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Image Generator G1 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1. |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Image Generator G1 V2 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Titan Image Generator G1 V2. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Multimodal Embeddings G1. |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Text Embeddings | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings. |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings V2. |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Text Express | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan untuk InvokeModelWithResponseStream Amazon Titan Text Express. |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Text Lite | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan untuk InvokeModelWithResponseStream Amazon Titan Text Lite. |
Token inferensi model sesuai permintaan per menit untuk Amazon Titan Text Premier | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan untuk InvokeModelWithResponseStream Amazon Titan Text Premier. |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3 Haiku |
us-east-1:2.000.000 us-west-2:2.000.000 ap-northeast-1:200.000 ap-southeast-1:200.000 Masing-masing Wilayah yang didukung lainnya: 300.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Haiku. |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3 Opus | Setiap Wilayah yang didukung: 400.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3 Opus. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3 Sonnet |
us-east-1:1.000.000 us-west-2:1.000.000 Masing-masing Wilayah yang didukung lainnya: 200.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude 3 Soneta. |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku |
us-west-1:300.000 Masing-masing Wilayah yang didukung lainnya: 2.000.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Haiku. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet |
us-east-1:400.000 us-east-2:400.000 us-west-2:2.000.000 ap-northeast-2:400.000 ap-south-1:400.000 ap-southeast-2:400.000 Masing-masing Wilayah yang didukung lainnya: 200.000 |
Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet V2 |
us-west-2:2.000.000 Masing-masing Wilayah yang didukung lainnya: 400.000 |
Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Sonnet V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude 3.7 Sonnet V1 | Setiap Wilayah yang didukung: 500.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.7 Sonnet V1. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude Instant |
us-east-1:1.000.000 us-west-2:1.000.000 Masing-masing Wilayah yang didukung lainnya: 300.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude Instant. |
Token inferensi model sesuai permintaan per menit untuk Anthropic Claude V2 |
us-east-1:500.000 us-west-2:500.000 Masing-masing Wilayah yang didukung lainnya: 200.000 |
Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Anthropic Claude V2. |
Token inferensi model sesuai permintaan per menit untuk Cohere Command | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command. |
Token inferensi model sesuai permintaan per menit untuk Cohere Command Light | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command Light. |
Token inferensi model sesuai permintaan per menit untuk Cohere Command R | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command R 128k. |
Token inferensi model sesuai permintaan per menit untuk Cohere Command R Plus | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Cohere Command R Plus 128k. |
Token inferensi model sesuai permintaan per menit untuk Cohere Embed English | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Embed English. |
Token inferensi model sesuai permintaan per menit untuk Cohere Embed Multilingual | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Embed Multilingual. |
Token inferensi model sesuai permintaan per menit untuk Meta Llama 2 13B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 13B. |
Token inferensi model sesuai permintaan per menit untuk Meta Llama 2 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 70B. |
Token inferensi model sesuai permintaan per menit untuk Meta Llama 2 Chat 13B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 Chat 13B. |
Token inferensi model sesuai permintaan per menit untuk Meta Llama 2 Chat 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Meta Llama 2 Chat 70B. |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3 70B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3 8B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3 8B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 400.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.1 405B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 8B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 11B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 11B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 1B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 90B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 90B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.3 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.3 70B Instruct. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Mistral AI Mistral 7B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Mistral AI Mistral 7B Instruct. |
Token inferensi model sesuai permintaan per menit untuk Mistral AI Mistral Large | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Mistral AI Mistral Large. |
Token inferensi model sesuai permintaan per menit untuk Mistral AI Mistral Small | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Mistral AI Mistral Small. |
Token inferensi model sesuai permintaan per menit untuk Instruksi Mistral AI Mixtral 8X7BB | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan InvokeModelWithResponseStream untuk Instruksi Mistral AI Mixtral 8X7B. |
Token inferensi model sesuai permintaan per menit untuk Mistral Large 2407 | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Mistral Large 2407. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream |
Token inferensi model sesuai permintaan per menit untuk OpenAI GPT OSS 120B | Setiap Wilayah yang didukung: 1.000.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk OpenAI GPT OSS 120B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Token inferensi model sesuai permintaan per menit untuk OpenAI GPT OSS 20B | Setiap Wilayah yang didukung: 1.000.000 | Tidak | Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk OpenAI GPT OSS 20B. Kuota mempertimbangkan jumlah gabungan token input dan output di semua permintaan ke Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Parameter per fungsi | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum parameter yang dapat Anda miliki dalam fungsi grup tindakan. |
PrepareAgent permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan PrepareAgent API per detik. |
Rekaman pekerjaan inferensi per batch untuk Amazon Nova Premier | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Amazon Nova Premier. |
Catatan pekerjaan inferensi per batch untuk Claude 3 Haiku | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Haiku. |
Catatan pekerjaan inferensi per batch untuk Claude 3 Opus | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Opus. |
Catatan pekerjaan inferensi per batch untuk Claude 3 Sonnet | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Soneta. |
Catatan pekerjaan inferensi per batch untuk Claude 3.5 Haiku | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku. |
Catatan pekerjaan inferensi per batch untuk Claude 3.5 Soneta | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta. |
Catatan pekerjaan inferensi per batch untuk Claude 3.5 Sonnet v2 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.1 405B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.1 70B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.1 8B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 11B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 1B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch Llama 3.2 1B Instruct. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 3B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 90B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B. |
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.3 70B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B. |
Catatan pekerjaan inferensi per batch untuk Llama 4 Maverick | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Llama 4 Maverick. |
Catatan pekerjaan inferensi per batch untuk Llama 4 Scout | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Llama 4 Scout. |
Catatan pekerjaan inferensi per batch untuk Mistral Large 2 (24.07) | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Large 2 (24.07). |
Catatan pekerjaan inferensi per batch untuk Mistral Small | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Small. |
Rekaman pekerjaan inferensi per batch untuk Nova Lite V1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Lite V1. |
Catatan pekerjaan inferensi per batch untuk Nova Micro V1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Micro V1. |
Catatan pekerjaan inferensi per batch untuk Nova Pro V1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Pro V1. |
Catatan pekerjaan inferensi per batch untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1. |
Catatan pekerjaan inferensi per batch untuk Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2. |
Catatan per file input per pekerjaan inferensi batch untuk Amazon Nova Premier | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Amazon Nova Premier. |
Catatan per file input per pekerjaan inferensi batch untuk Claude 3 Haiku | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3 Haiku. |
Catatan per file input per pekerjaan inferensi batch untuk Claude 3 Opus | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3 Opus. |
Catatan per file input per pekerjaan inferensi batch untuk Claude 3 Soneta | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3 Soneta. |
Catatan per file input per pekerjaan inferensi batch untuk Claude 3.5 Haiku | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku. |
Rekaman per file input per pekerjaan inferensi batch untuk Claude 3.5 Soneta | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta. |
Rekaman per file input per pekerjaan inferensi batch untuk Claude 3.5 Sonnet v2 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 1B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch Llama 3.2 1B Instruct. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B. |
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B. |
Catatan per file input per pekerjaan inferensi batch untuk Llama 4 Maverick | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Llama 4 Maverick. |
Catatan per file input per pekerjaan inferensi batch untuk Llama 4 Scout | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Llama 4 Scout. |
Catatan per file input per pekerjaan inferensi batch untuk Mistral Large 2 (24.07) | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Mistral Large 2 (24,07). |
Catatan per file input per pekerjaan inferensi batch untuk Mistral Small | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Mistral Small. |
Rekaman per file input per pekerjaan inferensi batch untuk Nova Lite V1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Nova Lite V1. |
Catatan per file input per pekerjaan inferensi batch untuk Nova Micro V1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Nova Micro V1. |
Rekaman per file input per pekerjaan inferensi batch untuk Nova Pro V1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Nova Pro V1. |
Catatan per file input per pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1. |
Catatan per file input per pekerjaan inferensi batch untuk Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Amazon Nova Premier | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Amazon Nova Premier. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Haiku | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Haiku. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Opus | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Opus. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Soneta | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Soneta. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Haiku | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Haiku. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta v2 | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta v2. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 405B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 405B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 70B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 70B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 8B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 8B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 11B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 11B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 1B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 1B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 3B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 3B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 90B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 90B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.3 70B | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.3 70B. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Llama 4 Maverick | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Llama 4 Maverick. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Llama 4 Scout | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Llama 4 Scout. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Large 2 (24.07) | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Large 2 (24.07). |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Small | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Small. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Lite V1 | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Lite V1. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Micro V1 | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Micro V1. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Pro V1 | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Pro V1. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Multimodal Embeddings G1. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Text Embeddings V2. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 3 | Tidak | Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Multimodal Embeddings G1. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 3 | Tidak | Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Text Embeddings V2 |
Batas laju throttle untuk Runtime Otomasi Data Batuan Dasar: ListTagsForResource | Setiap Wilayah yang didukung: 25 per detik | Tidak | Jumlah maksimum Runtime Otomasi Data Batuan Dasar: ListTagsForResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk Runtime Otomasi Data Batuan Dasar: TagResource | Setiap Wilayah yang didukung: 25 per detik | Tidak | Jumlah maksimum Runtime Otomasi Data Batuan Dasar: TagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk Runtime Otomasi Data Batuan Dasar: UntagResource | Setiap Wilayah yang didukung: 25 per detik | Tidak | Jumlah maksimum Runtime Otomasi Data Batuan Dasar: UntagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk Otomasi Data Batuan Dasar: ListTagsForResource | Setiap Wilayah yang didukung: 25 per detik | Tidak | Jumlah maksimum Otomasi Data Batuan Dasar: ListTagsForResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk Otomasi Data Batuan Dasar: TagResource | Setiap Wilayah yang didukung: 25 per detik | Tidak | Jumlah maksimum Otomasi Data Batuan Dasar: TagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk Otomasi Data Batuan Dasar: UntagResource | Setiap Wilayah yang didukung: 25 per detik | Tidak | Jumlah maksimum Otomasi Data Batuan Dasar: UntagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk CreateBlueprint | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum CreateBlueprint permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk CreateBlueprintVersion | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum CreateBlueprintVersion permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk CreateDataAutomationProject | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum CreateDataAutomationProject permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk DeleteBlueprint | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum DeleteBlueprint permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk DeleteDataAutomationProject | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum DeleteDataAutomationProject permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk GetBlueprint | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum GetBlueprint permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk GetDataAutomationProject | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum GetDataAutomationProject permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk GetDataAutomationStatus | Setiap Wilayah yang didukung: 10 per detik | Tidak | Jumlah maksimum GetDataAutomationStatus permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk InvokeDataAutomationAsync | Setiap Wilayah yang didukung: 10 per detik | Tidak | Jumlah maksimum InvokeDataAutomationAsync permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk ListBlueprints | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum ListBlueprints permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk ListDataAutomationProjects | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum ListDataAutomationProjects permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk UpdateBlueprint | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum UpdateBlueprint permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
Batas laju throttle untuk UpdateDataAutomationProject | Setiap Wilayah yang didukung: 5 per detik | Tidak | Jumlah maksimum UpdateDataAutomationProject permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini |
UpdateAgent permintaan per detik | Setiap Wilayah yang didukung: 4 | Tidak | Jumlah maksimum permintaan UpdateAgent API per detik. |
UpdateAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 6 | Tidak | Jumlah maksimum permintaan UpdateAgentActionGroup API per detik. |
UpdateAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum permintaan UpdateAgentAlias API per detik. |
UpdateAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 4 | Tidak | Jumlah maksimum permintaan UpdateAgentKnowledgeBase API per detik. |
catatan
Anda dapat meminta kenaikan kuota untuk akun Anda dengan mengikuti langkah-langkah di bawah ini:
-
Jika kuota ditandai sebagai Ya, Anda dapat menyesuaikannya dengan mengikuti langkah-langkah di Meminta Peningkatan Kuota pada Panduan Pengguna Service Quotas.
-
Jika kuota ditandai sebagai Tidak, Anda dapat mengirimkan permintaan melalui formulir kenaikan batas
untuk dipertimbangkan untuk kenaikan. -
Untuk model apa pun, Anda dapat meminta peningkatan untuk kuota berikut bersama-sama:
-
InvokeModel Token Lintas Wilayah per menit untuk
${model}
-
InvokeModel Permintaan Lintas Wilayah per menit untuk
${model}
-
InvokeModel Token sesuai permintaan per menit untuk
${model}
-
Permintaan sesuai InvokeModel permintaan per menit untuk
${model}
Untuk meminta peningkatan kombinasi kuota ini, mintalah peningkatan InvokeModel token Lintas Wilayah per menit untuk
${model}
kuota dengan mengikuti langkah-langkah di Meminta Peningkatan Kuota dalam Panduan Pengguna Service Quotas. Setelah Anda melakukannya, tim dukungan akan menjangkau dan menawarkan Anda opsi untuk juga meningkatkan tiga kuota lainnya. Karena permintaan yang luar biasa, prioritas akan diberikan kepada pelanggan yang menghasilkan lalu lintas yang mengkonsumsi alokasi kuota yang ada. Permintaan Anda mungkin ditolak jika Anda tidak memenuhi persyaratan ini. -