Considerazioni sull'inferenza geografica interregionale Requisiti delle policy IAM per l'inferenza geografica tra regioni Requisiti della policy di controllo dei servizi per l'inferenza geografica tra regioni Usa l'inferenza geografica tra regioni

Inferenza geografica interregionale

L'inferenza geografica interregionale mantiene l'elaborazione dei dati entro limiti geografici specifici (Stati Uniti, UE, APAC, ecc.), fornendo al contempo un throughput più elevato rispetto all'inferenza a regione singola. Questa opzione è ideale per le organizzazioni con requisiti di residenza dei dati e normative di conformità.

Considerazioni sull'inferenza geografica interregionale

Tieni presente le seguenti informazioni sull'inferenza geografica tra regioni:

Le richieste di inferenza interregionale relative a un profilo di inferenza legato a un'area geografica (ad esempio Stati Uniti, UE e APAC) vengono conservate all'interno della parte geografica in Regioni AWS cui risiedono originariamente i dati. Ad esempio, una richiesta effettuata negli Stati Uniti viene conservata negli Stati Uniti. Regioni AWS Sebbene i dati rimangano archiviati solo nella Regione di origine, durante l’inferenza tra Regioni i prompt di input e i risultati di output potrebbero spostarsi al di fuori della Regione di origine. Tutti i dati verranno trasmessi crittografati attraverso la rete sicura di Amazon.
Per visualizzare le quote predefinite per il throughput tra Regioni quando si utilizzano profili di inferenza legati a un’area geografica (ad esempio Stati Uniti, UE e APAC), consulta i valori in Richieste di inferenza del modello tra Regioni al minuto per ${Model} e Token di inferenza del modello tra Regioni al minuto per ${Model} in Quote di servizio di Amazon Bedrock in Riferimenti generali AWS.

Requisiti delle policy IAM per l'inferenza geografica tra regioni

Per consentire a un utente o un ruolo IAM di richiamare un profilo di inferenza geografico interregionale, devi consentire l'accesso alle seguenti risorse:

Il profilo di inferenza interregionale specifico per ogni area geografica (questi profili hanno prefissi geografici come,,) us eu apac
Il modello di base nella regione di origine
Il modello di base in tutte le regioni di destinazione elencate nel profilo geografico

La seguente politica di esempio concede le autorizzazioni necessarie per utilizzare il modello di base Claude Sonnet 4.5 con un profilo di inferenza geografica interregionale per gli Stati Uniti, dove si trova la regione di origine e le regioni di destinazione, us-east-1 e: us-east-1 us-east-2 us-west-2


{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}

La prima istruzione concede all'bedrock:InvokeModelAPI l'accesso al profilo di inferenza geografica interregionale per le richieste provenienti dalla regione richiedente. La seconda istruzione concede all'bedrock:InvokeModelAPI l'accesso al modello di base sia nella regione richiedente che in tutte le regioni di destinazione elencate nel profilo di inferenza.

Requisiti della policy di controllo dei servizi per l'inferenza geografica tra regioni

Molte organizzazioni implementano controlli di accesso regionali tramite Service Control Policies in AWS Organizations for security and compliance. Se la politica di sicurezza dell'organizzazione prevede il blocco delle regioni non utilizzate, è necessario assicurarsi che le condizioni SCP specifiche della regione consentano l'accesso a tutte le regioni di destinazione elencate nel profilo di inferenza geografica interregionale per la regione di origine. SCPs

Per l'inferenza geografica interregionale, devi comprendere la relazione tra la tua regione di origine (dove effettui la chiamata API) e le regioni di destinazione (dove possono essere instradate le richieste). Consulta la documentazione del profilo di inferenza per identificare tutte le regioni di destinazione per la regione di origine, quindi assicurati di SCPs consentire l'accesso a tutte quelle regioni di destinazione.

Ad esempio, se chiami da us-east-1 (regione di origine) utilizzando il profilo geografico US Anthropic Claude Sonnet 4.5, le richieste possono essere indirizzate a us-east-1, us-east-2 e us-west-2 (regioni di destinazione). Se un SCP limita l'accesso solo a us-east-1, l'inferenza tra regioni fallirà quando si tenta di effettuare il routing verso us-east-2 o us-west-2. Pertanto, è necessario consentire l'accesso a tutte e tre le regioni di destinazione nel proprio SCP, indipendentemente dalla regione da cui si sta chiamando.

Quando SCPs configuri l'esclusione tra regioni, ricorda che il blocco di qualsiasi regione di destinazione nel profilo di inferenza impedirà il corretto funzionamento dell'inferenza tra regioni, anche se la regione di origine rimane accessibile. Per i requisiti SCP per l'inferenza globale tra regioni, vedi. Requisiti della politica di controllo dei servizi per l'inferenza globale tra regioni

Per migliorare la sicurezza, prendi in considerazione l'utilizzo della bedrock:InferenceProfileArn condizione per limitare l'accesso a profili di inferenza specifici. Ciò consente di concedere l'accesso alle regioni richieste limitando al contempo i profili di inferenza che è possibile utilizzare.

Usa l'inferenza geografica tra regioni

Per utilizzare l'inferenza geografica interregionale, è necessario includere un profilo di inferenza quando si esegue l'inferenza del modello nei seguenti modi:

Inferenza del modello su richiesta: specifica l'ID del profilo di inferenza da utilizzare modelId quando si invia una,, Converse o una InvokeModelrichiesta. InvokeModelWithResponseStream ConverseStream Un profilo di inferenza definisce una o più Regioni verso le quali può instradare le richieste di inferenza provenienti dalla Regione di origine. L’uso dell’inferenza tra Regioni aumenta il throughput e le prestazioni instradando dinamicamente le richieste di invocazione del modello tra le Regioni definite nel profilo di inferenza. Fattori di routing nel traffico degli utenti, nella domanda e nell’utilizzo delle risorse. Per ulteriori informazioni, consulta Invio di prompt e generazione di risposte con l’inferenza del modello
Inferenza in batch: invia le richieste in modo asincrono con inferenza batch specificando l'ID del profilo di inferenza come quando si invia una richiesta. modelId CreateModelInvocationJob L’uso di un profilo di inferenza consente di utilizzare il calcolo su più Regioni AWS e di ottenere tempi di elaborazione più rapidi per i processi batch. Al termine del processo, puoi recuperare i file di output dal bucket Amazon S3 nella Regione di origine.
Agenti: specifica l’ID del profilo di inferenza nel campo foundationModel di una richiesta CreateAgent. Per ulteriori informazioni, consulta Creazione e configurazione manuale dell’agente.
Generazione di risposte della knowledge base: è possibile utilizzare l’inferenza tra Regioni per generare una risposta dopo aver eseguito una query su una knowledge base. Per ulteriori informazioni, consulta Test della knowledge base con query e risposte.
Valutazione del modello: è possibile inviare un profilo di inferenza come modello da valutare quando si invia un processo di valutazione del modello. Per ulteriori informazioni, consulta Valutare le prestazioni delle risorse Amazon Bedrock.
Gestione prompt: è possibile utilizzare un profilo di inferenza per generare una risposta a un prompt creato in Gestione prompt. Per ulteriori informazioni, consulta Creare e archiviare prompt riutilizzabili con Gestione dei prompt in Amazon Bedrock.
Flussi di prompt: è possibile utilizzare un profilo di inferenza quando si genera una risposta per un prompt definito in linea in un nodo prompt in un flusso di prompt. Per ulteriori informazioni, consulta Creare un flusso di lavoro di IA generativa end-to-end con Amazon Bedrock Flows.

Per informazioni su come utilizzare un profilo di inferenza per inviare richieste di invocazione del modello tra Regioni, consulta Utilizzare un profilo di inferenza nell’invocazione del modello.

Per ulteriori informazioni sull’inferenza tra Regioni, consulta Introduzione all’inferenza tra Regioni in Amazon Bedrock.

Per informazioni dettagliate sull'inferenza globale tra regioni, inclusa la configurazione IAM e la gestione delle quote di servizio, vedere. Inferenza globale tra regioni

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Inferenza tra regioni: distribuzione del traffico in entrata

Inferenza globale tra regioni