AnthropicClaudePanoramica dell'API Messages

AnthropicClaudeAPI Messaggi

Questa sezione fornisce parametri di inferenza ed esempi di codice per l'utilizzo dell'API Anthropic Claude Messages.

Argomenti

AnthropicClaudePanoramica dell'API Messages

Puoi utilizzare l'API Messages per creare chat bot o applicazioni di assistenza virtuale. L'API gestisce gli scambi conversazionali tra un utente e un Anthropic Claude modello (assistente).

Suggerimento

Questo argomento mostra come utilizzare l'API dei Anthropic Claude messaggi con le operazioni di inferenza di base (InvokeModelor). InvokeModelWithResponseStream Tuttavia, ti consigliamo di utilizzare l'ConverseAPI per implementare i messaggi nella tua applicazione. L'ConverseAPI fornisce un set unificato di parametri che funzionano su tutti i modelli che supportano i messaggi. Per ulteriori informazioni, consulta Effettua una conversazione con le operazioni dell'ConverseAPI.

Anthropicaddestra i modelli di Claude a operare in turni di conversazione alternati tra utente e assistente. Quando si crea un nuovo messaggio, si specificano i turni di conversazione precedenti con il parametro messages. Il modello genera quindi il messaggio successivo nella conversazione.

Ogni messaggio di input deve essere un oggetto con un ruolo e un contenuto. È possibile specificare un singolo messaggio relativo al ruolo utente oppure includere più messaggi utente e assistente.

Se stai usando la tecnica di precompilazione della risposta Claude (inserendo l'inizio della risposta di Claude usando l'ultimo ruolo di assistente Message), Claude risponderai riprendendo da dove avevi interrotto. Con questa tecnica, Claude restituirà comunque una risposta con il ruolo di assistente.

Se il messaggio finale utilizza il ruolo di assistente, il contenuto della risposta riprenderà immediatamente dal contenuto di quel messaggio. Puoi usarlo per vincolare parte della risposta del modello.

Esempio con un singolo messaggio utente:


[{"role": "user", "content": "Hello, Claude"}]

Esempio con turni di conversazione multipli:


[
  {"role": "user", "content": "Hello there."},
  {"role": "assistant", "content": "Hi, I'm Claude. How can I help you?"},
  {"role": "user", "content": "Can you explain LLMs in plain English?"},
]

Esempio con una risposta parzialmente compilata di Claude:


[
  {"role": "user", "content": "Please describe yourself using only JSON"},
  {"role": "assistant", "content": "Here is my JSON description:\n{"},
]

Il contenuto di ogni messaggio di input può essere una singola stringa o una matrice di blocchi di contenuto, in cui ogni blocco ha un tipo specifico. L'uso di una stringa è l'abbreviazione di un array di un blocco di contenuto di tipo «testo». I seguenti messaggi di input sono equivalenti:


{"role": "user", "content": "Hello, Claude"}


{"role": "user", "content": [{"type": "text", "text": "Hello, Claude"}]}

Per informazioni sulla creazione di prompt per i Anthropic Claude modelli, consultate Intro to prompting nella documentazione. Anthropic Claude Se hai già dei prompt di completamento del testo che desideri migrare all'API dei messaggi, consulta Migrazione da Text Completions.

Importante

Il periodo di timeout per le chiamate di inferenza verso 1 e 4 modelli è di Anthropic Claude 3.7 Sonnet 60 minuti. Claude Per impostazione predefinita, i client AWS SDK scadono dopo 1 minuto. Ti consigliamo di aumentare il periodo di timeout di lettura del tuo client AWS SDK ad almeno 60 minuti. Ad esempio, nell'SDK botocore di AWS Python, modifica il valore del read_timeout campo in botocore.config ad almeno 3600.

Richieste di sistema

È inoltre possibile includere un prompt di sistema nella richiesta. Un prompt di sistema consente di fornire contesto e istruzioni AnthropicClaude, ad esempio per specificare un obiettivo o un ruolo particolare. Specificate un prompt di sistema nel system campo, come illustrato nell'esempio seguente.


"system": "You are Claude, an AI assistant created by Anthropic to be helpful,
                harmless, and honest. Your goal is to provide informative and substantive responses
                to queries while avoiding potential harms."

Per ulteriori informazioni, vedete le istruzioni di sistema nella documentazione. Anthropic

Istruzioni multimodali

Un prompt multimodale combina più modalità (immagini e testo) in un unico prompt. Le modalità vengono specificate nel campo di immissione. content L'esempio seguente mostra come si potrebbe chiedere Anthropic Claude di descrivere il contenuto di un'immagine fornita. Per il codice di esempio, consulta Esempi di codice multimodale.


{
    "anthropic_version": "bedrock-2023-05-31", 
    "max_tokens": 1024,
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": "image/jpeg",
                        "data": "iVBORw..."
                    }
                },
                {
                    "type": "text",
                    "text": "What's in these images?"
                }
            ]
        }
    ]
}

Nota

Le seguenti restrizioni riguardano il content campo:

Puoi includere fino a 20 immagini. Le dimensioni, l'altezza e la larghezza di ogni immagine non devono superare rispettivamente 3,75 MB, 8.000 px e 8.000 px.
Puoi includere fino a cinque documenti. Le dimensioni di ogni documento non devono superare i 4,5 MB.
Puoi includere immagini e documenti solo se lo role èuser.

Ogni immagine inclusa in una richiesta viene conteggiata ai fini dell'utilizzo del token. Per ulteriori informazioni, consulta la sezione Costi delle immagini nella Anthropic documentazione.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

AnthropicClaudeAPI di completamento del testo

Uso dell'utensile