Solicitud y respuesta

El cuerpo de la solicitud se pasa en el body campo de una solicitud a InvokeModelo InvokeModelWithResponseStream. El tamaño máximo de la carga útil que puede enviar en una solicitud es de 20 MB.

Para obtener más información, consulta https://docs.anthropic.com/claude/reference/messages_post.

Request

Anthropic Claude tiene los siguientes parámetros de inferencia para realizar una llamada de inferencia de Messages.


{
    "anthropic_version": "bedrock-2023-05-31", 
    "anthropic_beta": ["computer-use-2024-10-22"] 
    "max_tokens": int,
    "system": string,    
    "messages": [
        {
            "role": string,
            "content": [
                { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } },
                { "type": "text", "text": "content text" }
      ]
        }
    ],
    "temperature": float,
    "top_p": float,
    "top_k": int,
    "tools": [
        {
                "type": "custom",
                "name": string,
                "description": string,
                "input_schema": json
            
        },
        { 
            "type": "computer_20241022",  
            "name": "computer", 
            "display_height_px": int,
            "display_width_px": int,
            "display_number": 0 int
        },
        { 
            "type": "bash_20241022", 
            "name": "bash"
        },
        { 
            "type": "text_editor_20241022",
            "name": "str_replace_editor"
        }
        
    ],
    "tool_choice": {
        "type" :  string,
        "name" : string,
    },
    

 
    "stop_sequences": [string]
}

Los siguientes parámetros son obligatorios.

anthropic_version: (obligatorio) es la versión de Anthropic. El valor debe ser bedrock-2023-05-31.
max_tokens: (obligatorio) número máximo de tokens a generar antes de realizar paradas.

Tenga en cuenta que es posible que los modelos Anthropic Claude dejen de generar tokens antes de alcanzar el valor de max_tokens. Los distintos modelos de Anthropic Claude tienen valores máximos diferentes para este parámetro. Para obtener más información, consulte Tabla comparativa de modelos.

messages: (obligatorio) son los mensajes de entrada.

role: es el rol del turno de conversación. Los valores válidos son user y assistant.

Mínimo	Máximo
0	2000

contenido: (obligatorio) El contenido del turno de conversación es un conjunto de objetos. Cada objeto contiene un campo de tipo, en el que puede especificar uno de los siguientes valores:
- text— Si especifica este tipo, debe incluir un campo de texto y especificar el mensaje de texto como su valor. Si otro objeto de la matriz es una imagen, esta solicitud de texto se aplica a las imágenes.
- image— Si especifica este tipo, debe incluir un campo de origen que se asigne a un objeto con los siguientes campos:
  - type: (obligatorio) es el tipo de codificación de la imagen. Puede especificar base64.
  - media_type: (obligatorio) es el tipo de imagen. Puede especificar los siguientes formatos de imagen.
    
    image/jpeg
    
    image/png
    
    image/webp
    
    image/gif
  - data: (obligatorio) son los bytes de la imagen codificados en base64. El tamaño máximo es 3,75 MB. La altura y el ancho máximos de una imagen son 8000 píxeles.

Los siguientes son parámetros opcionales.

system: (opcional) es la petición del sistema para la solicitud.

Una petición del sistema le permite proporcionar contexto e instrucciones a Anthropic Claude, por ejemplo, especificar un objetivo o rol en particular. Para obtener más información, consulte Prompt de sistema en la documentación de Anthropic.

nota
Puede utilizar las peticiones del sistema con Anthropic Claude versión 2.1 o superior.

anthropic_beta — (opcional) El parámetro beta antrópico es una lista de cadenas de encabezados beta que se utilizan para indicar la suscripción a un conjunto concreto de funciones beta.

nota

La variante de 1 millón de fichas con una longitud de contexto de Claude Sonnet 4 está disponible en determinadas AWS regiones como un «servicio beta», tal como se define en las condiciones del servicio. AWS Está sujeto a su acuerdo con AWS él, a las condiciones del AWS servicio y al modelo de EULA aplicable. Consulte la página de precios de Amazon Bedrock para obtener más información sobre los precios para solicitudes de contexto más largas. Se aplican cuotas de servicio independientes (para obtener más información, consulte Service Quotas en AWS Management Console).

Los encabezados de la versión beta disponibles incluyen los siguientes:

Característica beta	Encabezado beta	Notas
Uso del ordenador	`computer-use-2025-01-24`	Compatible conClaude 3.7 Sonnet.
Uso del ordenador	`computer-use-2024-10-22`	Compatible con la Claude 3.5 Sonnet versión 2.
Uso de herramienta	`token-efficient-tools-2025-02-19`	Compatible conClaude 3.7 Sonnet.
Pensamiento intercalado	`Interleaved-thinking-2025-05-14`	Compatible con Claude 4 modelos.
Permite la salida de fichas de hasta 128 K	`output-128k-2025-02-19`	Compatible conClaude 3.7 Sonnet.
Modo desarrollador para pensar sin procesar en Claude 4 modelos	`dev-full-thinking-2025-05-14`	Compatible solo con Claude 4 modelos. Ponte en contacto con el equipo de tu cuenta para acceder a esta versión beta.
1 millón de fichas	`context-1m-2025-08-07`	Compatible con Claude Sonnet 4

stop_sequence: (opcional) secuencias de texto personalizadas que hacen que el modelo deje de generarse. Los modelos Anthropic Claude normalmente se detienen cuando han completado su turno de forma natural; en este caso, el valor del campo de respuesta stop_reason es end_turn. Si desea que el modelo deje de generar cuando encuentre cadenas de texto personalizadas, puede usar el parámetro stop_sequences. Si el modelo encuentra una de las cadenas de texto personalizadas, el valor del campo de respuesta stop_reason es stop_sequence y el valor de stop_sequence contiene la secuencia de paradas correspondiente.

El número máximo de entradas es 8191.

temperature: (opcional) la cantidad de asignación al azar que se inyecta en la respuesta.

Predeterminado/a	Mínimo	Máximo
1	0	1

top_p: (opcional) utilice el muestreo de núcleos.

En el muestreo de núcleos, Anthropic Claude calcula la distribución acumulada entre todas las opciones de cada token subsiguiente en orden de probabilidad decreciente y la corta cuando alcanza una probabilidad determinada especificada por top_p. Al ajustar los parámetros de muestreo, modifique una de temperature las dostop_p. No modifique ambos al mismo tiempo.

Predeterminado/a	Mínimo	Máximo
0.999	0	1

top_k: (opcional) solo una muestra de las opciones K superior para cada token subsiguiente.

Use top_k para eliminar las respuestas de baja probabilidad de cola larga.

Predeterminado/a	Mínimo	Máximo
Está deshabilitado de forma predeterminada.	0	500

tools: /(opcional) definiciones de las herramientas que puede utilizar el modelo.

nota

Requiere un modelo Anthropic Claude 3.

Si incluye tools en su solicitud, es posible que el modelo devuelva bloques de contenido de tool_use que representen el uso de esas herramientas por parte del modelo. A continuación, puede ejecutar esas herramientas con la entrada de herramientas generada por el modelo y, si lo desea, devolver los resultados al modelo mediante bloques de contenido tool_result.

Puede transferir los siguientes tipos de herramientas:

Personalizada

Definición de una herramienta personalizada.

type: (opcional) es el tipo de herramienta. Si está definido, utilice el valor custom.
name: es el nombre de la herramienta.
description: (opcional, pero muy recomendable) es la descripción de la herramienta.
input_schema: es el esquema JSON de la herramienta.

Computadora

Definición de la herramienta informática que se utiliza con la API de Computer Use.

type: el valor debe ser computer_20241022.
name: el valor debe ser computer.

(Obligatorio) display_height_px: es la altura de la pantalla que controla el modelo en píxeles.

Predeterminado/a	Mínimo	Máximo
Ninguno	1	Sin máximo

(Obligatorio) display_width_px: es el ancho de la pantalla que controla el modelo en píxeles.

Predeterminado/a	Mínimo	Máximo
Ninguno	1	Sin máximo

(Opcional) display_number: es el número de pantalla que se va a controlar (solo relevante para los entornos X11). Si se especifica, se proporcionará a la herramienta un número de pantalla en la definición de la herramienta.

Predeterminado/a	Mínimo	Máximo
Ninguno	0	N

bash

Definición de la herramienta Bash que se utiliza con la API de Computer Use.

type: (opcional) el valor debe ser bash_20241022.
name: el valor debe ser bash. La herramienta.

editor de texto

Definición de la herramienta de editor de texto que se utiliza con la API de Computer Use.

type: (opcional) el valor debe ser text_editor_20241022.
name: el valor debe ser str_replace_editor. La herramienta.

tool_choice: (opcional) especifica cómo debe utilizar el modelo las herramientas proporcionadas. El modelo puede usar una herramienta específica, cualquier herramienta disponible o decidir por sí mismo.

nota
Requiere un modelo Anthropic Claude 3.
- type: es el tipo de herramienta elegido. Los valores posibles son any (usar cualquier herramienta disponible), auto (el modelo decide) y tool (usar la herramienta especificada).
- name: (opcional) es el nombre de la herramienta que se va a utilizar. Obligatorio si lo especifica tool en el campo type.

Response

El modelo Anthropic Claude devuelve los siguientes campos para realizar una llamada de inferencia a Messages.


{
    "id": string,
    "model": string,
    "type" : "message",
    "role" : "assistant",
    "content": [
        {
            "type": string,
            "text": string,
            "image" :json,
            "id": string,
            "name":string,
            "input": json
        }
    ],
    "stop_reason": string,
    "stop_sequence": string,
    "usage": {
        "input_tokens": integer,
        "output_tokens": integer
    }
    
}

id: es el identificador único de la respuesta. El formato y la longitud del ID pueden cambiar con el tiempo.
model: el ID del modelo Anthropic Claude que ha realizado la solicitud.
stop_reason: motivo por el que Anthropic Claude ha dejado de generar texto.
- end_turn: el modelo ha alcanzado un punto de parada natural.
- max_tokens: el texto generado ha superado el valor del campo de entrada max_tokens o ha superado el número máximo de tokens que admite el modelo.
- stop_sequence: el modelo ha generado una de las secuencias de parada que ha especificado en el campo de entrada stop_sequences.
stop_sequence: es la secuencia de paradas que ha puesto fin a la generación.
type: es el tipo de respuesta. Este valor siempre es message.
role: es el rol conversacional del mensaje generado. Este valor siempre es assistant.
content: es el contenido generado por el modelo. Se devuelve en forma de matriz. Hay tres tipos de contenido: texto, tool_use e imagen.
- text: es una respuesta de texto.
  - tipo: el tipo de contenido. El valor es text.
  - texto: si el valor de type es texto, contiene el texto del contenido.
- uso de la herramienta: solicitud del modelo para utilizar una herramienta.
  - tipo: el tipo de contenido. El valor es tool_use.
  - id: es el ID de la herramienta que el modelo quiere usar.
  - nombre: contiene el nombre de la herramienta solicitada.
  - input: parámetros de entrada que se van a transferir a la herramienta.
- Imagen: solicitud del modelo para utilizar una herramienta.
  - tipo: el tipo de contenido. El valor es image.
  - fuente: contiene la imagen. Para obtener más información, consulte Peticiones multimodales.
usage: contenedor del número de tokens proporcionados en la solicitud y el número de tokens que el modelo ha generado en la respuesta.
- input_tokens: número de tokens de entrada en la solicitud.
- output_tokens: número de tokens que el modelo ha generado en la respuesta.
- stop_sequence: el modelo ha generado una de las secuencias de parada que ha especificado en el campo de entrada stop_sequences.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Diferencias de pensamiento entre las versiones de los modelos

Ejemplos de código