Veja os resultados de um trabalho de inferência em lote - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Veja os resultados de um trabalho de inferência em lote

Após o término de um trabalho de inferência em loteCompleted, você pode extrair os resultados do trabalho de inferência em lote dos arquivos no bucket do Amazon S3 que você especificou durante a criação do trabalho. Para saber como baixar um objeto do S3, consulte Como baixar objetos. O bucket do S3 especificado contém os seguintes arquivos de dados:

  1. O Amazon Bedrock gera um JSONL arquivo de saída para cada JSONL arquivo de entrada. Os arquivos de saída contêm as saídas do modelo para cada entrada no formato a seguir. Um objeto error substitui o campo modelOutput em todas as linhas em que houve erro na inferência. O formato do modelOutput JSON objeto corresponde ao body campo do modelo que você usa na InvokeModel resposta. Para obter mais informações, consulte Parâmetros de solicitação de inferência e campos de resposta para modelos básicos.

    { "recordId" : "11 character alphanumeric string", "modelInput": {JSON body}, "modelOutput": {JSON body} }

    O exemplo a seguir mostra um arquivo de saída possível.

    { "recordId" : "3223593EFGH", "modelInput" : {"inputText": "Roses are red, violets are"}, "modelOutput" : {'inputTextTokenCount': 8, 'results': [{'tokenCount': 3, 'outputText': 'blue\n', 'completionReason': 'FINISH'}]}} { "recordId" : "1223213ABCD", "modelInput" : {"inputText": "Hello world"}, "error" : {"errorCode" : 400, "errorMessage" : "bad request" }}
  2. Um arquivo manifest.json.out com um resumo do trabalho de inferência em lote.

    { "totalRecordCount" : number, "processedRecordCount" : number, "successRecordCount": number, "errorRecordCount": number, "inputTokenCount": number, "outputTokenCount" : number }

    Os campos são descritos abaixo:

    • totalRecordCount — O número total de registros enviados ao trabalho de inferência em lote.

    • processedRecordCount — O número de registros processados no trabalho de inferência em lote.

    • successRecordCount — O número de registros processados com sucesso pelo trabalho de inferência em lote.

    • errorRecordCount — O número de registros no trabalho de inferência em lote que causaram erros.

    • inputTokenCount — O número total de tokens de entrada enviados ao trabalho de inferência em lote.

    • outputTokenCount — O número total de tokens de saída gerados pelo trabalho de inferência em lote.