GetDocumentTextDetection - Amazon Textract

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

GetDocumentTextDetection

Ottiene i risultati di un'operazione asincrona Amazon Textract che rileva il testo in un documento. Amazon Textract è in grado di rilevare le righe di testo e le parole che costituiscono una riga di testo.

Si avvia il rilevamento asincrono del testo chiamandoStartDocumentTextDetection, che restituisce un identificatore di lavoro (JobId). Al termine dell'operazione di rilevamento del testo, Amazon Textract pubblica uno stato di completamento nell'argomento Amazon Simple Notification Service (Amazon SNS) registrato nella chiamata iniziale aStartDocumentTextDetection. Per ottenere i risultati dell'operazione di rilevamento del testo, verificare innanzitutto che il valore di stato pubblicato nell'argomento Amazon SNS siaSUCCEEDED. Se è così, chiamaGetDocumentTextDetectione passa l'identificativo del processo (JobId) dalla chiamata iniziale aStartDocumentTextDetection.

GetDocumentTextDetectionrestituisce una matrice diBlockoggetti.

Ogni pagina del documento è associataBlockdi tipo PAGE. Ogni PAGINABlockobject è il padre di LINEBlockoggetti che rappresentano le righe del testo rilevato in una pagina. RIGABlockobject è un genitore per ogni parola che compone la riga. Le parole sono rappresentate daBlockoggetti di tipo WORD.

Utilizza il parametro MaxResults per limitare il numero di blocchi restituiti. Se ci sono più risultati di quelli specificati inMaxResults, il valore diNextTokennella risposta operativa contiene un token di impaginazione per ottenere il successivo set di risultati. Per visualizzare la pagina di risultati successiva, chiamaGetDocumentTextDetectione popolare il campo obbligatorioNextTokenparametro request con il valore del token restituito dalla chiamata precedente aGetDocumentTextDetection.

Per ulteriori informazioni, consultaRilevamento del testo documento.

Sintassi della richiesta

{ "JobId": "string", "MaxResults": number, "NextToken": "string" }

Parametri della richiesta

La richiesta accetta i seguenti dati in formato JSON.

JobId

Identificatore univoco per il processo di rilevamento del testo. LaJobIdviene restituito daStartDocumentTextDetection. UNJobIdil valore è valido solo per 7 giorni.

Type: Stringa

Vincoli di lunghezza: Lunghezza minima pari a 1. La lunghezza massima è 64 caratteri.

Modello: ^[a-zA-Z0-9-_]+$

Campo obbligatorio: Sì

MaxResults

Numero massimo di risultati da restituire per ogni chiamata impaginata. Il valore maggiore che puoi specificare è 1.000. Se si specifica un valore maggiore di 1.000, vengono restituiti al massimo 1.000 risultati. Il valore predefinito è 1,000.

Type: Numero intero

Intervallo valido: Valore minimo di 1.

Campo obbligatorio: No

NextToken

Se la risposta precedente era incompleta (perché ci sono più blocchi da recuperare), Amazon Textract restituisce un token di impaginazione nella risposta. È possibile utilizzare questo token di impaginazione per recuperare il successivo set di blocchi.

Type: Stringa

Vincoli di lunghezza: Lunghezza minima pari a 1. Lunghezza massima di 255.

Modello: .*\S.*

Campo obbligatorio: No

Sintassi della risposta

{ "Blocks": [ { "BlockType": "string", "ColumnIndex": number, "ColumnSpan": number, "Confidence": number, "EntityTypes": [ "string" ], "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": "string", "Page": number, "Relationships": [ { "Ids": [ "string" ], "Type": "string" } ], "RowIndex": number, "RowSpan": number, "SelectionStatus": "string", "Text": "string", "TextType": "string" } ], "DetectDocumentTextModelVersion": "string", "DocumentMetadata": { "Pages": number }, "JobStatus": "string", "NextToken": "string", "StatusMessage": "string", "Warnings": [ { "ErrorCode": "string", "Pages": [ number ] } ] }

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

Blocks

I risultati dell'operazione di rilevamento del testo.

Type: Array diBlockoggetti

DetectDocumentTextModelVersion

Type: Stringa

DocumentMetadata

Informazioni su un documento elaborato da Amazon Textract.DocumentMetadataviene restituito in ogni pagina delle risposte impaginate da un'operazione video di Amazon Textract.

Tipo: DocumentMetadata oggetto

JobStatus

Lo stato corrente del processo di rilevamento del testo.

Type: Stringa

Valori validi: IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS

NextToken

Se la risposta viene troncata, Amazon Textract restituisce questo token. È possibile utilizzare questo token nella richiesta seguente per recuperare il successivo set di risultati del rilevamento del testo.

Type: Stringa

Vincoli di lunghezza: Lunghezza minima pari a 1. Lunghezza massima di 255.

Modello: .*\S.*

StatusMessage

Restituisce se non è stato possibile completare il processo di rilevamento. Contiene una spiegazione per quale errore si è verificato.

Type: Stringa

Warnings

Un elenco di avvisi verificati durante l'operazione di rilevamento del testo per il documento.

Type: Array diWarningoggetti

Errori

AccessDeniedException

Non sei autorizzato a eseguire l'operazione. Utilizzare l'ARN (Amazon Resource Name) di un utente autorizzato o un ruolo IAM per eseguire l'operazione.

Codice di stato HTTP: 400

InternalServerError

Amazon Textract ha riscontrato un problema del servizio. Riprova la chiamata.

Codice di stato HTTP: 500

InvalidJobIdException

È stato passato un identificatore di lavoro non validoGetDocumentAnalysiso aGetDocumentAnalysis.

Codice di stato HTTP: 400

InvalidKMSKeyException

Indica che non si dispone delle autorizzazioni di decrittografia con la chiave KMS immessa o che la chiave KMS è stata immessa in modo errato.

Codice di stato HTTP: 400

InvalidParameterException

Un parametro di input ha violato un vincolo. Ad esempio, nelle operazioni sincrone, unInvalidParameterExceptioneccezione si verifica quando nessuno dei dueS3ObjectoBytesi valori sono forniti nelDocumentparametro della richiesta. Convalida il parametro prima di chiamare nuovamente l'operazione API.

Codice di stato HTTP: 400

InvalidS3ObjectException

Amazon Textract non è in grado di accedere all'oggetto S3 specificato nella richiesta. Per ulteriori informazioni,Configura l'accesso a Amazon S3Per informazioni sulla risoluzione dei problemi, consultaRisoluzione dei problemi Amazon S3

Codice di stato HTTP: 400

ProvisionedThroughputExceededException

Il numero di richieste ha superato il limite di throughput. Per aumentare questo limite, contatta Amazon Textract.

Codice di stato HTTP: 400

ThrottlingException

Amazon Textract non è temporaneamente in grado di elaborare la richiesta. Riprova la chiamata.

Codice di stato HTTP: 500

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: