Pagine

Un documento è costituito da una o più pagine. UNBlockOggetto di tipoPAGEesiste per ogni pagina del documento. UNPAGEblock object contiene un elenco degli ID figlio per le righe di testo, le coppie chiave-valore e le tabelle rilevate nella pagina del documento.

Il JSON per unPAGEIl blocco è simile a quello riportato di seguito.


{

    "Geometry": .... 
    "Relationships": [
        {
            "Type": "CHILD", 
            "Ids": [
                "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world.
                "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you?
                "52be1777-53f7-42f6-a7cf-6d09bdc15a30", 
                "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c"   
            ]
        }
    ], 
    "BlockType": "PAGE", 
    "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97"  // Page identifier
},

Se si utilizzano operazioni asincrone con un documento multipagina in formato PDF, è possibile determinare la pagina in cui si trova un blocco ispezionando ilPagedel campoBlockoggetto. Un'immagine scansionata (un'immagine in formato JPEG, PNG, PDF o TIFF) è considerata un documento a pagina singola, anche se nell'immagine è presente più di una pagina del documento. Le operazioni asincrone restituiscono sempre unPagevalore di 1 per le immagini scansionate.

Il numero totale di pagine viene restituito nelPagescampo diDocumentMetadata.DocumentMetadataviene restituito con ogni elenco diBlockoggetti restituiti da un'operazione Amazon Textract.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Oggetti di risposta di rilevamento del testo e analisi dei documenti

Linee e parole di testo