Pagine - Amazon Textract

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Pagine

Un documento è costituito da una o più pagine. UNBlockOggetto di tipoPAGEesiste per ogni pagina del documento. UNPAGEblock object contiene un elenco degli ID figlio per le righe di testo, le coppie chiave-valore e le tabelle rilevate nella pagina del documento.

Il JSON per unPAGEIl blocco è simile a quello riportato di seguito.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world. "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you? "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

Se si utilizzano operazioni asincrone con un documento multipagina in formato PDF, è possibile determinare la pagina in cui si trova un blocco ispezionando ilPagedel campoBlockoggetto. Un'immagine scansionata (un'immagine in formato JPEG, PNG, PDF o TIFF) è considerata un documento a pagina singola, anche se nell'immagine è presente più di una pagina del documento. Le operazioni asincrone restituiscono sempre unPagevalore di 1 per le immagini scansionate.

Il numero totale di pagine viene restituito nelPagescampo diDocumentMetadata.DocumentMetadataviene restituito con ogni elenco diBlockoggetti restituiti da un'operazione Amazon Textract.