Pages - Amazon Textract

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pages

Un document est composé d'une ou plusieurs pages. UNBlockobjet de typePAGEexiste pour chaque page du document. UNPAGEbloc objet contient une liste des ID enfants des lignes de texte, des paires clé-valeur et des tables détectées sur la page de document.

Le JSON pour unPAGEressemble à ce qui suit.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", // Line - Hello, world. "82aedd57-187f-43dd-9eb1-4f312ca30042", // Line - How are you? "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

Si vous utilisez des opérations asynchrones avec un document multipage au format PDF, vous pouvez déterminer la page sur laquelle se trouve un bloc en inspectant lePagedu champBlockobjet. Une image numérisée (image au format JPEG, PNG, PDF ou TIFF) est considérée comme un document d'une seule page, même s'il y a plusieurs pages de document sur l'image. Les opérations asynchrones renvoient toujours unPagevaleur 1 pour les images numérisées.

Le nombre total de pages est renvoyé dans laPagesfield ofDocumentMetadata.DocumentMetadataest renvoyé avec chaque liste deBlockobjets renvoyés par une opération Amazon Textract.