Data Formulir (Pasangan Nilai Kunci) - Amazon Textract

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Data Formulir (Pasangan Nilai Kunci)

Amazon Textract dapat mengekstrak data formulir dari dokumen sebagai pasangan nilai kunci. Misalnya, dalam teks berikut, Amazon Textract dapat mengidentifikasi kunci (Nama:) dan nilai (Carolina).

Nama: Carolina

Pasangan nilai kunci dikembalikan sebagaiBlockobjek dalam tanggapan dariAnalyzeDocumentdanGetDocumentAnalysis. Anda dapat menggunakanFeatureTypesparameter masukan untuk mengambil informasi tentang pasangan kunci-nilai, tabel, atau keduanya. Untuk pasangan kunci-nilai saja, gunakan nilaiFORMS. Sebagai contoh, lihat Mengekstrak Pasangan Ky-Value dari Dokumen Formulir. Untuk informasi umum tentang bagaimana dokumen diwakili olehBlockbenda, lihatDeteksi Teks dan Dokumen Analisis Respon Objek.

Blokir objek dengan tipe KEY_VALUE_SET adalah wadah untuk objek KEY atau VALUE Block yang menyimpan informasi tentang item teks terkait yang terdeteksi dalam dokumen. Anda dapat menggunakanEntityTypeatribut untuk menentukan apakah blok adalah KEY atau NILAI.

  • SEBUAHKUNCIobjek berisi informasi tentang kunci untuk teks terkait. Misalnya,Nama:. Sebuah blok KEY memiliki dua daftar hubungan. Sebuah hubungan jenis VALUE adalah daftar yang berisi ID dari blok VALUE terkait dengan kunci. Hubungan tipe ANAK adalah daftar ID untuk blok WORD yang membentuk teks kunci.

  • SEBUAHNILAIobjek berisi informasi tentang teks yang terkait dengan kunci. Dalam contoh sebelumnya,Carolinaadalah nilai untuk kunciNama:. Sebuah blok NILAI memiliki hubungan dengan daftar blok ANAK yang mengidentifikasi blok WORD. Setiap blok WORD berisi salah satu kata yang membentuk teks nilai. SEBUAHVALUEobjek juga dapat berisi informasi tentang elemen yang dipilih. Untuk informasi selengkapnya, lihat Elemen Seleksi.

Setiap contoh dari KEY_VALUE_SETBlockobjek adalah anak dari PAGEBlockobjek yang sesuai dengan halaman saat ini.

Diagram berikut menunjukkan bagaimana pasangan nilai kunciNama: Carolinadiwakili olehBlockobjek.

Contoh berikut menunjukkan bagaimana pasangan nilai kunciNama: Carolinadiwakili oleh JSON.

Blok PAGE memiliki blok ANAK tipeKEY_VALUE_SETuntuk setiap KEY dan blok NILAI terdeteksi dalam dokumen.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

JSON berikut menunjukkan bahwa blok KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) memiliki hubungan dengan blok NILAI (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). Ini juga memiliki blok ANAK untuk blok WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ea) yang berisi teks untuk kunci (Nama:).

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

JSON berikut menunjukkan bahwa VALUE blok 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c memiliki daftar ANAK ID untuk blok WORD yang membentuk teks dari nilai (AnadanCarolina).

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

JSON berikut menunjukkanBlockobjek untuk kata-kataNama:,Ana, danCarolina.

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },