Menganalisis Dokumentasi Identitas dengan Amazon Textract - Amazon Textract

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menganalisis Dokumentasi Identitas dengan Amazon Textract

Untuk menganalisis dokumen identitas, Anda menggunakan AnalyzeID API, dan meneruskan file dokumen sebagai masukan.AnalyzeIDmengembalikan struktur JSON yang berisi teks yang dianalisis. Untuk informasi selengkapnya, lihat Menganalisis Dokumen Identitas.

Anda dapat menyediakan dokumen input sebagai array bit citra (bit citra yang dikodekan base64), atau sebagai objek Amazon S3. Dalam prosedur ini, Anda mengunggah file citra ke bucket S3 Anda dan menentukan nama file.

Untuk menganalisis dokumen identitas (API)
  1. Jika belum:

    1. Buat atau perbarui pengguna IAM dengan izin AmazonTextractFullAccess dan AmazonS3ReadOnlyAccess. Untuk informasi selengkapnya, lihat Langkah 1: Siapkan Akun AWS dan Buat Pengguna IAM.

    2. Instal dan konfigurasikan SDK AWS CLI dan AWS. Untuk informasi selengkapnya, lihat Langkah 2: MenyiapkanAWS CLIdanAWSSDK.

  2. Unggah citra yang berisi dokumen ke bucket S3 Anda.

    Untuk instruksi, lihatMengunggah Objek ke Amazon S3diPanduan Pengguna Amazon Simple Storage Service.

  3. Gunakan contoh berikut untuk memanggil operasi AnalyzeID.

    CLI

    Contoh berikut mengambil dalam file input dari bucket S3 dan menjalankanAnalyzeIDoperasi di atasnya. Pada kode di bawah ini, ganti nilaiemberdengan nama bucket S3 Anda, nilaifaildengan nama file dalam bucket Anda, dan nilaidaerahdengan namaregionterkait dengan akun Anda.

    aws textract analyze-id --document-pages '[{"S3Object":{"Bucket":"bucket","Name":"name"}}]' --region region

    Anda juga dapat memanggil API dengan bagian depan dan belakang SIM dengan menambahkan objek S3 lain ke input.

    aws textract analyze-id --document-pages '[{"S3Object":{"Bucket":"bucket","Name":"name front"}}, {"S3Object":{"Bucket":"bucket","Name":"name back"}}]' --region us-east-1

    Jika Anda mengakses CLI pada perangkat Windows, gunakan tanda kutip ganda bukan tanda kutip tunggal dan melarikan diri tanda kutip ganda dalam dengan garis miring terbalik (yaitu\) untuk mengatasi kesalahan parser yang mungkin Anda hadapi. Sebagai contoh, lihat di bawah ini:

    aws textract analyze-id --document-pages "[{\"S3Object\":{\"Bucket\":\"bucket\",\"Name\":\"name\"}}]" --region region
    Python

    Contoh berikut mengambil dalam file input dari bucket S3 dan menjalankanAnalyzeIDoperasi di atasnya, mengembalikan pasangan nilai kunci yang terdeteksi. Pada kode di bawah ini, ganti nilaibucket_namedengan nama bucket S3 Anda, nilaifile_namedengan nama file dalam bucket Anda, dan nilaidaerahdengan namaregionterkait dengan akun Anda.

    import boto3 bucket_name = "bucket-name" file_name = "file-name" region = "region-name" def analyze_id(region, bucket_name, file_name): textract_client = boto3.client('textract', region_name=region) response = textract_client.analyze_id(DocumentPages=[{"S3Object":{"Bucket":bucket_name,"Name":file_name}}]) for doc_fields in response['IdentityDocuments']: for id_field in doc_fields['IdentityDocumentFields']: for key, val in id_field.items(): if "Type" in str(key): print("Type: " + str(val['Text'])) for key, val in id_field.items(): if "ValueDetection" in str(key): print("Value Detection: " + str(val['Text'])) print() analyze_id(region, bucket_name, file_name)
    Java

    Contoh berikut mengambil dalam file input dari bucket S3 dan menjalankanAnalyzeIDoperasi di atasnya, mengembalikan data yang terdeteksi. Dalam fungsi utama, ganti nilai-nilais3bucketdansourceDocdengan nama bucket Amazon S3 dan citra dokumen yang Anda gunakan pada langkah 2.

    /* Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved. SPDX-License-Identifier: Apache-2.0 */ package com.amazonaws.samples; import com.amazonaws.regions.Regions; import com.amazonaws.services.textract.AmazonTextractClient; import com.amazonaws.services.textract.AmazonTextractClientBuilder; import com.amazonaws.services.textract.model.*; import java.util.ArrayList; import java.util.List; public class AnalyzeIdentityDocument { public static void main(String[] args) { final String USAGE = "\n" + "Usage:\n" + " <s3bucket><sourceDoc> \n\n" + "Where:\n" + " s3bucket - the Amazon S3 bucket where the document is located. \n" + " sourceDoc - the name of the document. \n"; if (args.length != 1) { System.out.println(USAGE); System.exit(1); } String s3bucket = "bucket-name"; //args[0]; String sourceDoc = "sourcedoc-name"; //args[1]; AmazonTextractClient textractClient = (AmazonTextractClient) AmazonTextractClientBuilder.standard() .withRegion(Regions.US_EAST_1) .build(); getDocDetails(textractClient, s3bucket, sourceDoc); } public static void getDocDetails(AmazonTextractClient textractClient, String s3bucket, String sourceDoc ) { try { S3Object s3 = new S3Object(); s3.setBucket(s3bucket); s3.setName(sourceDoc); com.amazonaws.services.textract.model.Document myDoc = new com.amazonaws.services.textract.model.Document(); myDoc.setS3Object(s3); List<Document> list1 = new ArrayList(); list1.add(myDoc); AnalyzeIDRequest idRequest = new AnalyzeIDRequest(); idRequest.setDocumentPages(list1); AnalyzeIDResult result = textractClient.analyzeID(idRequest); List<IdentityDocument> docs = result.getIdentityDocuments(); for (IdentityDocument doc: docs) { List<IdentityDocumentField>idFields = doc.getIdentityDocumentFields(); for (IdentityDocumentField field: idFields) { System.out.println("Field type is "+ field.getType().getText()); System.out.println("Field value is "+ field.getValueDetection().getText()); } } } catch (Exception e) { e.printStackTrace(); } } }
  4. Ini akan memberi Anda output JSON untukAnalyzeIDoperasi.