Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menganalisis Dokumentasi Identitas dengan Amazon Textract
Untuk menganalisis dokumen identitas, Anda menggunakan AnalyzeID API, dan meneruskan file dokumen sebagai masukan.AnalyzeID
mengembalikan struktur JSON yang berisi teks yang dianalisis. Untuk informasi selengkapnya, lihat Menganalisis Dokumen Identitas.
Anda dapat menyediakan dokumen input sebagai array bit citra (bit citra yang dikodekan base64), atau sebagai objek Amazon S3. Dalam prosedur ini, Anda mengunggah file citra ke bucket S3 Anda dan menentukan nama file.
Untuk menganalisis dokumen identitas (API)
Jika belum:
Buat atau perbarui pengguna IAM dengan izin AmazonTextractFullAccess
dan AmazonS3ReadOnlyAccess
. Untuk informasi selengkapnya, lihat Langkah 1: Siapkan Akun AWS dan Buat Pengguna IAM.
Instal dan konfigurasikan SDK AWS CLI dan AWS. Untuk informasi selengkapnya, lihat Langkah 2: MenyiapkanAWS CLIdanAWSSDK.
-
Unggah citra yang berisi dokumen ke bucket S3 Anda.
Untuk instruksi, lihatMengunggah Objek ke Amazon S3diPanduan Pengguna Amazon Simple Storage Service.
Gunakan contoh berikut untuk memanggil operasi AnalyzeID
.
- CLI
-
Contoh berikut mengambil dalam file input dari bucket S3 dan menjalankanAnalyzeID
operasi di atasnya. Pada kode di bawah ini, ganti nilaiember
dengan nama bucket S3 Anda, nilaifail
dengan nama file dalam bucket Anda, dan nilaidaerah
dengan namaregion
terkait dengan akun Anda.
aws textract analyze-id --document-pages '[{"S3Object":{"Bucket":"bucket
","Name":"name
"}}]' --region region
Anda juga dapat memanggil API dengan bagian depan dan belakang SIM dengan menambahkan objek S3 lain ke input.
aws textract analyze-id --document-pages '[{"S3Object":{"Bucket":"bucket
","Name":"name front
"}}, {"S3Object":{"Bucket":"bucket
","Name":"name back
"}}]' --region us-east-1
Jika Anda mengakses CLI pada perangkat Windows, gunakan tanda kutip ganda bukan tanda kutip tunggal dan melarikan diri tanda kutip ganda dalam dengan garis miring terbalik (yaitu\) untuk mengatasi kesalahan parser yang mungkin Anda hadapi. Sebagai contoh, lihat di bawah ini:
aws textract analyze-id --document-pages "[{\"S3Object\":{\"Bucket\":\"bucket
\",\"Name\":\"name
\"}}]" --region region
- Python
-
Contoh berikut mengambil dalam file input dari bucket S3 dan menjalankanAnalyzeID
operasi di atasnya, mengembalikan pasangan nilai kunci yang terdeteksi. Pada kode di bawah ini, ganti nilaibucket_name
dengan nama bucket S3 Anda, nilaifile_name
dengan nama file dalam bucket Anda, dan nilaidaerah
dengan namaregion
terkait dengan akun Anda.
import boto3
bucket_name = "bucket-name"
file_name = "file-name"
region = "region-name"
def analyze_id(region, bucket_name, file_name):
textract_client = boto3.client('textract', region_name=region)
response = textract_client.analyze_id(DocumentPages=[{"S3Object":{"Bucket":bucket_name,"Name":file_name}}])
for doc_fields in response['IdentityDocuments']:
for id_field in doc_fields['IdentityDocumentFields']:
for key, val in id_field.items():
if "Type" in str(key):
print("Type: " + str(val['Text']))
for key, val in id_field.items():
if "ValueDetection" in str(key):
print("Value Detection: " + str(val['Text']))
print()
analyze_id(region, bucket_name, file_name)
- Java
-
Contoh berikut mengambil dalam file input dari bucket S3 dan menjalankanAnalyzeID
operasi di atasnya, mengembalikan data yang terdeteksi. Dalam fungsi utama, ganti nilai-nilais3bucket
dansourceDoc
dengan nama bucket Amazon S3 dan citra dokumen yang Anda gunakan pada langkah 2.
/*
Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
SPDX-License-Identifier: Apache-2.0
*/
package com.amazonaws.samples;
import com.amazonaws.regions.Regions;
import com.amazonaws.services.textract.AmazonTextractClient;
import com.amazonaws.services.textract.AmazonTextractClientBuilder;
import com.amazonaws.services.textract.model.*;
import java.util.ArrayList;
import java.util.List;
public class AnalyzeIdentityDocument {
public static void main(String[] args) {
final String USAGE = "\n" +
"Usage:\n" +
" <s3bucket><sourceDoc> \n\n" +
"Where:\n" +
" s3bucket - the Amazon S3 bucket where the document is located. \n" +
" sourceDoc - the name of the document. \n";
if (args.length != 1) {
System.out.println(USAGE);
System.exit(1);
}
String s3bucket = "bucket-name"; //args[0];
String sourceDoc = "sourcedoc-name"; //args[1];
AmazonTextractClient textractClient = (AmazonTextractClient) AmazonTextractClientBuilder.standard()
.withRegion(Regions.US_EAST_1)
.build();
getDocDetails(textractClient, s3bucket, sourceDoc);
}
public static void getDocDetails(AmazonTextractClient textractClient, String s3bucket, String sourceDoc ) {
try {
S3Object s3 = new S3Object();
s3.setBucket(s3bucket);
s3.setName(sourceDoc);
com.amazonaws.services.textract.model.Document myDoc = new com.amazonaws.services.textract.model.Document();
myDoc.setS3Object(s3);
List<Document> list1 = new ArrayList();
list1.add(myDoc);
AnalyzeIDRequest idRequest = new AnalyzeIDRequest();
idRequest.setDocumentPages(list1);
AnalyzeIDResult result = textractClient.analyzeID(idRequest);
List<IdentityDocument> docs = result.getIdentityDocuments();
for (IdentityDocument doc: docs) {
List<IdentityDocumentField>idFields = doc.getIdentityDocumentFields();
for (IdentityDocumentField field: idFields) {
System.out.println("Field type is "+ field.getType().getText());
System.out.println("Field value is "+ field.getValueDetection().getText());
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
-
Ini akan memberi Anda output JSON untukAnalyzeID
operasi.