Menganalisis Faktur dan Penerimaan - Amazon Textract

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menganalisis Faktur dan Penerimaan

Amazon Textract mengekstrak data yang relevan seperti informasi kontak, item yang dibeli, dan nama vendor, dari hampir semua faktur atau tanda terima tanpa memerlukan templat atau konfigurasi apa pun. Faktur dan tanda terima sering menggunakan berbagai tata letak, sehingga sulit dan memakan waktu untuk mengekstrak data secara manual dalam skala besar. Amazon Textract menggunakan ML-nya untuk memahami konteks faktur dan tanda terima serta secara otomatis mengekstrak data seperti tanggal faktur atau tanda terima, nomor faktur atau tanda terima, harga barang, jumlah total, dan persyaratan pembayaran yang sesuai dengan kebutuhan bisnis Anda.

Amazon Textract juga mengidentifikasi nama vendor yang sangat penting untuk alur kerja Anda tetapi mungkin tidak diberi label secara eksplisit. Misalnya, Amazon Textract dapat menemukan nama vendor pada tanda terima meskipun hanya ditunjukkan dalam logo di bagian atas halaman tanpa kombinasi pasangan nilai kunci eksplisit. Amazon Textract juga memudahkan Anda untuk mengkonsolidasikan masukan dari beragam tanda terima dan faktur yang menggunakan kata berbeda untuk konsep yang sama. Misalnya, Amazon Textract memetakan hubungan antara nama lapangan dalam dokumen yang berbeda seperti nomor pelanggan, nomor pelanggan, dan ID akun, menampilkan taksonomi standar sebagaiINVOICE_RECEIPT_ID. Dalam hal ini, Amazon Textract mewakili data secara konsisten di berbagai jenis dokumen. Bidang yang tidak sejajar dengan taksonomi standar dikategorikan sebagaiOTHER.

Berikut ini adalah daftar bidang standar yang AnalyzeExpense saat ini mendukung:

  • Nama Vendor:VENDOR_NAME

  • Total:TOTAL

  • Alamat Penerima:RECEIVER_ADDRESS

  • Tanggal Faktur/Tanda Terima:INVOICE_RECEIPT_DATE

  • Faktur/Tanda Terima ID:INVOICE_RECEIPT_ID

  • Ketentuan Pembayaran:PAYMENT_TERMS

  • Subtotal:SUBTOTAL

  • Tanggal jatuh tempo:DUE_DATE

  • Pajak:TAX

  • ID Pembayar Pajak Faktur (SSN/ITIN atau EIN):TAX_PAYER_ID

  • Nama Item:ITEM_NAME

  • Harga Item:PRICE

  • Kuantitas Item:QUANTITY

AnalyzeExpense API mengembalikan elemen berikut untuk halaman dokumen yang diberikan:

  • Jumlah penerimaan atau faktur dalam halaman diwakili sebagaiExpenseIndex

  • Nama standar untuk bidang individu direpresentasikan sebagaiType

  • Nama sebenarnya dari bidang seperti yang muncul pada dokumen, direpresentasikan sebagaiLabelDetection

  • Nilai bidang yang sesuai direpresentasikan sebagaiValueDetection

  • Jumlah halaman dalam dokumen yang diajukan direpresentasikan sebagaiPages

  • Nomor halaman di mana bidang, nilai, atau item baris terdeteksi, direpresentasikan sebagaiPageNumber

  • Geometri, yang mencakup kotak pembatas dan mengkoordinasikan lokasi bidang individu, nilai, atau item baris pada halaman, direpresentasikan sebagaiGeometry

  • Skor kepercayaan yang terkait dengan setiap bagian dari data yang terdeteksi pada dokumen, direpresentasikan sebagaiConfidence

  • Seluruh baris item baris individu yang dibeli, direpresentasikan sebagaiEXPENSE_ROW

Berikut ini adalah sebagian dari output API untuk tanda terima yang diproses oleh AnalyzeExpense yang menunjukkan Total: $55.64 dalam dokumen yang diekstrak sebagai bidang standarTOTAL, teks aktual pada dokumen sebagai “Total”, Keyakinan Skor “97.1”, Halaman Nomor “1", Nilai total sebagai “$55.64" dan kotak pembatas dan koordinat poligon:

{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }

Anda dapat menggunakan operasi sinkron untuk menganalisis faktur atau tanda terima. Untuk menganalisis dokumen-dokumen ini, Anda menggunakan operasi AnalyzeExpense dan memberikan tanda terima atau faktur untuk itu.AnalyzeExpensemengembalikan seluruh rangkaian hasil. Untuk informasi selengkapnya, lihat Menganalisis Faktur dan Penerimaan dengan Amazon Textract.

Untuk menganalisis faktur dan tanda terima secara asinkron, gunakanStartExpenseAnalysisuntuk mulai memproses file dokumen input. Untuk mendapatkan hasilnya, hubungiGetExpenseAnalysis. Hasil untuk panggilan yang diberikan keStartExpenseAnalysisdikembalikan olehGetExpenseAnalysis. Untuk informasi lebih lanjut dan contoh, lihat Memproses Dokumen dengan Operasi Asynchronous.