API batch analisis teks - Amazon Comprehend Medical

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

API batch analisis teks

Gunakan Amazon Comprehend Medical untuk menganalisis teks medis yang disimpan dalam ember Amazon S3. Analisis hingga 10 GB dokumen dalam satu batch. Anda menggunakan konsol untuk membuat dan mengelola pekerjaan analisis batch, atau menggunakan API batch untuk mendeteksi entitas medis, termasuk informasi kesehatan yang dilindungi (PHI). API memulai, menghentikan, mencantumkan, dan menjelaskan pekerjaan analisis batch yang sedang berlangsung.

Informasi harga untuk analisis batch dan operasi Amazon Comprehend Medical lainnya dapat ditemukan di sini.

Pemberitahuan penting

Operasi analisis batch Amazon Comprehend Medical bukanlah pengganti saran medis profesional, diagnosis, atau perawatan. Identifikasi ambang kepercayaan yang tepat untuk kasus penggunaan Anda, dan gunakan ambang kepercayaan tinggi dalam situasi yang membutuhkan akurasi tinggi. Untuk kasus penggunaan tertentu, hasil harus ditinjau dan diverifikasi oleh pengulas manusia yang terlatih dengan tepat. Semua operasi Amazon Comprehend Medical hanya boleh digunakan dalam skenario perawatan pasien setelah ditinjau untuk akurasi dan penilaian medis yang baik oleh profesional medis terlatih.

Melakukan analisis batch menggunakan API

Anda dapat menjalankan pekerjaan analisis batch menggunakan konsol Amazon Comprehend Medical atau Amazon Comprehend Medical Batch API.

Prasyarat

Saat Anda menggunakan Amazon Comprehend Medical API, buat kebijakan AWS Identity Access and Management (IAM) dan lampirkan ke peran IAM. Untuk mempelajari lebih lanjut tentang peran IAM dan kebijakan kepercayaan, lihat Kebijakan dan Izin IAM.

  1. Unggah data Anda ke dalam bucket S3.

  2. Untuk memulai pekerjaan analisis baru, gunakan operasi StartEntitiesDetection V2Job atau operasi DetectionJob StartPhi. Saat Anda memulai pekerjaan, beri tahu Amazon Comprehend Medical nama bucket input S3 yang berisi file input dan tentukan bucket S3 keluaran untuk menulis file setelah analisis batch.

  3. Pantau kemajuan pekerjaan dengan menggunakan konsol atau operasi DescribeEntitiesDetection V2Job atau operasi DetectionJob DescribePhi. Selain itu, ListEntitiesDetection V2Jobs dan ListPhi DetectionJobs memungkinkan Anda untuk melihat status semua ontologi yang menghubungkan pekerjaan analisis batch.

  4. Jika Anda perlu menghentikan pekerjaan yang sedang berlangsung, gunakan StopEntitiesDetection V2Job atau StopPhi DetectionJob untuk menghentikan analisis.

  5. Untuk melihat hasil pekerjaan analisis Anda, lihat bucket S3 keluaran yang Anda konfigurasikan saat memulai pekerjaan.

Melakukan analisis batch menggunakan konsol

  1. Unggah data Anda ke dalam bucket S3.

  2. Untuk memulai pekerjaan analisis baru, pilih jenis analisis yang akan Anda lakukan. Kemudian berikan nama bucket S3 yang berisi file input dan nama bucket S3 tempat Anda ingin mengirim file output.

  3. Pantau status pekerjaan Anda saat sedang berlangsung. Dari konsol, Anda dapat melihat semua operasi analisis batch dan statusnya, termasuk kapan analisis dimulai dan berakhir.

  4. Untuk melihat hasil pekerjaan analisis Anda, lihat bucket keluaran S3 yang Anda konfigurasikan saat memulai pekerjaan.

Kebijakan IAM untuk operasi batch

Peran IAM yang memanggil API batch Amazon Comprehend Medical harus memiliki kebijakan yang memberikan akses ke bucket S3 yang berisi file input dan output. Itu juga harus diberi hubungan kepercayaan yang memungkinkan layanan Amazon Comprehend Medical untuk mengambil peran. Untuk mempelajari lebih lanjut tentang peran IAM dan kebijakan kepercayaan, lihat Peran IAM.

Peran harus memiliki kebijakan berikut.

{ "Version": "2012-10-17", "Statement": [ { "Action": [ "s3:GetObject" ], "Resource": [ "arn:aws:s3:::input-bucket/*" ], "Effect": "Allow" }, { "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::input-bucket", "arn:aws:s3:::output-bucket", ], "Effect": "Allow" }, { "Action": [ "s3:PutObject" ], "Resource": [ " arn:aws:s3:::output-bucket/*" ], "Effect": "Allow" } ] }

Peran tersebut harus memiliki hubungan kepercayaan berikut. Disarankan agar Anda menggunakan kunci aws:SourceAccount dan aws:SourceArn kondisi untuk mencegah masalah keamanan wakil yang membingungkan. Untuk mempelajari lebih lanjut tentang masalah wakil yang bingung dan cara melindungi AWS akun Anda, lihat Masalah wakil yang bingung dalam dokumentasi IAM.

{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Principal":{ "Service":[ "comprehendmedical.amazonaws.com" ] }, "Action":"sts:AssumeRole", "Condition": { "StringEquals": { "aws:SourceAccount": "account_id" }, "ArnLike": { "aws:SourceArn": "arn:aws:comprehendmedical:region:account_id:*" } } } ] }

File keluaran analisis Batch

Amazon Comprehend Medical membuat satu file output untuk setiap file input dalam batch. File memiliki ekstensi.out. Amazon Comprehend Medical pertama-tama membuat direktori di bucket output S3 menggunakan AwsAccountIdJobType- JobId- sebagai namanya, dan kemudian menulis semua file output untuk batch ke direktori ini. Amazon Comprehend Medical membuat direktori baru ini sehingga output dari satu pekerjaan tidak menimpa output yang lain.

Output dari operasi batch menghasilkan output yang sama dengan operasi sinkron. Untuk contoh output yang dihasilkan oleh Amazon Comprehend Medical, lihat. Mendeteksi entitas (Versi 2)

Setiap operasi batch menghasilkan tiga file manifes yang berisi informasi tentang pekerjaan.

  • Manifest— Meringkas pekerjaan. Memberikan informasi tentang parameter yang digunakan untuk pekerjaan, ukuran total pekerjaan, dan jumlah file yang diproses.

  • success— Memberikan informasi tentang file yang berhasil diproses. Termasuk nama file input dan output dan ukuran file input.

  • unprocessed— Daftar file yang tidak diproses oleh pekerjaan batch, termasuk kode kesalahan dan pesan kesalahan per file.

Amazon Comprehend Medical menulis file ke direktori output yang Anda tentukan untuk pekerjaan batch. File manifes ringkasan akan ditulis ke folder output, bersama dengan folder berjudulManifest_AccountId-Operation-JobId. Dalam folder manifes adalah success folder, yang berisi manifes sukses. Juga termasuk failed folder, yang berisi manifes file yang belum diproses. Bagian berikut menunjukkan struktur file manifes.

File manifes batch

Berikut ini adalah struktur JSON dari file manifes batch.

{"Summary" : {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", "JobType" : "EntitiesDetection | PHIDetection", "InputDataConfiguration" : { "Bucket" : "input bucket", "Path" : "path to files/account ID-job type-job ID" }, "OutputDataConfiguration" : { "Bucket" : "output bucket", "Path" : "path to files" }, "InputFileCount" : number of files in input bucket, "TotalMeteredCharacters" : total characters processed from all files, "UnprocessedFilesCount" : number of files not processed, "SuccessFilesCount" : total number of files processed, "TotalDurationSeconds" : time required for processing, "SuccessfulFilesListLocation" : "path to file", "UnprocessedFilesListLocation" : "path to file", "FailedJobErrorMessage": "error message or if not applicable, The status of the job is completed" } }

File manifes sukses

Berikut ini adalah struktur JSON dari file yang berisi informasi tentang file yang berhasil diproses.

{ "Files": [{ "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }, { "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }] }

File manifes yang belum diproses

Berikut ini adalah struktur JSON dari file manifes yang berisi informasi tentang file yang belum diproses.

{ "Files" : [ { "Input": "file_name_that_failed", "ErrorCode": "error code for exception", "ErrorMessage": "explanation of the error code and suggestions" }, { ...} ] }