Apa itu AWS HealthOmics? - AWS HealthOmics

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apa itu AWS HealthOmics?

AWS HealthOmics adalah AWS layanan yang membantu pengguna seperti ahli bioinformatika, peneliti, dan ilmuwan untuk menyimpan, menanyakan, menganalisis, dan menghasilkan wawasan dari genomik dan data biologis lainnya. Ini menyederhanakan dan mempercepat proses penyimpanan dan analisis informasi genom untuk penelitian dan organisasi klinis, dan membuat penemuan ilmiah dan generasi wawasan lebih cepat.

HealthOmics memiliki tiga komponen utama. HealthOmics Penyimpanan membantu Anda menyimpan dan berbagi petabyte data genomik secara efisien dan dengan biaya rendah per gigabase. HealthOmics Analytics menyederhanakan cara Anda menyiapkan data genomik untuk analisis multiomik dan multimodal. HealthOmics Alur kerja secara otomatis menyediakan dan menskalakan infrastruktur yang mendasari komputasi bioinformatika Anda.

Pemberitahuan penting

HealthOmics bukan pengganti saran medis profesional, diagnosis, atau perawatan, dan tidak dimaksudkan untuk menyembuhkan, mengobati, mengurangi, mencegah, atau mendiagnosis penyakit atau kondisi kesehatan apa pun. Anda bertanggung jawab untuk melembagakan tinjauan manusia sebagai bagian dari penggunaan apa pun AWS HealthOmics, termasuk terkait dengan produk pihak ketiga yang dimaksudkan untuk menginformasikan pengambilan keputusan klinis.

HealthOmics dimaksudkan hanya untuk mentransfer, menyimpan, memformat, atau menampilkan data, dan untuk penyediaan infrastruktur dan dukungan konfigurasi untuk mengelola alur kerja. AWS HealthOmics tidak dimaksudkan untuk secara langsung melakukan panggilan varian atau analisis dan interpretasi genom. AWS HealthOmics tidak dimaksudkan untuk menafsirkan atau menganalisis tes laboratorium klinis atau data, hasil, dan temuan perangkat lain, dan bukan pengganti alat pihak ketiga yang dimaksudkan untuk digunakan dalam analisis genom.

HealthOmics konsep

Topik ini mencakup definisi untuk konsep dan istilah kunci yang khusus untuk HealthOmics, untuk membantu Anda memahami terminologi yang HealthOmics digunakan panduan ini.

Penyimpanan

Penyimpanan data dipisahkan menjadi penyimpanan urutan, untuk urutan genomik Anda dan informasi terkait, dan toko referensi, untuk semua genom referensi Anda. Istilah-istilah berikut menjelaskan implementasi yang khusus untuk HealthOmics.

  • Sequence store — Penyimpanan data untuk penyimpanan file genomik. Anda dapat memiliki satu atau lebih toko urutan di dalamnya HealthOmics. Izin akses dan AWS KMS enkripsi dapat diatur pada penyimpanan urutan untuk mengontrol siapa yang memiliki akses ke data.

  • Set baca — Set baca adalah abstraksi pembacaan genomik, yang disimpan dalam format FASTQ, BAM, atau CRAM. Set baca dapat diimpor ke toko urutan dan dianotasi dengan metadata. Anda dapat menerapkan izin untuk membaca set menggunakan kontrol akses berbasis atribut (ABAC).

  • Referensi — Referensi genom digunakan dengan pembacaan untuk mengidentifikasi di mana dalam genom pembacaan tertentu, atau kelompok pembacaan, dipetakan. Ini dalam format FASTA dan disimpan di toko referensi.

  • Toko referensi — Penyimpanan data untuk penyimpanan genom referensi. Anda dapat memiliki satu toko referensi di setiap akun dan wilayah.

Analitik

Anda dapat mengubah dan menganalisis data genomik Anda dengan HealthOmics Analytics. Buat toko varian atau toko anotasi untuk menyertakan informasi tambahan untuk kueri Anda.

  • Toko varian — penyimpanan data yang menyimpan data varian pada skala populasi. Toko varian mendukung input Genomic Variant Call Format (GvCF) dan VCF.

  • Penyimpanan anotasi — Penyimpanan data yang mewakili database anotasi, seperti dari file TSV/CSV, VCF, atau General Feature Format (). GFF3 Toko Anotasi dipetakan ke sistem koordinat yang sama dengan toko varian selama impor.

Alur Kerja

Dengan HealthOmics Alur Kerja, Anda dapat memproses dan menganalisis data genomik Anda.

  • Alur kerja — Definisi keseluruhan dari proses ujung ke ujung termasuk parameter dan referensi ke alat. Definisi alur kerja dapat dinyatakan sebagai WDL, Nextflow, atau CWL. Setiap alur kerja yang dibuat memiliki pengenal unik.

  • Jalankan - Pemanggilan tunggal alur kerja. Run individual menggunakan data input yang Anda tentukan dan menghasilkan output. Setiap run yang dibuat memiliki pengenal unik.

  • Tugas — Proses individu dalam proses. HealthOmics Alur kerja menggunakan spesifikasi komputasi yang ditentukan ini untuk menjalankan tugas Anda. Setiap tugas memiliki pengenal unik.

  • Jalankan grup - Sekelompok run yang dapat Anda atur vCPU maks, durasi maks, atau run bersamaan maks untuk membantu membatasi sumber daya komputasi yang digunakan per proses. Anda dapat menentukan dan mengonfigurasi prioritas untuk menjalankan Anda dalam grup run. Misalnya, Anda dapat menentukan bahwa menjalankan prioritas tinggi akan dilakukan sebelum prioritas yang lebih rendah, menciptakan antrian prioritas. Ini opsional untuk menggunakan Run Group, dan setiap Run Group memiliki pengenal unik.

HealthOmics fitur

HealthOmics menawarkan fitur-fitur berikut.

  • HealthOmics Penyimpanan — membantu Anda menyimpan dan berbagi petabyte data genomik mentah secara efisien dan dengan biaya rendah per gigabase.

  • HealthOmics Analytics — menyederhanakan cara Anda menyiapkan data genomik untuk analisis multiomik dan multimodal.

  • HealthOmics Alur kerja — secara otomatis menyediakan dan menskalakan infrastruktur dasar untuk alur kerja bioinformatika Anda.

Anda dapat menggunakan setiap komponen secara independen, atau sebagai bagian dari end-to-end solusi terintegrasi.

HealthOmics menawarkan Anda manfaat berikut.

  • Simpan dan gabungkan data genom dengan aman — HealthOmics terintegrasi dengan AWS layanan lain seperti dan Amazon AWS Lake Formation Athena. Anda dapat menyimpan data genomik Anda dengan aman dan kemudian menanyakan atau menggabungkannya dengan data riwayat medis untuk diagnosis yang lebih baik dan rencana perawatan yang dipersonalisasi.

  • Lindungi privasi pasien — HealthOmics apakah HIPAA memenuhi syarat. Ini juga terintegrasi dengan IAM dan Amazon CloudWatch sehingga Anda dapat mengontrol dan mencatat akses data, dan melacak bagaimana data digunakan dalam analisis.

  • Dibangun sesuai skala — Mendukung analisis data populasi besar dengan penagihan yang disederhanakan dan alat kolaborasi baru.

  • Maksimalkan efisiensi — Gunakan alur kerja otomatis dan alat terintegrasi untuk merampingkan pemrosesan dan analisis data.

Anda dapat menggunakan HealthOmics untuk aplikasi biomedis berikut:

  • Urutan populasi — Kueri ribuan genom sekaligus untuk memahami bagaimana variasi genom memetakan fenotipe di seluruh populasi.

  • Genomik klinis — Bangun alur kerja genomik yang dapat direproduksi dari output sequencer hingga data yang dapat dilaporkan. Anda juga dapat mengoptimalkan throughput volume tinggi dan menetapkan persyaratan komputasi untuk sampel klinis prioritas tinggi untuk mengurangi waktu penyelesaian.

  • Uji klinis — Integrasikan analisis genom ke dalam uji klinis untuk lebih memahami kemanjuran kandidat obat baru. Menyederhanakan dan mempercepat uji klinis dengan penghematan biaya jangka panjang dan sumber data untuk memenuhi peraturan dari badan pengatur.

  • Tingkatkan penelitian dan inovasi — Merampingkan dan mengontrol penyimpanan, akses, dan analisis data genomik anonim dengan kontrol akses berbasis baris dan kolom bawaan.

Layanan berikut bekerja dengan HealthOmics.

  • Amazon Elastic Container Registry - Setiap alur kerja pribadi menggunakan image Amazon ECR (dalam repositori Amazon ECR pribadi) untuk memuat semua executable, library, dan skrip yang diperlukan untuk menjalankan alur kerja.

  • Amazon Simple Storage Service - Amazon S3 menyediakan penyimpanan file untuk data Store dan Workflow.

  • AWS Lake Formation — Lake Formation mengelola akses data ke penyimpanan data Analytics Anda.

  • Amazon Athena — Gunakan Athena untuk melakukan kueri di toko Varian Anda.

  • Amazon SageMaker AI — Gunakan SageMaker AI untuk menjalankan HealthOmics tugas menggunakan notebook Jupyter.

Wilayah dan titik akhir untuk AWS HealthOmics

Untuk daftar lengkap wilayah dan titik akhir, lihat Referensi AWS Umum.

Selain AWS wilayah yang aktif secara default, ada juga Wilayah Opt-in yang perlu diaktifkan. Untuk mempelajari lebih lanjut tentang cara mengaktifkan atau menonaktifkan Wilayah, lihat Menentukan AWS Wilayah mana yang dapat digunakan akun Anda dalam panduan Manajemen AWS Akun.

Cara mengakses HealthOmics

Anda dapat mengakses AWS HealthOmics fitur menggunakan konsol manajemen, CLI, SDKs atau API.

  • AWS Management Console — Menyediakan antarmuka web yang dapat Anda gunakan untuk mengakses HealthOmics.

  • AWS Command Line Interface (AWS CLI) - Menyediakan perintah untuk serangkaian AWS layanan yang luas, termasuk AWS HealthOmics, dan didukung di Windows, macOS, dan Linux. Untuk informasi lebih lanjut tentang menginstal AWS CLI, lihat AWS Command Line Interface.

  • AWS SDKs — AWS menyediakan SDKs (Kit Pengembangan Perangkat Lunak) yang terdiri dari pustaka dan kode sampel untuk berbagai bahasa dan platform pemrograman (termasuk Java, Python, Ruby, .NET, iOS, dan Android). SDKs Menyediakan cara yang nyaman untuk digunakan secara HealthOmics terprogram. Untuk informasi selengkapnya, lihat Pusat Pengembang AWS SDK.

  • AWS API — Anda dapat menggunakan operasi API untuk mengakses dan mengelola secara HealthOmics terprogram. Untuk informasi lebih lanjut, lihat Referensi API HealthOmics .

Pelajari selengkapnya

Pelajari lebih lanjut HealthOmics dari lokakarya dan tutorial ini:

Menjadi akrab dengan HealthOmics alat tambahan yang AWS menyediakan: