Qu'est-ce que c'est AWS HealthOmics ? - AWS HealthOmics

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce que c'est AWS HealthOmics ?

AWS HealthOmics est un AWS service qui aide les utilisateurs tels que les bioinformaticiens, les chercheurs et les scientifiques à stocker, interroger, analyser et générer des informations à partir de données génomiques et d'autres données biologiques. Il simplifie et accélère le processus de stockage et d'analyse des informations génomiques pour les organismes de recherche et cliniques, et accélère les découvertes scientifiques et la génération de connaissances.

HealthOmics comporte trois composants principaux. HealthOmics Le stockage vous permet de stocker et de partager des pétaoctets de données génomiques de manière efficace et à faible coût par gigabase. HealthOmics L'analytique simplifie la préparation des données génomiques pour les analyses multiomiques et multimodales. HealthOmics Les flux de travail provisionnent et dimensionnent automatiquement l'infrastructure sous-jacente pour vos calculs bioinformatiques.

Avis important

HealthOmics ne remplace pas un avis médical, un diagnostic ou un traitement professionnel et n'est pas destiné à guérir, traiter, atténuer, prévenir ou diagnostiquer une maladie ou un problème de santé. Il vous incombe de procéder à un examen humain dans le cadre de toute utilisation de tout produit tiers destiné à éclairer la prise de décisions cliniques AWS HealthOmics, y compris en association avec celui-ci.

HealthOmics est uniquement destiné au transfert, au stockage, au formatage ou à l'affichage de données, ainsi qu'à la fourniture d'une infrastructure et d'un support de configuration pour la gestion des flux de travail. AWS HealthOmics n'est pas destiné à effectuer directement l'appel de variants ou l'analyse et l'interprétation génomiques. AWS HealthOmics n'est pas destiné à interpréter ou à analyser des tests de laboratoire clinique ou d'autres données, résultats et résultats de dispositifs, et ne remplace pas les outils tiers destinés à être utilisés dans les analyses génomiques.

HealthOmics concepts

Cette rubrique décrit les définitions des principaux concepts et termes spécifiques à HealthOmics, afin de vous aider à comprendre la terminologie HealthOmics utilisée dans ce guide.

Stockage

Le stockage des données est séparé en magasins de séquences, pour vos séquences génomiques et les informations connexes, et en un magasin de référence, pour tous vos génomes de référence. Les termes suivants décrivent les implémentations spécifiques à HealthOmics.

  • Magasin de séquences : magasin de données pour le stockage de fichiers génomiques. Vous pouvez y inclure un ou plusieurs magasins de séquences HealthOmics. Les autorisations d'accès et le AWS KMS chiffrement peuvent être définis sur un magasin de séquences pour contrôler qui a accès aux données.

  • Ensemble de lectures — Un jeu de lectures est une abstraction des lectures génomiques, qui sont stockées aux formats FASTQ, BAM ou CRAM. Les ensembles de lectures peuvent être importés dans des magasins de séquences et annotés à l'aide de métadonnées. Vous pouvez appliquer des autorisations aux ensembles de lecture à l'aide du contrôle d'accès basé sur les attributs (ABAC).

  • Référence — Une référence génomique est utilisée avec les lectures pour identifier à quel endroit d'un génome une lecture spécifique, ou un groupe de lectures, est mappé. Ils sont au format FASTA et stockés dans le magasin de référence.

  • Magasin de référence — Un magasin de données pour le stockage des génomes de référence. Vous pouvez avoir un seul magasin de référence pour chaque compte et chaque région.

Analyse

Vous pouvez transformer et analyser vos données génomiques grâce à HealthOmics Analytics. Créez un magasin de variantes ou un magasin d'annotations pour inclure des informations supplémentaires pour vos requêtes.

  • Magasin de variantes : magasin de données qui stocke les données des variantes à l'échelle de la population. Les magasins de variants prennent en charge à la fois le format d'appel de variants génomique (GvCF) et les entrées VCF.

  • Magasin d'annotations : magasin de données représentant une base de données d'annotations, telle qu'une base de données provenant d'un fichier TSV/CSV, VCF ou General Feature Format ()GFF3. Les magasins d'annotations sont mappés sur le même système de coordonnées que les magasins de variantes lors d'une importation.

Flux de travail

Avec HealthOmics Workflows, vous pouvez traiter et analyser vos données génomiques.

  • Flux de travail : définition globale d'un processus de bout en bout, y compris les paramètres et les références aux outils. Les définitions de flux de travail peuvent être exprimées sous la forme WDL, Nextflow ou CWL. Chaque flux de travail créé possède un identifiant unique.

  • Exécuter : appel unique d'un flux de travail. Une exécution individuelle utilise les données d'entrée que vous avez définies et produit une sortie. Chaque course créée possède un identifiant unique.

  • Tâche : processus individuels au cours d'une exécution. HealthOmics Les flux de travail utilisent ces spécifications de calcul définies pour exécuter votre tâche. Chaque tâche possède un identifiant unique.

  • Groupe d'exécutions : groupe d'exécutions pour lequel vous pouvez définir le nombre maximal de vCPU, la durée maximale ou le nombre maximum d'exécutions simultanées afin de limiter les ressources de calcul utilisées par exécution. Vous pouvez spécifier et configurer les priorités de vos courses au sein d'un groupe d'exécutions. Par exemple, vous pouvez spécifier qu'une exécution de priorité élevée sera effectuée avant une exécution de priorité inférieure, créant ainsi une file d'attente prioritaire. L'utilisation d'un groupe d'exécution est facultative, et chaque groupe d'exécution possède un identifiant unique.

HealthOmics features

HealthOmics propose les fonctionnalités suivantes.

  • HealthOmics Stockage : vous permet de stocker et de partager des pétaoctets de données génomiques brutes de manière efficace et à faible coût par gigabase.

  • HealthOmics Analytique : simplifie la façon dont vous préparez les données génomiques pour les analyses multiomiques et multimodales.

  • HealthOmics Flux de travail : provisionne et adapte automatiquement l'infrastructure sous-jacente pour vos flux de travail bioinformatiques.

Vous pouvez utiliser chaque composant indépendamment ou dans le cadre d'une end-to-end solution intégrée.

HealthOmics vous offre les avantages suivants.

  • Stockez et combinez les données génomiques en toute sécurité. HealthOmics S'intègre à d'autres AWS services tels qu' AWS Lake Formation Amazon Athena. Vous pouvez stocker en toute sécurité vos données génomiques, puis les interroger ou les combiner avec les données des antécédents médicaux pour de meilleurs diagnostics et des plans de traitement personnalisés.

  • Protégez la vie privée des patients : HealthOmics est-ce éligible à la loi HIPAA. Il s'intègre également à IAM et Amazon CloudWatch afin que vous puissiez contrôler et enregistrer l'accès aux données, et suivre la manière dont les données sont utilisées dans les analyses.

  • Conçu à grande échelle : Supportez les analyses de données de grandes populations grâce à une facturation simplifiée et à de nouveaux outils de collaboration.

  • Maximisez l'efficacité : utilisez des flux de travail automatisés et des outils intégrés pour rationaliser le traitement et l'analyse des données.

Vous pouvez l'utiliser HealthOmics pour les applications biomédicales suivantes :

  • Séquençage des populations — Interrogez des milliers de génomes à la fois pour comprendre comment la variation génomique correspond aux phénotypes d'une population.

  • Génomique clinique — Créez des flux de travail génomiques reproductibles, des résultats du séquenceur aux données déclarables. Vous pouvez également optimiser un débit élevé et définir les exigences de calcul pour les échantillons cliniques prioritaires afin de réduire les délais d'exécution.

  • Essais cliniques — Intégrez l'analyse du génome aux essais cliniques afin de mieux comprendre l'efficacité des nouveaux médicaments candidats. Simplifiez et accélérez les essais cliniques grâce à des économies de coûts à long terme et à la provenance des données afin de respecter les réglementations des organes directeurs.

  • Améliorez la recherche et l'innovation : rationalisez et contrôlez le stockage, l'accès et l'analyse des données génomiques anonymisées grâce au contrôle d'accès intégré basé sur les lignes et les colonnes.

Les services suivants fonctionnent avec HealthOmics.

  • Amazon Elastic Container Registry : chaque flux de travail privé utilise une image Amazon ECR (dans un référentiel Amazon ECR privé) pour contenir tous les exécutables, bibliothèques et scripts nécessaires à l'exécution du flux de travail.

  • Amazon Simple Storage Service — Amazon S3 fournit un stockage de fichiers pour les données du magasin et du flux de travail.

  • AWS Lake Formation — Lake Formation gère l'accès aux données de vos magasins de données Analytics.

  • Amazon Athena — Utilisez Athena pour effectuer des requêtes sur vos boutiques Variant.

  • Amazon SageMaker AI — Utilisez l' SageMaker IA pour exécuter des HealthOmics tâches à l'aide des blocs-notes Jupyter.

Régions et points de terminaison pour AWS HealthOmics

Pour une liste complète des régions et des points de terminaison, consultez la référence AWS générale.

Outre les AWS régions actives par défaut, il existe également des régions optionnelles qui doivent être activées. Pour en savoir plus sur l'activation ou la désactivation d'une région, voir Spécifier AWS les régions que votre compte peut utiliser dans le guide de gestion de AWS compte.

Comment accéder HealthOmics

Vous pouvez accéder aux AWS HealthOmics fonctionnalités à l'aide de la console de gestion, de la CLI SDKs ou de l'API.

  • AWS Console de gestion : fournit une interface Web à laquelle vous pouvez accéder HealthOmics.

  • AWS Command Line Interface (AWS CLI) — Fournit des commandes pour un large éventail de AWS services, notamment AWS HealthOmics, et est compatible avec Windows, macOS et Linux. Pour plus d'informations sur l'installation du AWS CLI, consultez AWS Command Line Interface.

  • AWS SDKs — AWS fournit SDKs (kits de développement logiciel) composés de bibliothèques et d'exemples de code pour différents langages de programmation et plateformes (notamment Java, Python, Ruby, .NET, iOS et Android). Ils SDKs fournissent un moyen pratique d'utiliser HealthOmics par programmation. Pour plus d'informations, consultez le AWS SDK Developer Center.

  • AWS API — Vous pouvez utiliser les opérations d'API pour accéder et gérer HealthOmics par programmation. Pour plus d’informations, consultez la page Référence de l’API HealthOmics .

En savoir plus

Apprenez-en davantage HealthOmics grâce à ces ateliers et tutoriels :

Familiarisez-vous avec HealthOmics les outils supplémentaires qui AWS fournissent :