Référencer des fichiers génomiques à partir d'une définition de flux de travail - AWS HealthOmics

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Référencer des fichiers génomiques à partir d'une définition de flux de travail

Un objet HealthOmics de magasin de référence peut être référencé à l'aide d'un URI comme celui-ci. Utilisez le vôtre account IDreference store ID, et reference ID là où cela est indiqué.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id

Certains flux de travail nécessiteront à la fois INDEX les fichiers SOURCE et pour le génome de référence. L'URI précédent est la forme abrégée par défaut et sera le fichier SOURCE par défaut. Pour spécifier l'un ou l'autre des fichiers, vous pouvez utiliser le format URI long, comme suit.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/source omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/index

L'utilisation d'un ensemble de lecture de séquences aurait un schéma similaire, comme indiqué.

aws omics create-workflow \ --name workflow name \ --main sample workflow.wdl \ --definition-uri omics://account ID.storage.us-west-2.amazonaws.com/sequence_store_id/readSet/id \ --parameter-template file://parameters_sample_description.json

Certains ensembles de lecture, tels que ceux basés sur FASTQ, peuvent contenir des lectures jumelées. Dans les exemples suivants, ils sont appelés SOURCE1 et SOURCE2. Les formats tels que BAM et CRAM n'auront qu'un SOURCE1 fichier. Certains ensembles de lecture contiendront des fichiers INDEX tels que crai des fichiers bai ou. L'URI précédent est la forme abrégée par défaut et sera le SOURCE1 fichier par défaut. Pour spécifier le fichier ou l'index exact, vous pouvez utiliser le format URI long, comme suit.

omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source1 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source2 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/index

Voici un exemple de fichier JSON d'entrée qui utilise deux Omics Storage URIs.

{ "input_fasta": "omics://123456789012.storage.us-west-2.amazonaws.com/<reference_store_id>/reference/<id>", "input_cram": "omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>" }

Référencez le fichier JSON d'entrée dans le AWS CLI en l'ajoutant --inputs file://<input_file.json> à votre demande de démarrage.