Hacer referencia a los archivos del genoma a partir de una definición de flujo de trabajo - AWS HealthOmics

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Hacer referencia a los archivos del genoma a partir de una definición de flujo de trabajo

Se puede hacer HealthOmics referencia a un objeto de almacén de referencia con un URI como el siguiente. Usa el tuyo propio account ID reference store ID y reference ID donde se indique.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id

Algunos flujos de trabajo requerirán tanto SOURCE los INDEX archivos como los del genoma de referencia. El URI anterior es la forma abreviada predeterminada y, de forma predeterminada, será el archivo FUENTE. Para especificar cualquiera de los archivos, puede utilizar el formulario URI largo, de la siguiente manera.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/source omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/index

El uso de un conjunto de lecturas secuenciales tendría un patrón similar, como se muestra.

aws omics create-workflow \ --name workflow name \ --main sample workflow.wdl \ --definition-uri omics://account ID.storage.us-west-2.amazonaws.com/sequence_store_id/readSet/id \ --parameter-template file://parameters_sample_description.json

Algunos conjuntos de lecturas, como los basados en FASTQ, pueden contener lecturas emparejadas. En los ejemplos siguientes, se denominan SOURCE1 y SOURCE2. Los formatos como BAM y CRAM solo tendrán un SOURCE1 archivo. Algunos conjuntos de lectura contendrán archivos INDEX, como archivos bai ocrai. El URI anterior es la forma abreviada predeterminada y se utilizará de forma predeterminada en el SOURCE1 archivo. Para especificar el archivo o índice exacto, puede utilizar el formulario URI largo, de la siguiente manera.

omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source1 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source2 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/index

El siguiente es un ejemplo de un archivo JSON de entrada que usa dos Omics Storage URIs.

{ "input_fasta": "omics://123456789012.storage.us-west-2.amazonaws.com/<reference_store_id>/reference/<id>", "input_cram": "omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>" }

Haga referencia al archivo JSON de entrada en el AWS CLI agregándolo --inputs file://<input_file.json> a su solicitud de inicio y ejecución.