Referenciando arquivos de genoma a partir de uma definição de fluxo de trabalho - AWS HealthOmics

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Referenciando arquivos de genoma a partir de uma definição de fluxo de trabalho

Um objeto de armazenamento de HealthOmics referência pode ser referenciado com um URI como o seguinte. Use o seu próprio account IDreference store ID, e reference ID onde indicado.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id

Alguns fluxos de trabalho exigirão INDEX arquivos SOURCE e para o genoma de referência. O URI anterior é o formato abreviado padrão e usará como padrão o arquivo SOURCE. Para especificar qualquer um dos arquivos, você pode usar o formulário URI longo, da seguinte forma.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/source omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/index

Usar um conjunto de leitura de sequência teria um padrão semelhante, conforme mostrado.

aws omics create-workflow \ --name workflow name \ --main sample workflow.wdl \ --definition-uri omics://account ID.storage.us-west-2.amazonaws.com/sequence_store_id/readSet/id \ --parameter-template file://parameters_sample_description.json

Alguns conjuntos de leitura, como os baseados no FASTQ, podem conter leituras emparelhadas. Nos exemplos a seguir, eles são chamados de SOURCE1 SOURCE2 e. Formatos como BAM e CRAM terão apenas um SOURCE1 arquivo. Alguns conjuntos de leitura conterão arquivos INDEX, como crai arquivos bai ou. O URI anterior é o formato abreviado padrão e usará o SOURCE1 arquivo como padrão. Para especificar o arquivo ou índice exato, você pode usar o formato URI longo, da seguinte forma.

omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source1 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source2 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/index

Veja a seguir um exemplo de um arquivo JSON de entrada que usa dois Omics Storage. URIs

{ "input_fasta": "omics://123456789012.storage.us-west-2.amazonaws.com/<reference_store_id>/reference/<id>", "input_cram": "omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>" }

Faça referência ao arquivo JSON de entrada no AWS CLI adicionando --inputs file://<input_file.json> à sua solicitação de início de execução.