Criação de trabalhos de importação de lojas HealthOmics variantes - AWS HealthOmics

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de trabalhos de importação de lojas HealthOmics variantes

O exemplo a seguir mostra como usar o AWS CLI para criar um trabalho de importação para um armazenamento de variantes.

aws omics start-variant-import-job \ --destination-name myvariantstore \ --runLeftNormalization false \ --role-arn arn:aws:iam::55555555555:role/roleName \ --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
{ "destinationName": "store_a", "roleArn": "....", "runLeftNormalization": false, "items": [ {"source": "s3://my-omics-bucket/sample.vcf.gz"}, {"source": "s3://my-omics-bucket/sample2.vcf.gz"} ] }

Para lojas criadas após 15 de maio de 2023, o exemplo a seguir mostra como adicionar o --annotation-fields parâmetro. Os campos de anotação são definidos com a importação.

aws omics start-variant-import-job \ --destination-name annotationparsingvariantstore \ --role-arn arn:aws:iam::123456789012:role/<role_name> \ --items source=s3://pathToS3/sample.vcf --annotation-fields '{"VEP": "CSQ"}'
{ "jobId": "981e2286-e954-4391-8a97-09aefc343861" }

Use get-variant-import-jobpara verificar o status.

aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229

Você receberá uma resposta JSON que mostra o status do seu trabalho de importação. As anotações VEP no VCF são analisadas em busca de informações armazenadas na coluna INFO como um par. ID/Value O ID padrão da coluna INFO de anotações do Ensembl Variant Effect Predictor é CSQ, mas você pode usar o --annotation-fields parâmetro para indicar um valor personalizado usado na coluna INFO. Atualmente, a análise é suportada para anotações VEP.

Para uma loja criada antes de 15 de maio de 2023 ou para arquivos VCF que não incluem a anotação VEP, a resposta não inclui nenhum campo de anotação.

{ "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "items": [ { "jobStatus": "COMPLETED", "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf" } ], "roleArn": "arn:aws:iam::555555555555:role/<role_name>", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", }

As anotações VEP que fazem parte dos arquivos VCF são armazenadas como um esquema predefinido com a estrutura a seguir. O campo extras pode ser usado para armazenar quaisquer campos VEP adicionais que não estejam incluídos no esquema padrão.

annotations struct< vep: array<struct< allele:string, consequence: array<string>, impact:string, symbol:string, gene:string, `feature_type`: string, feature: string, biotype: string, exon: struct<rank:string, total:string>, intron: struct<rank:string, total:string>, hgvsc: string, hgvsp: string, `cdna_position`: string, `cds_position`: string, `protein_position`: string, `amino_acids`: struct<reference:string, variant: string>, codons: struct<reference:string, variant: string>, `existing_variation`: array<string>, distance: string, strand: string, flags: array<string>, symbol_source: string, hgnc_id: string, `extras`: map<string, string> >> >

A análise é executada com a abordagem de melhor esforço. Se a entrada do VEP não seguir as especificações padrão do VEP, ela não será analisada e a linha na matriz ficará vazia.

Para um novo armazenamento de variantes, a resposta para get-variant-import-jobincluiria os campos de anotação, conforme mostrado.

aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229

Você recebe uma resposta JSON que mostra o status do seu trabalho de importação.

{ "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "items": [ { "jobStatus": "COMPLETED", "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf" } ], "roleArn": "arn:aws:iam::123456789012:role/<role_name>", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", "annotationFields" : {"VEP": "CSQ"} } }

Você pode usar list-variant-import-jobspara ver todos os trabalhos de importação e seus status.

aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea

A resposta contém as informações a seguir.

{ "variantImportJobs": [ { "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "roleArn": "arn:aws:iam::55555555555:role/roleName", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", "annotationFields" : {"VEP": "CSQ"} } ] } }

Se necessário, você pode cancelar um trabalho de importação com o comando a seguir.

aws omics cancel-variant-import-job --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508