Création de tâches d'importation de magasins de HealthOmics variantes - AWS HealthOmics

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création de tâches d'importation de magasins de HealthOmics variantes

L'exemple suivant montre comment utiliser le AWS CLI pour créer une tâche d'importation pour un magasin de variantes.

aws omics start-variant-import-job \ --destination-name myvariantstore \ --runLeftNormalization false \ --role-arn arn:aws:iam::55555555555:role/roleName \ --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
{ "destinationName": "store_a", "roleArn": "....", "runLeftNormalization": false, "items": [ {"source": "s3://my-omics-bucket/sample.vcf.gz"}, {"source": "s3://my-omics-bucket/sample2.vcf.gz"} ] }

Pour les boutiques créées après le 15 mai 2023, l'exemple suivant montre comment ajouter le --annotation-fields paramètre. Les champs d'annotation sont définis lors de l'importation.

aws omics start-variant-import-job \ --destination-name annotationparsingvariantstore \ --role-arn arn:aws:iam::123456789012:role/<role_name> \ --items source=s3://pathToS3/sample.vcf --annotation-fields '{"VEP": "CSQ"}'
{ "jobId": "981e2286-e954-4391-8a97-09aefc343861" }

get-variant-import-jobÀ utiliser pour vérifier le statut.

aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229

Vous recevrez une réponse JSON indiquant le statut de votre tâche d'importation. Les annotations VEP dans le VCF sont analysées pour les informations stockées dans la colonne INFO sous forme de paire. ID/Value L'ID par défaut pour la colonne INFO des annotations d'Ensembl Variant Effect Predictor est CSQ, mais vous pouvez utiliser le --annotation-fields paramètre pour indiquer une valeur personnalisée utilisée dans la colonne INFO. L'analyse syntaxique est actuellement prise en charge pour les annotations VEP.

Pour une boutique créée avant le 15 mai 2023 ou pour les fichiers VCF qui n'incluent pas d'annotation VEP, la réponse n'inclut aucun champ d'annotation.

{ "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "items": [ { "jobStatus": "COMPLETED", "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf" } ], "roleArn": "arn:aws:iam::555555555555:role/<role_name>", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", }

Les annotations VEP qui font partie des fichiers VCF sont stockées sous forme de schéma prédéfini avec la structure suivante. Le champ extras peut être utilisé pour stocker tous les champs VEP supplémentaires qui ne sont pas inclus dans le schéma par défaut.

annotations struct< vep: array<struct< allele:string, consequence: array<string>, impact:string, symbol:string, gene:string, `feature_type`: string, feature: string, biotype: string, exon: struct<rank:string, total:string>, intron: struct<rank:string, total:string>, hgvsc: string, hgvsp: string, `cdna_position`: string, `cds_position`: string, `protein_position`: string, `amino_acids`: struct<reference:string, variant: string>, codons: struct<reference:string, variant: string>, `existing_variation`: array<string>, distance: string, strand: string, flags: array<string>, symbol_source: string, hgnc_id: string, `extras`: map<string, string> >> >

L'analyse est effectuée selon une approche basée sur le meilleur effort. Si l'entrée VEP ne respecte pas les spécifications standard VEP, elle ne sera pas analysée et la ligne du tableau sera vide.

Pour un nouveau magasin de variantes, la réponse pour get-variant-import-jobinclurait les champs d'annotation, comme indiqué.

aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229

Vous recevez une réponse JSON qui indique le statut de votre tâche d'importation.

{ "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "items": [ { "jobStatus": "COMPLETED", "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf" } ], "roleArn": "arn:aws:iam::123456789012:role/<role_name>", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", "annotationFields" : {"VEP": "CSQ"} } }

Vous pouvez l'utiliser list-variant-import-jobspour voir toutes les tâches d'importation et leur statut.

aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea

La réponse contient les informations suivantes.

{ "variantImportJobs": [ { "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "roleArn": "arn:aws:iam::55555555555:role/roleName", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", "annotationFields" : {"VEP": "CSQ"} } ] } }

Si nécessaire, vous pouvez annuler une tâche d'importation à l'aide de la commande suivante.

aws omics cancel-variant-import-job --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508