Importjobs für HealthOmics Variantenspeicher erstellen - AWS HealthOmics

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Importjobs für HealthOmics Variantenspeicher erstellen

Das folgende Beispiel zeigt, wie Sie mit AWS CLI dem einen Importjob für einen Variantenspeicher erstellen.

aws omics start-variant-import-job \ --destination-name myvariantstore \ --runLeftNormalization false \ --role-arn arn:aws:iam::55555555555:role/roleName \ --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
{ "destinationName": "store_a", "roleArn": "....", "runLeftNormalization": false, "items": [ {"source": "s3://my-omics-bucket/sample.vcf.gz"}, {"source": "s3://my-omics-bucket/sample2.vcf.gz"} ] }

Für Geschäfte, die nach dem 15. Mai 2023 erstellt wurden, zeigt das folgende Beispiel, wie der --annotation-fields Parameter hinzugefügt wird. Die Annotationsfelder werden beim Import definiert.

aws omics start-variant-import-job \ --destination-name annotationparsingvariantstore \ --role-arn arn:aws:iam::123456789012:role/<role_name> \ --items source=s3://pathToS3/sample.vcf --annotation-fields '{"VEP": "CSQ"}'
{ "jobId": "981e2286-e954-4391-8a97-09aefc343861" }

Wird verwendet get-variant-import-job, um den Status zu überprüfen.

aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229

Sie erhalten eine JSON-Antwort, die den Status Ihres Importauftrags anzeigt. VEP-Anmerkungen in der VCF werden nach Informationen geparst, die in der INFO-Spalte als Paar gespeichert sind. ID/Value Die Standard-ID für die INFO-Spalte der Anmerkungen zu Ensembl Variant Effect Predictor ist CSQ, aber Sie können den --annotation-fields Parameter verwenden, um einen benutzerdefinierten Wert anzugeben, der in der INFO-Spalte verwendet wird. Das Parsen wird derzeit für VEP-Anmerkungen unterstützt.

Für einen Shop, der vor dem 15. Mai 2023 erstellt wurde, oder für VCF-Dateien, die keine VEP-Anmerkung enthalten, enthält die Antwort keine Kommentarfelder.

{ "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "items": [ { "jobStatus": "COMPLETED", "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf" } ], "roleArn": "arn:aws:iam::555555555555:role/<role_name>", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", }

Die VEP-Anmerkungen, die Teil von VCF-Dateien sind, werden als vordefiniertes Schema mit der folgenden Struktur gespeichert. Das Feld extras kann verwendet werden, um alle zusätzlichen VEP-Felder zu speichern, die nicht im Standardschema enthalten sind.

annotations struct< vep: array<struct< allele:string, consequence: array<string>, impact:string, symbol:string, gene:string, `feature_type`: string, feature: string, biotype: string, exon: struct<rank:string, total:string>, intron: struct<rank:string, total:string>, hgvsc: string, hgvsp: string, `cdna_position`: string, `cds_position`: string, `protein_position`: string, `amino_acids`: struct<reference:string, variant: string>, codons: struct<reference:string, variant: string>, `existing_variation`: array<string>, distance: string, strand: string, flags: array<string>, symbol_source: string, hgnc_id: string, `extras`: map<string, string> >> >

Die Analyse erfolgt nach bestem Wissen und Gewissen. Wenn der VEP-Eintrag nicht den VEP-Standardspezifikationen entspricht, wird er nicht analysiert und die Zeile im Array ist leer.

Bei einem neuen Variantenspeicher get-variant-import-jobwürde die Antwort für die Annotationsfelder enthalten, wie in der Abbildung gezeigt.

aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229

Sie erhalten eine JSON-Antwort, die den Status Ihres Importauftrags anzeigt.

{ "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "items": [ { "jobStatus": "COMPLETED", "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf" } ], "roleArn": "arn:aws:iam::123456789012:role/<role_name>", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", "annotationFields" : {"VEP": "CSQ"} } }

Sie können list-variant-import-jobssie verwenden, um alle Importaufträge und deren Status zu sehen.

aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea

Die Antwort enthält Informationen wie folgt.

{ "variantImportJobs": [ { "creationTime": "2023-04-11T17:52:37.241958+00:00", "destinationName": "annotationparsingvariantstore", "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea", "roleArn": "arn:aws:iam::55555555555:role/roleName", "runLeftNormalization": false, "status": "COMPLETED", "updateTime": "2023-04-11T17:58:22.676043+00:00", "annotationFields" : {"VEP": "CSQ"} } ] } }

Bei Bedarf können Sie einen Importauftrag mit dem folgenden Befehl abbrechen.

aws omics cancel-variant-import-job --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508