從工作流程定義參考基因體檔案 - AWS HealthOmics

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

從工作流程定義參考基因體檔案

HealthOmics 參考存放區物件可以使用如下的 URI 來參考。在指示reference ID的地方使用您自己的 reference store IDaccount ID和 。

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id

有些工作流程需要參考基因體的 SOURCEINDEX 檔案。先前的 URI 是預設的短格式,並將預設為 SOURCE 檔案。若要指定任一檔案,您可以使用長 URI 表單,如下所示。

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/source omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/index

使用序列讀取集會有類似的模式,如下所示。

aws omics create-workflow \ --name workflow name \ --main sample workflow.wdl \ --definition-uri omics://account ID.storage.us-west-2.amazonaws.com/sequence_store_id/readSet/id \ --parameter-template file://parameters_sample_description.json

有些讀取集,例如以 FASTQ 為基礎的讀取集,可以包含配對的讀取。在下列範例中,它們稱為 SOURCE1 和 SOURCE2。BAM 和 CRAM 等格式只會有 SOURCE1 檔案。有些讀取集將包含 INDEX 檔案,例如 baicrai 檔案。上述 URI 是預設的簡短格式,預設為 SOURCE1 檔案。若要指定確切的檔案或索引,您可以使用長 URI 表單,如下所示。

omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source1 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source2 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/index

以下是使用兩個 Omics 儲存 URIs 的輸入 JSON 檔案範例。

{ "input_fasta": "omics://123456789012.storage.us-west-2.amazonaws.com/<reference_store_id>/reference/<id>", "input_cram": "omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>" }

--inputs file://<input_file.json>新增至您的開始執行請求 AWS CLI ,以參考 中的輸入 JSON 檔案。