워크플로 정의에서 게놈 파일 참조 - AWS HealthOmics

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

워크플로 정의에서 게놈 파일 참조

HealthOmics 참조 스토어 객체는 다음과 같은 URI를 사용하여 참조할 수 있습니다. 필요한 reference ID 경우 자체 reference store ID, 및 account ID를 사용합니다.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id

일부 워크플로에는 참조 유전체에 대한 SOURCEINDEX 파일이 모두 필요합니다. 이전 URI는 기본 짧은 양식이며 기본적으로 SOURCE 파일로 설정됩니다. 두 파일 중 하나를 지정하려면 다음과 같이 긴 URI 양식을 사용할 수 있습니다.

omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/source omics://account ID.storage.us-west-2.amazonaws.com/reference store id/reference/id/index

시퀀스 읽기 세트를 사용하면 다음과 같이 유사한 패턴을 갖게 됩니다.

aws omics create-workflow \ --name workflow name \ --main sample workflow.wdl \ --definition-uri omics://account ID.storage.us-west-2.amazonaws.com/sequence_store_id/readSet/id \ --parameter-template file://parameters_sample_description.json

FASTQ 기반 읽기 세트와 같은 일부 읽기 세트에는 페어링된 읽기가 포함될 수 있습니다. 다음 예제에서는 이를 SOURCE1 및 SOURCE2라고 합니다. BAM 및 CRAM과 같은 형식에는 SOURCE1 파일만 있습니다. 일부 읽기 세트에는 bai 또는 파일과 같은 INDEX crai 파일이 포함됩니다. 위의 URI는 기본 짧은 양식이며 SOURCE1 파일로 기본 설정됩니다. 다음과 같이 긴 URI 양식을 사용하여 정확한 파일 또는 인덱스를 지정할 수 있습니다.

omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source1 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/source2 omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>/index

다음은 두 개의 Omics Storage URIs.

{ "input_fasta": "omics://123456789012.storage.us-west-2.amazonaws.com/<reference_store_id>/reference/<id>", "input_cram": "omics://123456789012.storage.us-west-2.amazonaws.com/<sequence_store_id>/readSet/<id>" }

시작 실행 요청에를 AWS CLI 추가하여의 입력 JSON 파일을 참조--inputs file://<input_file.json>합니다.