将 HealthOmics 读取集导出到 Amazon S3 存储桶 - AWS HealthOmics

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将 HealthOmics 读取集导出到 Amazon S3 存储桶

您可以将读取集作为批量导出任务导出到 Amazon S3 存储桶。为此,请先创建一个具有存储桶写入权限的 IAM 策略,类似于以下 IAM 策略示例。

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetBucketLocation" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket1", "arn:aws:s3:::amzn-s3-demo-bucket1/*" ] } ] }
JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "omics.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }

IAM 策略到位后,开始您的读取集导出任务。以下示例向您展示了如何使用 start-read-set-export-job API 操作来执行此操作。在以下示例中,将所有参数(例如、sequence store IDdestinationrole ARNsources、和)替换为您的输入。

aws omics start-read-set-export-job --sequence-store-id sequence store id \ --destination valid s3 uri \ --role-arn role ARN \ --sources readSetId=read set id_1 readSetId=read set id_2

您会收到以下响应,其中包含有关源序列存储和目标 Amazon S3 存储桶的信息。

{ "id": <job-id>, "sequenceStoreId": <sequence-store-id>, "destination": <destination-s3-uri>, "status": "SUBMITTED", "creationTime": "2022-10-22T01:33:38.079000+00:00" }

作业启动后,您可以使用 get-read-set-export-job API 操作确定其状态,如下所示。将sequence store IDjob ID分别替换为您的序列存储 ID 和作业 ID。

aws omics get-read-set-export-job --id job-id --sequence-store-id sequence store ID

您可以使用 list-read-set-export-jobs API 操作查看为序列存储初始化的所有导出作业,如下所示。sequence store ID用您的序列存储 ID 替换。

aws omics list-read-set-export-jobs --sequence-store-id sequence store ID.
{ "exportJobs": [ { "id": <job-id>, "sequenceStoreId": <sequence-store-id>, "destination": <destination-s3-uri>, "status": "COMPLETED", "creationTime": "2022-10-22T01:33:38.079000+00:00", "completionTime": "2022-10-22T01:34:28.941000+00:00" } ] }

除了导出读取集外,您还可以使用 Amazon S3 访问权限共享读取集 URIs。要了解更多信息,请参阅使用 Amazon S3 访问 HealthOmics 读取集 URIs