As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criação de uma loja HealthOmics de referência
Um armazenamento de referência em HealthOmics é um armazenamento de dados para o armazenamento de genomas de referência. Você pode ter uma única loja de referência em Conta da AWS cada região. Você pode criar um repositório de referência usando o console ou a CLI.
Tópicos
Criando um repositório de referência usando o console
Para criar um repositório de referências
-
Abra o console de HealthOmics
. -
Se necessário, abra o painel de navegação esquerdo (≡). Escolha Loja de referência.
-
Escolha genomas de referência nas opções de armazenamento de dados genômicos.
-
Você pode escolher um genoma de referência importado anteriormente ou importar um novo. Se você não importou um genoma de referência, escolha Importar genoma de referência no canto superior direito.
-
Na página Criar tarefa de importação de genoma de referência, escolha a opção Criação rápida ou Criação manual para criar um repositório de referência e, em seguida, forneça as seguintes informações.
-
Nome do genoma de referência - Um nome exclusivo para esta loja.
-
Descrição (opcional) - Uma descrição dessa loja de referência.
-
Função do IAM - Selecione uma função com acesso ao seu genoma de referência.
-
Referência do Amazon S3 - Selecione seu arquivo de sequência de referência em um bucket do Amazon S3.
-
Tags (opcional) - forneça até 50 tags para esse repositório de referência.
-
Criando um repositório de referência usando a CLI
O exemplo a seguir mostra como criar um repositório de referência usando AWS CLI o. Você pode ter uma loja de referência por AWS região.
Os repositórios de referência suportam o armazenamento de arquivos FASTA com as extensões .fasta
.fa
,.fas
,.fsa
,,.faa
,.fna
,.ffn
,.frn
,, .mpfa
.seq
,.txt
. A bgzip
versão dessas extensões também é suportada.
No exemplo a seguir,
substitua pelo nome que você escolheu para sua loja de referência.reference store name
aws omics create-reference-store --name
"reference store name"
Você recebe uma resposta JSON com o ID e o nome da loja de referência, o ARN e a data e hora de quando sua loja de referência foi criada.
{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }
Você pode usar o ID do repositório de referência em AWS CLI comandos adicionais. Você pode recuperar a lista de repositórios de referência IDs vinculados à sua conta usando o list-reference-storescomando, conforme mostrado no exemplo a seguir.
aws omics list-reference-stores
Em resposta, você recebe o nome da sua loja de referência recém-criada.
{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }
Depois de criar um repositório de referência, você pode criar trabalhos de importação para carregar arquivos de referência genômica nele. Para fazer isso, você deve usar ou criar uma função do IAM para acessar os dados. Veja abaixo um exemplo de política .
Você também deve ter uma política de confiança semelhante ao exemplo a seguir.
Agora você pode importar um genoma de referência. Este exemplo usa o Genome Reference Consortium Human Build 38 (hg38), que é de acesso aberto e está disponível no Registry of Open Data em. AWS
aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket
Em seguida, você pode começar seu trabalho de importação. Substitua reference store
ID
,, e role ARN
com sua própria entrada.source file
path
aws omics start-reference-import-job --reference-store-id
--role-arn
reference store ID
--sources
role ARN
source file path
Depois que os dados forem importados, você receberá a seguinte resposta em JSON.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }
Você pode monitorar o status de um trabalho usando o comando a seguir. No exemplo a seguir, substitua
e reference store ID
pelo ID da loja de referência e pelo ID do trabalho sobre o qual você deseja saber mais.job
ID
aws omics get-reference-import-job --reference-store-id
--id
reference store ID
job ID
Em resposta, você recebe uma resposta com os detalhes dessa loja de referência e seu status.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }
Você também pode encontrar a referência que foi importada listando suas referências e filtrando-as com base no nome da referência.
Substitua pelo ID da loja de referência e adicione um filtro opcional para restringir a lista.reference store ID
aws omics list-references --reference-store-id
--filter name=
reference store ID
MyReference
Em resposta, você recebe as seguintes informações.
{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }
Para saber mais sobre os metadados de referência, use a operação da get-reference-metadataAPI. No exemplo a seguir,
substitua pelo ID da loja de referência e reference store ID
pelo ID de referência sobre o qual você deseja saber mais.reference ID
aws omics get-reference-metadata --reference-store-id
--id
reference store ID
reference ID
Você recebe as seguintes informações em resposta.
{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }
Você também pode baixar partes do arquivo de referência usando get-reference. No exemplo a seguir,
substitua pelo ID da loja de referência e reference store ID
pelo ID de referência do qual você deseja fazer o download.reference ID
aws omics get-reference --reference-store-id
--id
reference store ID
--part-number 1 outfile.fa
reference ID