As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configure o canal de entrada de dados para usar o Amazon FSx for Lustre
Aprenda a usar o Amazon FSx for Lustre como sua fonte de dados para maior produtividade e treinamento mais rápido, reduzindo o tempo de carregamento de dados.
nota
Ao usar instâncias habilitadas para EFA, como P4d e P3dn, certifique-se de definir as regras de entrada e saída apropriadas no grupo de segurança. Especialmente, a abertura dessas portas é necessária para que a SageMaker IA acesse o sistema de FSx arquivos da Amazon no trabalho de treinamento. Para saber mais, consulte Controle de acesso do sistema de arquivos com o Amazon VPC.
Sincronize o Amazon S3 e o Amazon for FSx Lustre
Para vincular seu Amazon S3 ao Amazon FSx for Lustre e carregar seus conjuntos de dados de treinamento, faça o seguinte.
-
Prepare o conjunto de dados e faça upload para um bucket do Amazon S3. Por exemplo, suponha que os caminhos do Amazon S3 para um conjunto de dados de treino e um conjunto de dados de teste estejam no formato a seguir.
s3://amzn-s3-demo-bucket/data/train s3://amzn-s3-demo-bucket/data/test
-
Para criar um FSx sistema de arquivos for Lustre vinculado ao bucket do Amazon S3 com os dados de treinamento, siga as etapas em Vincular seu sistema de arquivos a um bucket do Amazon S3 no Guia do usuário do FSx Amazon for Lustre. Certifique-se de adicionar um endpoint à sua VPC permitindo o acesso ao Amazon S3. Para obter mais informações, consulte Criar um endpoint da VPC para o Amazon S3. Quando especificar o caminho do repositório de dados, forneça o URI do bucket do Amazon S3 da pasta que contém seus conjuntos de dados. Por exemplo, com base nos exemplos de caminhos do S3 na etapa 1, o caminho do repositório de dados deve ser o seguinte:
s3://amzn-s3-demo-bucket/data
-
Depois que o sistema de arquivos FSx for Lustre for criado, verifique as informações de configuração executando os seguintes comandos.
aws fsx describe-file-systems && \ aws fsx describe-data-repository-association
Esses comandos retornam
FileSystemId
,MountName
,FileSystemPath
eDataRepositoryPath
. Por exemplo, os resultados serão semelhantes ao seguinte:# Output of aws fsx describe-file-systems "FileSystemId": "fs-0123456789abcdef0" "MountName": "1234abcd" # Output of aws fsx describe-data-repository-association "FileSystemPath": "/ns1", "DataRepositoryPath": "s3://amzn-s3-demo-bucket/data/"
Depois que a sincronização entre o Amazon S3 e a Amazon for FSx concluída, seus conjuntos de dados serão salvos na Amazon FSx nos seguintes diretórios.
/ns1/train # synced with s3://amzn-s3-demo-bucket/data/train /ns1/test # synced with s3://amzn-s3-demo-bucket/data/test
Defina o caminho do sistema de FSx arquivos da Amazon como o canal de entrada de dados para SageMaker treinamento
Os procedimentos a seguir orientam você no processo de configuração do sistema de FSx arquivos da Amazon como fonte de dados para trabalhos de SageMaker treinamento.