As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Aprenda a usar o Amazon FSx for Lustre como sua fonte de dados para maior produtividade e treinamento mais rápido, reduzindo o tempo de carregamento de dados.
nota
Ao usar instâncias habilitadas para EFA, como P4d e P3dn, certifique-se de definir as regras de entrada e saída apropriadas no grupo de segurança. Especialmente, a abertura dessas portas é necessária para que a SageMaker IA acesse o sistema de FSx arquivos da Amazon no trabalho de treinamento. Para saber mais, consulte Controle de acesso do sistema de arquivos com o Amazon VPC.
Sincronize o Amazon S3 e o Amazon for FSx Lustre
Para vincular seu Amazon S3 ao Amazon FSx for Lustre e carregar seus conjuntos de dados de treinamento, faça o seguinte.
-
Prepare o conjunto de dados e faça upload para um bucket do Amazon S3. Por exemplo, suponha que os caminhos do Amazon S3 para um conjunto de dados de treino e um conjunto de dados de teste estejam no formato a seguir.
s3://amzn-s3-demo-bucket/data/train s3://amzn-s3-demo-bucket/data/test
-
Para criar um FSx sistema de arquivos for Lustre vinculado ao bucket do Amazon S3 com os dados de treinamento, siga as etapas em Vincular seu sistema de arquivos a um bucket do Amazon S3 no Guia do usuário do FSx Amazon for Lustre. Certifique-se de adicionar um endpoint à sua VPC permitindo o acesso ao Amazon S3. Para obter mais informações, consulte Criar um endpoint da VPC para o Amazon S3. Quando especificar o caminho do repositório de dados, forneça o URI do bucket do Amazon S3 da pasta que contém seus conjuntos de dados. Por exemplo, com base nos exemplos de caminhos do S3 na etapa 1, o caminho do repositório de dados deve ser o seguinte:
s3://amzn-s3-demo-bucket/data
-
Depois que o sistema de arquivos FSx for Lustre for criado, verifique as informações de configuração executando os seguintes comandos.
aws fsx describe-file-systems && \ aws fsx describe-data-repository-association
Esses comandos retornam
FileSystemId
,MountName
,FileSystemPath
eDataRepositoryPath
. Por exemplo, os resultados serão semelhantes ao seguinte:# Output of aws fsx describe-file-systems "FileSystemId": "fs-0123456789abcdef0" "MountName": "1234abcd" # Output of aws fsx describe-data-repository-association "FileSystemPath": "/ns1", "DataRepositoryPath": "s3://amzn-s3-demo-bucket/data/"
Depois que a sincronização entre o Amazon S3 e a Amazon for FSx concluída, seus conjuntos de dados serão salvos na Amazon FSx nos seguintes diretórios.
/ns1/train # synced with s3://amzn-s3-demo-bucket/data/train /ns1/test # synced with s3://amzn-s3-demo-bucket/data/test
Defina o caminho do sistema de FSx arquivos da Amazon como o canal de entrada de dados para SageMaker treinamento
Os procedimentos a seguir orientam você no processo de configuração do sistema de FSx arquivos da Amazon como fonte de dados para trabalhos de SageMaker treinamento.
Para definir adequadamente o sistema de FSx arquivos da Amazon como fonte de dados, configure as classes do estimador de SageMaker IA FileSystemInput
usando as instruções a seguir.
-
Configure um objeto FileSystemInput de classe.
from sagemaker.inputs import FileSystemInput train_fs = FileSystemInput( file_system_id="
fs-0123456789abcdef0
", file_system_type="FSxLustre", directory_path="/1234abcd/ns1/
", file_system_access_mode="ro", )dica
Ao especificar
directory_path
, certifique-se de fornecer o caminho do sistema de FSx arquivos da Amazon começando comMountName
. -
Configure um estimador de SageMaker IA com a configuração de VPC usada para o sistema de arquivos da Amazon. FSx
from sagemaker.
estimator
importEstimator
estimator =Estimator
( ... role="your-iam-role-with-access-to-your-fsx
", subnets=["subnet-id
"], # Should be the same as the subnet used for Amazon FSx security_group_ids="security-group-id
" )Certifique-se de que a função do IAM para o trabalho de SageMaker treinamento tenha as permissões para acessar e ler na Amazon FSx.
-
Inicie o trabalho de treinamento executando o método estimator.fit com o sistema de arquivos da Amazon. FSx
estimator.fit(train_fs)
Para encontrar mais exemplos de código, consulte Usar sistemas de arquivos como entradas de treinamento na documentação