构建AWSDeep Learning Containers 自定义映像 - AWS 深度学习容器

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

构建AWSDeep Learning Containers 自定义映像

如何构建自定义映像

我们可以轻松利用自定义 Deep Learning Containers er,以使用 Docker 文件添加自定义框架、库和程序包。

利用 TensorFlow 进行训练

在以下示例 Dockerfile 中,生成的 Docker 映像将针对 GPU 优化 TensorFlow v1.15.2 并构建用于支持适用于多节点分布式训练的 Horovod 和 Python 3。它也将具有AWS示例 GitHub 存储库,该库包含许多深度学习模型示例。

#Take base container FROM 763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-training:1.15.2-gpu-py36-cu100-ubuntu18.04 # Add custom stack of code RUN git clone https://github.com/aws-samples/deep-learning-models

阿帕奇 MXNet 培训(孵化)

在以下示例 Dockerfile 中,生成的 Docker 映像将针对构建用于支持 Horovod 和 Python 3 的 GPU 推理优化 Apache MXNet(孵化)v1.6.0。它还将具有 MXNet GitHub 存储库,该存储库包含许多深度学习模型示例。

# Take the base MXNet Container FROM 763104351884.dkr.ecr.us-east-1.amazonaws.com/mxnet-training:1.6.0-gpu-py36-cu101-ubuntu16.04 # Add Custom stack of code RUN git clone -b 1.6.0 https://github.com/apache/incubator-mxnet.git ENTRYPOINT ["python", "/incubator-mxnet/example/image-classification/train_mnist.py"]

使用 Docker 映像的自定义名称和自定义标签构建映像,同时指向您的个人 Docker 注册表(通常为您的用户名)。

docker build -f Dockerfile -t <registry>/<any name>:<any tag>

推送至您的个人 Docker 注册表:

docker push <registry>/<any name>:<any tag>

您可以使用以下命令运行容器:

docker run -it < name or tag>
重要

您可能需要登录才能访问 Deep Learning Containers er 映像存储库。在以下命令中指定您的区域:

aws ecr get-login-password --region us-east-1 | docker login --username AWS --password-stdin 763104351884.dkr.ecr.us-east-1.amazonaws.com