Amazon Elastic Inference - Amazon Elastic Compute Cloud

Amazon Elastic Inference

Amazon Elastic Inference (EI) は、 Amazon EC2 の CPU インスタンスにアタッチして、深層学習 (DL) の推論ワークロードを高速化するためのリソースです。Amazon EI アクセラレータには、複数のサイズがあります。これは、Amazon EC2 インスタンスで実行されるアプリケーション内で、インテリジェントな機能を構築するための費用対効果の高い方法です。

Amazon EI は、TensorFlow、Apache MXNet、PyTorch、Open Neural Network Exchange (ONNX) 形式で定義されたモデルオペレーションを、MxNet 経由で、低コストの DL 推論アクセラレータとインスタンスの CPU 間で分散します。

Amazon Elastic Inference の詳細については、 Amazon EI デベロッパーガイドを参照してください。