ECS Anywhere の問題のトラブルシューティング - Amazon Elastic Container Service

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ECS Anywhere の問題のトラブルシューティング

ECS Anywhere は、オンプレミスサーバーや仮想マシン (VM) などの外部インスタンスを Amazon ECS クラスターに登録するためのサポートを提供します。以下は、発生する可能性のある一般的な問題と、一般的なトラブルシューティングの推奨事項です。

外部インスタンス登録の問題

Amazon ECS クラスターに外部インスタンスを登録する場合、次の要件を満たす必要があります:

  • AWS Systems Manager アクティベーション ID とアクティベーションコード で構成されるアクティベーションを取得する必要があります。Systems Manager マネージドインスタンスとして、外部 インスタンスを登録するために使用します。Systems Manager のアクティベーションが要求されると、登録制限と有効期限を指定できます。登録制限は、アクティベーションを使用して登録できるインスタンスの最大数を指定します。そのため、デフォルト値は 1 インスタンスです。有効期限は、アクティベーションが期限切れになる日付です。デフォルト値は 24 時間です。外部インスタンスの登録に使用している Systems Manager のアクティベーションが有効でない場合は、新しいものをリクエストします。詳細については、「クラスターへの外部インスタンスの登録」を参照してください。

  • IAM ポリシーは、 AWS API オペレーションとの通信に必要なアクセス許可を外部インスタンスに提供するために使用されます。このマネージド ポリシーが正しく作成されず、必要なアクセス権限が含まれていない場合、外部インスタンスの登録は失敗します。詳細については、「ECS Anywhere IAM ロール」を参照してください。

  • Amazon ECS には、Docker、Amazon ECS コンテナエージェント、および Systems Manager Agent を外部インスタンスにインストールするインストールスクリプトが用意されています。インストールスクリプトが失敗した場合、エラーが発生しなくても、同じインスタンスでスクリプトを再実行できない可能性があります。このような場合は、クリーンアッププロセスに従ってインスタンスから AWS リソースをクリアし、インストールスクリプトを再度実行できるようにします。詳細については、「外部インスタンスの登録を解除する」を参照してください。

    注記

    インストールスクリプトが Systems Manager のアクティベーションを正常に要求し、使用した場合、インストールスクリプトを 2 回実行すると Systems Manager のアクティベーションが再び使用されることに注意してください。これにより、順番にアクティベーションの登録制限に達する可能性があります。この制限に達した場合、新しいアクティベーションを作成する必要があります。

  • GPU ワークロードの外部インスタンスでインストールスクリプトを実行するときに、NVIDIA ドライバが検出されない、または正しく設定されていない場合、エラーが発生します。インストールスクリプトは nvidia-smi コマンドを実行して、NVIDIA ドライバの存在を確認します。

外部インスタンスネットワークの問題

変更内容を伝えるには、外部インスタンスは AWSにネットワーク接続が必要です。外部インスタンスが へのネットワーク接続を失った場合 AWS、手動で停止しない限り、インスタンスで実行されているタスクは引き続き実行されます。への接続 AWS が復元されると、外部インスタンスの Amazon ECS コンテナエージェントと Systems Manager エージェントで使用される AWS 認証情報が自動的に更新されます。外部インスタンスと 間の通信に使用される AWS ドメインの詳細については AWS、「」を参照してくださいECS Anywhereを使用したネットワーク

外部インスタンスでのタスクの実行に関する問題

タスクまたはコンテナが外部インスタンスで実行されない場合、最もよくある原因はネットワークまたはアクセス許可に関連しています。コンテナが Amazon ECR からイメージをプルしている場合、またはコンテナログを CloudWatch Logs に送信するように設定されている場合、タスク定義で有効なタスク実行 IAM ロールを指定する必要があります。有効なタスク実行 IAM ロールがない場合、コンテナは起動しません。ネットワーク関連の問題の詳細については、「外部インスタンスネットワークの問題」を参照してください。

重要

Amazon ECS には、Amazon ECS ログ収集ツールが用意されています。これを使用して、トラブルシューティングの目的で外部インスタンスからログを収集することができます。詳細については、「Amazon ECS ログコレクター」を参照してください。