2. 実験

実験では、実験のログ記録、追跡、メトリクスについて説明します。これは、プラットフォーム、ソース管理、開発環境全体での実験メタデータ統合につながります。実験には、デバッグを通じてモデルのパフォーマンスと精度を最適化できることも含まれます。

2.1 統合開発環境	統合開発環境 (IDE) はクラウドと直接統合されています。IDE はとやり取りし、より大きなシステムにコマンドを送信できます。理想的には、以下をサポートします。ローカル開発バージョン管理の統合デバッグが実施され、生成されたすべてのログとアーティファクトがバージョン管理に送られる
2.2 コードバージョン管理	再現性と再利用性を確保するために、すべてのコードは適切なバージョン管理でソースリポジトリにコミットされます。これには、インフラストラクチャコード、アプリケーションコード、モデルコード、さらにはノートブック (使用を選択した場合) も含まれます。
2.3 追跡	ML プロジェクトには、機械学習実験を追跡および分析できるツールが必要です。このツールは、機械学習実験の実行中にすべてのメトリクス、パラメータ、アーティファクトを記録し、すべてのメタデータを一元的な場所に記録する必要があります。中央の場所には、実行するすべての実験を分析、視覚化、監査する機能があります。
2.4 クロスプラットフォーム統合	実験とそのすべてのメタデータの履歴結果は、システムの他の部分でアクセスできます。例えば、所定のオーケストレーションパイプラインは、モニタリングツールと同様に、このデータにアクセスできます。
2.5 デバッグ: 精度とシステムパフォーマンス	次の実行を調べるための包括的なモデルデバッグフレームワークが用意されています。ボトルネックを見つける異常に関するアラートリソース使用率を最大化する実験の分析を支援するトレーニングが集中的である場合は、スループットを最大化する能力が重要であり、コスト最適化に必要なツールとなります。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

1. データ中心の管理

3. オブザーバビリティとモデル管理