翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
よくある質問
このセクションでは、 で拡張およびスケールするためのデータレイクの設計に関してよく寄せられる質問に対する回答を提供します AWS クラウド。
このデータレイクリファレンスアーキテクチャはエンタープライズ組織により適していますか?
このガイドのデータレイクリファレンスアーキテクチャは、あらゆる規模の組織に属するデータレイクに適用できます。リファレンスアーキテクチャは、データ交換インターフェイスを標準化し、データレイクを維持および拡張するためのオーバーヘッドとコストを削減し、組織のデータレイクが拡大するあらゆる規模に適用できます。
組織にデータプロデューサーが 1 つしかない場合でも、このリファレンスアーキテクチャを使用できますか?
このガイドのデータレイクリファレンスアーキテクチャは、組織内にデータプロデューサーが 1 つしかない場合でも、依然として関連性があり有益です。一元化されたカタログがないと、データプロデューサーはデータコンシューマーの増加を処理する必要があり、複雑さとオーバーヘッドが増加します。データレイクは組織の長期的なアセットでもあり、通常、組織はデータプロデューサーを追加します。例えば、コンプライアンス上の理由から、または組織が独自のデータプロデューサーを持つ別のビジネスユニットを取得したために、機密データを保存するために追加のデータプロデューサーが必要になる場合があります。
データレイクは、1 つのデータプロデューサーを複数のデータコンシューマーに直接接続します。このガイドのデータレイクリファレンスアーキテクチャは引き続き重要ですか?
データレイクリファレンスアーキテクチャは、長期的には組織に利益をもたらします。2 ステップのアプローチを使用して、新しいデータコンシューマー向けの一元化されたカタログを構築することから始めることができます。その後、既存のデータコンシューマーを一元化されたカタログに接続できます。
組織は、オンボーディングとアクセス許可のワークフローを変更せずに実行すべきですか?
いいえ。このセクションの主な目的は、オンボーディングプロセスに必要な論理アクティビティブロックを説明することです。すべての組織はプロセスをカスタマイズする必要があり、データの機密性によっては複数のプロセスがある場合もあります。
もう 1 つの考慮事項は、プロセスフローが でリソースベースの共有アプローチを使用していることです AWS Lake Formation。タグベースの共有など、Lake Formation でサポートされている他のデータ共有方法もあります。このプロセスの違いは、特定の共有方法に合わせて調整できます。