AWS最新のデータアーキテクチャ - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS最新のデータアーキテクチャ

このガイドでは、データ戦略フレームワークを以下に実装する方法については説明していませんAWS。これは広範囲に及ぶトピックで、以下で取り上げていますAWSドキュメント、ブログ投稿、その他のガイド (「リソース」セクションを参照)。ただし、次の図は概要を示しています。aの主な構成要素を示していますモダンデータアーキテクチャ onAWSロードマップに含めることができるほとんどのサービスを網羅しています。

AWS データサービス

このアーキテクチャの主な構成要素は、次のような最新のデータ戦略の技術的信条を裏付けています。前に説明しました:

  1. を使う費用対効果が高くスケーラブルな統合ストレージレイヤーつまり、すべてのデータ作成者と消費者がデータを操作する技術的能力を持っているということです。

    アマゾンシンプルストレージサービス (Amazon S3)は、統合、スケーラビリティ、データの可用性、セキュリティ、およびパフォーマンスを低コストで提供するオブジェクトストレージサービスです。

  2. セキュリティは必須です。データプライバシールールの適用、暗号化によるデータ保護、監査の有効化、コンプライアンスの自動化を行います。

    データのプライバシー、保護、コンプライアンスを自動的に適用し、監査を有効にするには、AWS Key Management Service(AWS KMS)AWS Identity and Access Management(シャム)AWS Secrets ManagerAWS Audit Manager、およびアマゾン・メイシー

  3. 共有するデータを管理会社全体でね ユーザーが必要なデータを見つけて使用できるように、独自のデータカタログとビジネス用語集を用意してください。

    AWS Lake Formationデータを管理し、会社全体で共有するのに役立ちます。さらに、独自のデータカタログを次のように作成できますAWS Glueとビジネス用語集を使ったアマゾンDataZone(プレビュー中) 従業員が必要なデータを見つけられるようにします。

  4. を選択する適切なサービスを適切な仕事に コンポーネントを選択する際には、機能、スケーラビリティ、データレイテンシー、サービスの実行に必要な労力、回復力、統合、自動化を考慮してください。

    検討できますアマゾンアテナアマゾン EMRAWS GlueアマゾンOpenSearch[サービス]アマゾンキネシスアマゾンレッドシフトApache Kafka 用アマゾンマネージドストリーミング (Amazon MSK)、およびアマゾンQuickSightタスクを管理します。たとえば、Kinesis または Amazon MSK を使用してリアルタイムストリーミングを実行したり、Amazon EMR を使用してデータ処理を実行したり、AWS Glue、で検索OpenSearchサービス、Athena によるアドホッククエリ、Amazon Redshift によるデータウェアハウス。

  5. 使用人工知能 (AI) と機械学習 (ML)

    人工知能の使用を有効にするにはAWSAI サービスと機械学習はアマゾンSageMaker

  6. 提供データリテラシーとツール付きビジネスマン向けの抽象化

    データリテラシー、ツール、抽象化を提供するプロセスはアーキテクチャには含まれていませんが、使用することはできますアマゾンDataZone(プレビュー中)AWS Lake Formation、およびアマゾンQuickSightデータ抽象化ツールとして

  7. 仮説を検証データへの取り組みや結果を測定してください

    使用できますアマゾンOpenSearch[サービス]ダッシュボードまたはアマゾンQuickSightビジネス成果の指標やテスト結果を分析し、仮説を検証します。

さまざまなユースケースのサンプルアーキテクチャの例については、にあるリファレンスアーキテクチャ図を参照してくださいAWSアーキテクチャーセンター。技術チームはこれらの図を参考としてのみ使用し、独自の要件、環境、プロジェクトに基づいてカスタマイズする必要があります。