Microsoft Power BI サービスから AWS データソースへの接続 - AWS クラウド での Microsoft Power BI の使用

Microsoft Power BI サービスから AWS データソースへの接続

Microsoft Power BI サービス (SaaS) は、インターネットにアクセス可能なデータソース、または Amazon VPC のプライベートデータソースに直接接続できます。プライベートデータソースに接続するには、Microsoft オンプレミスデータゲートウェイと呼ばれるアプリケーションコンポーネントが必要です。Microsoft オンプレミスデータゲートウェイは、VPC 内の Amazon EC2 インスタンスにダウンロードされてインストールされ、Microsoft Power BI 認証情報で設定されます。このゲートウェイは、インターネット経由で Microsoft Azure Service Bus へのアウトバウンド接続を確立し、Microsoft Power BI でアクセス可能なデータソースに接続するように設定されます。大規模なデプロイでは、複数のオンプレミスデータゲートウェイを使用して、負荷を分散したり、耐障害性を強化したりできます。

Microsoft オンプレミスデータゲートウェイを使用することで、AWS のお客様からレポートされている多くの実質的なメリットが得られます。

  • セキュリティ体制の向上: Microsoft オンプレミスデータゲートウェイは、Microsoft Azure Cloud からのインバウンド接続を許可せず、Azure Service Bus へのアウトバウンド接続のみを開始します。この一方向のトラフィックモデルにより、データソースをプライベートに保ち、インターネットに公開しないようにできます。

  • データ転送量の削減: データソースに接続する際、Microsoft オンプレミスデータゲートウェイは、スプールと呼ばれるプロセスで結果セット全体を取得し、ローカルに保存します。結果は Power BI サービスに送信される前に、そのデータが圧縮されます。ユーザーからのレポートによると、圧縮率は通常 10:1 であり、インターネット経由でのデータ転送時間が短縮されるだけでなく、送信料金も削減されます。

  • ソリューションコストの削減: Microsoft オンプレミスデータゲートウェイを使用すると、サービスに必要なデータ処理の一部がゲートウェイによって代行されます。Savings Plans や Reserved Instances などのコスト削減プランと Amazon EC2 を併用することで、BI ソリューション全体のコストを削減できる可能性があります。

AWS では、Microsoft オンプレミスデータゲートウェイを、お客様のデータソースを含むプライベートサブネット内の Amazon EC2 インスタンスにインストールすることを推奨しています。このサブネットは、パブリックサブネットにインストールされた Amazon VPC NAT ゲートウェイを経由してインターネットにリクエストをルーティングするように設定されています。ネットワークアドレス変換 (NAT) ゲートウェイを使用すると、プライベートサブネット内のインスタンスをインターネットや他の AWS サービスに接続することはできますが、インターネットからそれらのインスタンスに接続することはできません。高可用性のデータゲートウェイの実装が必要な場合は、異なる AWS アベイラビリティーゾーンにまたがる複数の EC2 インスタンスにインストールされたオンプレミスデータゲートウェイのクラスターを使用することをお勧めします。詳細については、「別のゲートウェイを追加してクラスターを作成する」を参照してください。

このセクションで紹介するオプションでは、Amazon RDS、Amazon Redshift、Amazon Athena を例として使用します。すべての AWS データソースの詳細については、「付録: Microsoft Power BI でサポートされている AWS データソース」を参照してください。

Microsoft Power BI サービスに接続する AWS データソースを示す図。

AWS データソースから Microsoft Power BI サービスへの接続

追加の考慮事項

表 5 — AWS クラウド 内のデータソースを使用する Microsoft Power BI サービスに関する考慮事項

条件 AWS クラウド 内のデータソースを使用する Microsoft Power BI サービスに関する考慮事項
ネットワーク接続

データコンシューマーとデータソースの両方が AWS クラウド内に存在するため、Microsoft オンプレミスデータゲートウェイとデータソース間の接続は簡単です。Amazon VPC に存在する Amazon RDS や Amazon Redshift などのデータソースには、直接アクセスできます。リージョン別エンドポイントを使用するデータソースには、Amazon VPC インターネットゲートウェイまたは Amazon VPC エンドポイント経由でアクセスできます。

Microsoft オンプレミスデータゲートウェイから Microsoft Power BI サービスへの接続はインターネット経由で行われ、アウトバウンド接続のみとなります。

セキュリティ IP アクセスコントロール

ルーティングとセキュリティグループを組み合わせて使用することで、AWS クラウドに保存されているデータソースへのアクセスを制御できます。

Microsoft オンプレミスデータゲートウェイは Amazon EC2 インスタンスにインストールされるため、オペレーティングシステムへのインバウンドアクセスを制限するために使用できるセキュリティグループが関連付けられます。ゲートウェイはインバウンドリクエストを許可しません。インスタンスにはパブリック IP アドレスは必要なく、設定しないでください。

転送時の暗号化

Amazon VPC 内のデータソースは、データの送信に暗号化を使用するように設定することをお勧めします。リージョン別サービスでは、既に TLS 暗号化が使用されます。

Microsoft オンプレミスデータゲートウェイの接続は、TCP の代わりに HTTPS を使用して Microsoft Azure Service Bus に接続するように設定できます。通信には HTTPS モードを使用することをお勧めします。これは、2019 年 6 月のゲートウェイソフトウェアバージョンリリース以降、新しいゲートウェイのインストール時のデフォルトでもあります。

認証

AWS では、必要なデータセットへの読み取り専用アクセス権のみを持つ ID を使用して AWS データソースに対して認証を行うことを推奨しています。データソースに入力した認証情報は暗号化され、ゲートウェイクラウドサービスに保存されます。認証情報はオンプレミスのゲートウェイで復号されます。(データソースに入力した認証情報は暗号化され、ゲートウェイクラウドサービスに保存されます。)

Microsoft Power BI の認証情報が安全に管理されていることを確認してください。このサービスへのアクセスにより、AWS データソースへのアクセスと、それらのデータソースに含まれる可能性のある機密情報へのアクセスが許可されます。

パフォーマンス AWS クラウド内の Microsoft オンプレミスデータゲートウェイは通常、Amazon EC2 インスタンスのサイズ変更とスケールアップにより、優れたパフォーマンスを発揮します。また、リージョンのネットワーキングとインターネットへの接続を高速に処理します。
コスト

考慮すべき 3 つの要素は、Amazon EC2 インスタンスの料金、データ転送料金、Amazon NAT ゲートウェイの料金です。

Microsoft の要件に応じて Amazon EC2 インスタンスのサイズを決定します。コストを削減するために、Amazon EC2 リザーブドインスタンスまたは AWS Savings Plans を購入できます。

Microsoft オンプレミスデータゲートウェイから Microsoft BI サービスに転送されるデータには、VPC 出力料金が発生します。お客様からのレポートによると、データゲートウェイを使用することで 10:1 の圧縮率が達成されて、トラフィック量が削減されますが、関連するデータのみが転送されるように、クエリを制限し、フィルタを使用することをお勧めします。

Microsoft オンプレミスデータゲートウェイが異なるアベイラビリティーゾーンまたは異なる AWS リージョン内のデータソースに接続する場合、データ転送料金も適用されます。

Microsoft オンプレミスデータゲートウェイがプライベートサブネットに配置され、AWS NAT ゲートウェイを使用する場合、時間単位の料金およびデータ処理量に応じた料金が適用されます。詳細については、「Amazon VPC の料金」を参照してください。