インターネット経由でデータソースに接続する - AWS クラウド での Microsoft Power BI の使用

インターネット経由でデータソースに接続する

このモデルでは、Power BI Desktop アプリケーションがインターネット経由で、パブリックにアクセス可能な AWS データソースの IP アドレスにアウトバウンド接続を確立します。例えば、Amazon RDS および Amazon Redshift は、お客様の Amazon Virtual Private Cloud (Amazon VPC) 内にインスタンス化されており、[パブリックアクセシビリティ] オプションを使用してインターネット経由でインスタンスにアクセスできるようにしています。Amazon Athena は、特定のリージョンのサービスエンドポイントを使用して、インターネットから直接クエリを実行できます。

Power BI がインターネット経由で AWS データソースに接続する方法を示す図。

Power BI からインターネット経由での AWS データソースへの接続

この接続方法は技術的には可能ですが、少数のユーザー以外にはお勧めできません。重要な考慮事項を次の表に示します。

表 1 — インターネット経由で AWS データソースにアクセスする際の考慮事項

条件 インターネット経由で AWS データソースにアクセスする際の考慮事項
ネットワーク接続 データソースを利用するために、VPC 内のプライベート IP アドレスに接続するか、リージョン別または VPC サービスのエンドポイントを使用します。Power BI Desktop は、VPN 経由で接続したうえで、データソース (Amazon RDS、Amazon Redshift、Amazon EC2 ベースのデータソース) に直接アクセスします。または、リージョンエンドポイントを使用するサービス (Amazon Athena) の場合は、DNS 設定に応じて、プライベート VPC またはリージョン別のエンドポイントを使用して、それらのデータソースにアクセスします。
セキュリティ

IP アクセスコントロール

セキュリティグループは、インスタンスの仮想ファイアウォールとして機能し、インバウンドトラフィックとアウトバウンドトラフィックをコントロールします。信頼されたエンティティへのアクセスを制限するために、既知の Classless Inter-Domain Routing (CIDR) 範囲に関連付けられたインバウンド IP の範囲のみを許可するようにセキュリティグループを設定します。

転送時の暗号化

AWS では、Amazon RDS、Amazon Redshift、または Amazon EC2 ベースのデータソースなど、パブリック IP アドレスを使用するデータソースに対して暗号化を設定することを推奨しています。これにより、転送中にデータや認証情報が漏洩するリスクが低減されます。暗号化を設定しないと、重大なリスクが生じます。この点を見落とさないでください。

Amazon Athena などのリージョン別サービスエンドポイントは TLS で暗号化されています。さらに、JDBC または ODBC クライアントにストリーミングされる Amazon Athena クエリ結果は、Transport Layer Security (TLS) を使用して暗号化されます。

認証と認可

AWS では、データセットへの読み取り専用アクセスを提供する認証情報を使用し、社内ポリシーに従って認証情報をローテーションするプロセスを設定することを推奨しています。

パフォーマンス

インターネット経由で AWS データソースにアクセスする場合、Power BI Desktop の全体的なパフォーマンスに影響を与える可能性のある要因がいくつかあります。

  • アクセスするデータセットのサイズ。データセットが大きいほど、取得に時間がかかります。クエリを制限し、フィルタを使用して、インターネット経由で取得するデータの量を減らすことをお勧めします。

  • 帯域幅、レイテンシー、パケット損失など、インターネット接続の品質。遅延の影響を軽減するために、可能であれば、地理的に近い AWS リージョンにあるデータにアクセスしてください。インターネット接続を共有している場合は、十分な帯域幅が確保されるように、ピーク時以外の時間帯にデータソースをロードすることを検討してください。

一般的に AWS では、さまざまな時間帯に、さまざまなデータセットを使用して、徐々にユーザー数を増やしながら、エクスペリエンスをテストすることを推奨しています。

コスト VPC 内に存在し、インターネット経由でパブリック IP アドレスを使用してクエリが実行されるデータソースには、標準の Amazon VPC データ出力料金がかかります。コストを削減するために、クエリを制限し、フィルタを使用して、インターネット経由で取得するデータの量を減らすことをお勧めします。