Connexion du service Microsoft Power BI aux sources de données AWS - Utilisation de Microsoft Power BI avec le AWS Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Connexion du service Microsoft Power BI aux sources de données AWS

Le service Microsoft Power BI (SaaS) peut être connecté directement à des sources de données accessibles sur Internet ou à des sources de données privées dans un Amazon VPC. La connexion à des sources de données privées nécessite un composant d'application appelé passerelle de données Microsoft on-premises. La passerelle de données Microsoft sur site est téléchargée et installée sur une EC2 instance Amazon dans le VPC et configurée avec les informations d'identification Microsoft Power BI. La passerelle établit une connexion sortante au Microsoft Azure Service Bus via Internet et est configurée dans Microsoft Power BI pour se connecter aux sources de données auxquelles elle peut accéder. Les déploiements de plus grande envergure peuvent utiliser plusieurs passerelles de données sur site pour équilibrer la charge ou augmenter la tolérance aux pannes.

L'utilisation de la passerelle de données Microsoft sur site offre un certain nombre d'avantages substantiels qui ont été signalés par les clients d'AWS :

  • Position de sécurité améliorée : la passerelle de données Microsoft sur site n'accepte pas les connexions entrantes en provenance du cloud Microsoft Azure et initie uniquement des connexions sortantes vers Azure Service Bus. Ce modèle de trafic unidirectionnel vous permet de préserver la confidentialité de vos sources de données et de ne pas les exposer sur Internet.

  • Réduction des transferts de données sortants : lors de la connexion à une source de données, la passerelle de données Microsoft sur site récupère l'ensemble des résultats et le stocke localement dans le cadre d'un processus appelé spoulage. Avant que les résultats ne soient transmis au service Power BI, les données sont compressées. Les utilisateurs signalent généralement des taux de compression de 10:1, ce qui réduit non seulement le temps de transmission des données sur Internet, mais aussi les frais de sortie.

  • Coûts de solution réduits : lorsque la passerelle de données Microsoft sur site est utilisée, une partie du traitement des données requis par le service est effectuée par la passerelle à la place. L'utilisation d'Amazon EC2, associée à des plans de réduction des coûts tels que Savings Plans ou Reserved Instances, peut vous aider à réduire le coût global de votre solution de BI.

AWS vous recommande d'installer la passerelle de données Microsoft sur site sur une EC2 instance Amazon dans le sous-réseau privé qui contient vos sources de données. Ce sous-réseau est configuré pour acheminer les demandes vers Internet via une passerelle NAT Amazon VPC installée dans un sous-réseau public. Vous pouvez utiliser une passerelle de traduction d'adresses réseau (NAT) pour permettre aux instances d'un sous-réseau privé de se connecter à Internet ou à d'autres AWS services, mais empêcher Internet de se connecter à ces instances. Si vous avez besoin d'une mise en œuvre d'une passerelle de données à haute disponibilité, nous vous recommandons d'utiliser un cluster de passerelles de données locales installées sur plusieurs EC2 instances couvrant différentes zones de AWS disponibilité. Pour plus d'informations, voir Ajouter une autre passerelle pour créer un cluster.

Les options présentées dans cette section illustrent Amazon RDS, Amazon Redshift et Amazon Athena. Pour une analyse complète de toutes les sources de AWS données, reportez-vous àAnnexe : Sources de données AWS prises en charge par Microsoft Power BI.

Schéma illustrant AWS les sources de données se connectant au service Microsoft Power BI.

Connexion AWS de sources de données au service Microsoft Power BI

Considérations supplémentaires

Tableau 5 — Considérations relatives au service Microsoft Power BI avec des sources de données dans le AWS Cloud

Critères Considérations relatives au service Microsoft Power BI avec des sources de données dans le AWS Cloud
Connectivité réseau

La connectivité de la passerelle de données sur site Microsoft aux sources de données est simple car le consommateur de données et les sources de données résident dans le cloud AWS. Les sources de données hébergées dans un Amazon VPC, telles qu'Amazon RDS et Amazon Redshift, sont directement accessibles. Les sources de données qui utilisent des points de terminaison régionaux sont accessibles via la passerelle Internet Amazon VPC ou via un point de terminaison Amazon VPC.

La connectivité de la passerelle de données Microsoft sur site au service Microsoft Power BI se fait via Internet et est uniquement une connexion sortante.

Sécurité Contrôle d'accès IP

Vous pouvez utiliser une combinaison de groupes de routage et de sécurité pour contrôler l'accès aux sources de données stockées dans le cloud AWS.

La passerelle de données Microsoft sur site étant installée sur une EC2 instance Amazon, elle sera associée à un groupe de sécurité qui pourra être utilisé pour limiter l'accès entrant au système d'exploitation. La passerelle n'accepte pas les demandes entrantes. L'instance n'a pas besoin d'adresse IP publique et ne doit pas être configurée avec une telle adresse.

Chiffrement en transit

Nous recommandons que les sources de données au sein d'un Amazon VPC soient configurées pour utiliser le chiffrement lors de la transmission des données. Les services régionaux utilisent déjà le chiffrement TLS.

La connectivité de la passerelle de données Microsoft sur site peut être configurée pour se connecter au Microsoft Azure Service Bus à l'aide du protocole HTTPS au lieu du protocole TCP. Nous vous recommandons d'utiliser le mode HTTPS pour communiquer. Il s'agit également de la valeur par défaut pour les nouvelles installations de passerelle depuis la sortie de la version logicielle de passerelle de juin 2019.

Authentification

AWS vous recommande de vous authentifier auprès des sources de données AWS en utilisant une identité qui dispose d'un accès en lecture seule aux ensembles de données requis. Les informations d'identification que vous entrez pour une source de données sont cryptées et stockées dans le service cloud Gateway. Les informations d'identification sont déchiffrées sur la passerelle sur site. (Les informations d'identification que vous entrez pour une source de données sont cryptées et stockées dans le service cloud Gateway.)

Assurez-vous que les informations d'identification Microsoft Power BI sont contrôlées de manière sécurisée. L'accès au service permet d'accéder aux sources de données AWS et aux informations potentiellement sensibles qu'elles peuvent contenir.

Rendement La passerelle de données Microsoft sur site dans le cloud AWS fonctionne généralement bien en raison de sa capacité à dimensionner et à faire évoluer l' EC2 instance Amazon. Il fonctionne également rapidement dans les réseaux régionaux et la connectivité à Internet.
Coût

Trois facteurs doivent être pris en compte : les frais d' EC2 instance Amazon, les frais de transfert de données et les frais de passerelle Amazon NAT.

Dimensionnez vos EC2 instances Amazon conformément aux exigences de Microsoft. Pour réduire les coûts, vous pouvez acheter des Amazon EC2 Reserved Instances ou des AWS Savings Plans.

Les données transférées de la passerelle de données Microsoft sur site vers le service Microsoft BI entraînent des frais de sortie VPC. Les clients signalent une compression de 10:1 en utilisant la passerelle de données, ce qui réduira le trafic, mais nous vous recommandons de limiter les requêtes et d'utiliser des filtres pour garantir que seules les données pertinentes sont transférées.

Si la passerelle de données Microsoft sur site se connecte à des sources de données situées dans différentes zones de disponibilité ou différentes régions AWS, des frais de transfert de données s'appliquent également.

Si les passerelles de données Microsoft sur site sont situées dans des sous-réseaux privés et utilisent une passerelle AWS NAT, des frais horaires et de traitement des données s'appliquent. Pour plus d'informations, veuillez consulter Tarification Amazon VPC.