AWS VPN을 통해 데이터 원본에 연결 - AWS 클라우드에서 Microsoft Power BI 사용

AWS VPN을 통해 데이터 원본에 연결

이 모델에서 Power BI Desktop 설치는 두 가지 AWS VPN 방법인 AWS Site-to-Site VPN 또는 AWS Client VPN 중 하나를 사용하여 AWS 네트워크의 데이터 원본에 연결합니다. 각 연결 유형은 네트워크 트래픽을 보호하는 탄력적인 고가용성 관리형 클라우드 VPN 솔루션을 제공합니다.

Site-to-Site VPN은 네트워크와 AWS VPN 또는 AWS Transit Gateway 사이에 암호화된 터널을 생성합니다. Client VPN은 무료 VPN 소프트웨어 클라이언트를 사용하여 사용자를 AWS 또는 온프레미스 리소스에 연결합니다.

Site-to-Site VPN 및 Client VPN 연결을 통한 VPN 트래픽은 VPC에서 멈춥니다. 따라서 프라이빗 IP 주소로 라우팅할 수 있으므로 인스턴스에 더 이상 퍼블릭 IP 주소가 필요하지 않습니다. Athena와 같이 공개 서비스 엔드포인트에서 액세스할 수 있는 데이터 경로가 있는 서비스의 경우 이러한 서비스 요청은 인터넷을 통해 또는 VPN 연결 및 VPC 엔드포인트를 통해 라우팅될 수 있습니다.

Power BI Desktop이 Site-to-Site VPN 및 Client VPN을 통해 AWS 데이터 원본에 연결하는 방법을 보여주는 다이어그램.

Power BI Desktop을 Site-to-Site VPN 및 Client VPN을 통해 AWS 데이터 원본에 연결

Site-to-Site VPN은 또한 AWS Transit Gateway에 연결할 수 있습니다. 그러면 여러 VPC에 분산되어 있는 데이터 원본에 쉽게 액세스할 수 있습니다.

AWS VPN을 사용하면 각 데이터 원본을 명시적으로 구성할 필요 없이 AWS에 저장된 데이터 원본에 액세스할 때 암호화를 사용할 수 있다는 이점이 있습니다. 일단 구성되면 최종 사용자가 VPN 기술을 대부분 원활하게 사용할 수 있습니다.

표 2 - AWS VPN을 사용하여 AWS 데이터 원본에 액세스할 때의 고려 사항

기준 AWS VPN을 사용하여 AWS 데이터 원본에 액세스할 때의 고려 사항
네트워크 연결 VPC의 프라이빗 IP 주소에 연결하거나 리전 또는 VPC 서비스 엔드포인트를 사용하여 데이터 원본을 사용할 수 있습니다. Power BI Desktop은 VPN을 통해 연결하고 데이터 원본(Amazon RDS, Amazon Redshift, Amazon EC2 기반 데이터 원본)에 직접 액세스하거나, 리전 엔드포인트(Amazon Athena)가 있는 서비스의 경우 DNS 구성에 따라 프라이빗 VPC 엔드포인트 또는 리전 엔드포인트를 사용하여 액세스합니다.
보안 IP 액세스 제어

라우팅과 보안 그룹을 조합하여 AWS 클라우드에 저장된 데이터 원본에 대한 액세스를 제어할 수 있습니다.

전송 중 데이터 암호화

두 유형의 AWS VPN 모두 IPsec 암호화를 사용합니다. 즉, 전송되는 데이터가 AWS와 온프레미스 간에 이동할 때 암호화됩니다. 이렇게 하면 데이터 원본이 암호화된 통신을 사용하도록 구성되지 않은 경우에도 해당 데이터가 인터넷을 통과하는 동안 보호됩니다.

인증

Site-to-Site VPN은 일회성 구성이 필요하며 일단 설정되면 사용자가 원활하게 사용할 수 있습니다. 최종 사용자는 Site-to-Site VPN을 사용하기 위해 인증할 필요가 없지만 데이터 원본에 대한 인증이 필요합니다.

반면 Client VPN은 최종 사용자가 연결을 설정하려면 인증이 필요합니다. Client VPN 인증은 Active Directory(사용자 기반), 상호 인증(인증서 기반) 또는 SAML SSO(사용자 기반)를 통해 수행할 수 있습니다. 인증되면 최종 사용자가 원활하게 연결됩니다. Power BI Desktop에 추가된 AWS 데이터 원본을 사용하려면 인증이 필요합니다.

필요한 데이터 집합에 대해서만 읽기 전용 액세스 권한이 있는 자격 증명을 사용하여 AWS 데이터 원본에 인증하는 것이 좋습니다.

성능

AWS VPN의 사용은 인터넷을 통해 이루어집니다. 따라서 성능 범위는 첫 번째로 제시된 시나리오와 유사합니다. 인터넷을 통해 AWS 데이터 원본에 액세스할 때 몇 가지 요소가 전체 Power BI Desktop 성능에 영향을 줄 수 있습니다. 여기에는 다음이 포함됩니다.

  • 액세스되는 데이터 집합의 크기. 데이터 집합이 클수록 검색하는 데 시간이 더 오래 걸립니다. 쿼리를 제한하고 필터를 사용하여 인터넷을 통해 검색되는 데이터의 양을 줄이는 것이 좋습니다.

  • 대역폭, 대기 시간, 패킷 손실 등의 인터넷 연결 품질. 가능한 경우 지리적으로 가까운 AWS 리전의 데이터에 액세스합니다. 이렇게 하면 대기 시간의 영향이 줄어듭니다. 인터넷을 공유하는 경우 사용량이 적은 시간에 데이터 원본을 로드하거나 사용 가능한 대역폭을 충분히 확보하는 것이 좋습니다.

일반적으로 서로 다른 일중 시간대에 다양한 데이터 집합을 사용하고 점차 사용자를 늘려가며 환경을 테스트하는 것이 좋습니다.

비용 VPC에 상주하고 AWS VPN을 사용하여 쿼리되는 데이터 원본에는 AWS VPN 표준 데이터 전송 요금이 부과됩니다. 비용을 절감하려면 쿼리를 제한하고 필터를 사용하여 인터넷을 통해 검색되는 데이터의 양을 줄이는 것이 좋습니다.