Proteção de dados no Athena - Amazon Athena

Proteção de dados no Athena

O AWS modelo de responsabilidade compartilhada é aplicado à proteção de dados no Amazon Athena. Conforme descrito nesse modelo, AWS é responsável por proteger a infraestrutura global que executa todas as Nuvem AWS. Você é responsável por manter o controle sobre seu conteúdo hospedado nessa infraestrutura. Você também é responsável pelas tarefas de configuração e gerenciamento de segurança dos serviços da AWS que usa. Para obter mais informações sobre a privacidade de dados, consulte as Perguntas Frequentes sobre Privacidade de Dados.. Para obter mais informações sobre a proteção de dados na Europa, consulte a postagem do blog AWS Shared Responsibility Model and GDPR no Blog de segurança da AWS.

Para fins de proteção de dados, recomendamos que você proteja as credenciais da Conta da AWS e configure as contas de usuário individuais com AWS IAM Identity Center ou AWS Identity and Access Management (IAM). Dessa maneira, cada usuário receberá apenas as permissões necessárias para cumprir suas obrigações de trabalho. Recomendamos também que você proteja seus dados das seguintes formas:

  • Use uma autenticação multifator (MFA) com cada conta.

  • Use SSL/TLS para se comunicar com os recursos da AWS. Exigimos TLS 1.2 e recomendamos TLS 1.3.

  • Configure a API e atividade do usuário logando com AWS CloudTrail.

  • Use as soluções de criptografia AWS, juntamente com todos os controles de segurança padrão em serviços da AWS.

  • Use serviços gerenciados de segurança avançada, como o Amazon Macie, que ajuda a localizar e proteger dados sigilosos armazenados no Amazon S3.

  • Se você precisar de módulos criptográficos validados pelo FIPS 140-3 ao acessar a AWS por meio de uma interface de linha de comando ou uma API, use um endpoint do FIPS. Para obter mais informações sobre endpoints do FIPS disponíveis, consulte Federal Information Processing Standard (FIPS) 140-3.

É altamente recomendável que nunca sejam colocadas informações de identificação confidenciais, como endereços de e-mail dos seus clientes, em marcações ou campos de formato livre, como um campo Nome. Isso inclui o trabalho com o Athena ou outros serviços da AWS por meio do console, da API, da AWS CLI ou dos AWS SDKs. Quaisquer dados inseridos em tags ou campos de texto de formato livre usados para nomes podem ser usados para logs de faturamento ou de diagnóstico. Se você fornecer um URL para um servidor externo, recomendemos fortemente que não sejam incluídas informações de credenciais no URL para validar a solicitação a esse servidor.

Como uma etapa de segurança adicional, é possível usar chave de contexto da condição global aws:CalledVia para limitar as solicitações somente àquelas feitas pelo Athena. Para ter mais informações, consulte Usar o Athena com chaves de contexto CalledVia.

Proteger vários tipos de dados

Vários tipos de dados estão envolvidos ao usar o Athena para criar bancos de dados e tabelas. Eles incluem dados de origem armazenados na origem no Amazon S3, metadados de bancos de dados e tabelas que você cria ao executar consultas ou o crawler do AWS Glue para descobrir dados, dados de resultados de consultas e histórico de consultas. Esta seção discute cada tipo de dado e fornece orientação sobre a proteção.

  • Dados de origem: você armazena os dados de bancos de dados e tabelas no Amazon S3, e o Athena não os modifica. Para obter mais informações, consulte Proteção de dados no Amazon S3 no Guia do usuário do Amazon Simple Storage Service. Você controla o acesso aos seus dados de origem e pode criptografá-los no Amazon S3. Você pode usar o Athena para criar tabelas com base em conjuntos de dados criptografados no Amazon S3.

  • Metadados de tabelas e bancos de dados (esquema): o Athena usa a tecnologia schema-on-read (esquema na leitura), o que significa que as definições de tabela são aplicadas aos dados no Amazon S3 quando o Athena executa consultas. Todos os esquemas que você definir serão automaticamente salvos, a não ser que você os exclua explicitamente. No Athena, você pode modificar os metadados do catálogo de dados usando instruções DDL. Você também pode excluir as definições de tabela e o esquema sem afetar os dados subjacentes armazenados no Amazon S3. Os metadados dos bancos de dados e das tabelas que você usa no Athena são armazenados no AWS Glue Data Catalog.

    Você pode definir políticas de acesso granulares para bancos de dados e tabelas registrados no AWS Glue Data Catalog usando o AWS Identity and Access Management (IAM). Você também pode criptografar metadados no AWS Glue Data Catalog. Se você criptografar os metadados, use permissões para metadados criptografados para o acesso.

  • Resultados e histórico de consultas, incluindo consultas salvas: os resultados das consultas são armazenados em um local no Amazon S3 que pode ser especificado globalmente ou para cada grupo de trabalho. Se não for especificado, o Athena usará o local padrão em cada caso. Você controla o acesso aos buckets do Amazon S3 nos quais armazena os resultados das consultas e as consultas salvas. Você também pode criptografar os resultados da consulta armazenados no Amazon S3. Seus usuários devem ter as devidas permissões para acessar os locais do Amazon S3 e descriptografar os arquivos. Para obter mais informações, consulte Criptografar resultados das consultas do Athena armazenados no Amazon S3 neste documento.

    O Athena mantém o histórico de consultas por 45 dias. Você pode visualizar o histórico de consultas usando as APIs do Athena, o console e a AWS CLI. Para armazenar as consultas para mais de 45 dias, salve-as. Para proteger o acesso às consultas salvas, use os grupos de trabalho no Athena, restringindo o acesso às consultas salvas somente para os usuários autorizados a visualizá-las.