As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Um identificador de dados personalizado é um conjunto de critérios que você define para detectar dados confidenciais em objetos do Amazon Simple Storage Service (Amazon S3). Ao criar um identificador de dados personalizado, você especifica uma expressão regular (regex) que define um padrão de texto para corresponder a um objeto S3. Você também pode especificar sequências de caracteres e uma regra de proximidade que refina os resultados. As sequências de caracteres podem ser: palavras-chave, que são palavras ou frases que devem estar próximas ao texto que corresponde ao regex, ou ignorar palavras, que são palavras ou frases para excluir dos resultados. Ao usar identificadores de dados personalizados, você pode complementar os identificadores de dados gerenciados fornecidos pelo Amazon Macie e detectar dados confidenciais que refletem cenários, propriedade intelectual ou dados proprietários particulares da organização.
Por exemplo, muitas empresas têm uma sintaxe específica para funcionários IDs. Uma dessas sintaxes pode ser: uma letra maiúscula que indica se o funcionário é funcionário em tempo integral (F) ou meio período (P), seguida por um hífen (-), seguido por uma sequência de oito dígitos que identifica o funcionário. Os exemplos são: F—12345678 para um funcionário em tempo integral e P—87654321 para um funcionário em tempo parcial. Para detectar funcionários IDs que usam essa sintaxe, você pode criar um identificador de dados personalizado que especifique o seguinte regex:. [A-Z]-\d{8}
Para refinar a análise e evitar falsos positivos, você também pode configurar o identificador para usar palavras-chave (employee
e employee ID
) e uma distância máxima de correspondência de 20 caracteres. Com esses critérios, os resultados incluem texto que corresponda ao regex se o texto ocorrer após a palavra-chave funcionário ou ID do funcionário e todo o texto ocorrer dentro de 20 caracteres de uma dessas palavras-chave.
Para ver uma demonstração de como as palavras-chave podem ajudar você a encontrar dados confidenciais e evitar falsos positivos, assista ao vídeo a seguir:
Além dos critérios de detecção, você pode especificar configurações de severidade personalizadas para as descobertas produzidas por um identificador de dados personalizado. A severidade pode ser baseada no número de ocorrências de texto que correspondem aos critérios de detecção do identificador. Se você não especificar essas configurações, o Macie atribuirá automaticamente a severidade Média a todas as descobertas produzidas pelo identificador. A severidade não muda com base no número de ocorrências de texto que correspondem aos critérios de detecção do identificador.
Para obter informações detalhadas sobre estas e outras configurações, consulte Opções de configuração para identificadores de dados personalizados.
Para criar um identificador de dados personalizado
Você pode criar um identificador de dados personalizado usando o console do Amazon Macie ou a API do Amazon Macie.
Siga estas etapas para criar um identificador de dados personalizado usando o console do Amazon Macie.
Para criar um identificador de dados personalizado
Abra o console do Amazon Macie em. https://console.aws.amazon.com/macie/
-
No painel de navegação, em Configurações, escolha Identificadores de dados personalizados.
-
Escolha Criar.
-
Para Nome insira um nome para o identificador de dados personalizado. Um nome pode conter até 128 caracteres.
-
Em Descrição, você pode inserir uma breve descrição do identificador de dados personalizado. A descrição pode conter até 512 caracteres.
nota
Evite incluir dados confidenciais no nome ou na descrição de um identificador de dados personalizado. Outros usuários da sua conta podem acessar o nome ou a descrição, dependendo das ações que eles estão autorizados a realizar no Macie.
-
Para Expressão regular, insira a expressão regular (regex) que define o padrão de texto a ser correspondido. Um nome regex pode conter até 512 caracteres.
O Macie suporta um subconjunto da sintaxe do padrão fornecida pela biblioteca Perl Compatible Regular Expressions (PCRE)
. Para obter outros detalhes e dicas, consulte Critérios de detecção para identificadores de dados personalizados. -
Em Palavras-chave, você pode inserir até 50 sequências de caracteres (separadas por vírgulas) para definir um texto específico que deve estar próximo ao texto que corresponde ao padrão regex.
O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.
-
Em Ignorar palavras, opcionalmente, insira até 10 sequências de caracteres (separadas por vírgulas) que definam um texto específico a ser excluído dos resultados.
O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.
-
Em Distância máxima de correspondência, você pode inserir o número máximo de caracteres que pode existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.
O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.
-
Em Severidade, escolha como determinar a severidade das descobertas de dados confidenciais produzidas pelo identificador de dados personalizado:
-
Para atribuir automaticamente a gravidade Média a todas as descobertas, escolha Usar gravidade Média para qualquer número de correspondências (padrão). Com essa opção, o Macie atribui automaticamente a gravidadeMédia a uma descoberta se o objeto S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.
-
Para atribuir gravidade com base nos limites de ocorrências que você especificar, escolha Usar configurações personalizadas para determinar a gravidade. Em seguida, use as opções Limite de ocorrências e Nível de severidade para especificar o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma severidade selecionada.
Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: Baixo (menos grave), Médio ou Alto (mais grave). Se você especificar mais de um, os limites deverão estar em ordem crescente por gravidade, de Baixo a Alto. Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo, o Macie não criará uma descoberta.
-
-
(Opcional) Em Tags, escolha Adicionar tag e, em seguida, insira até 50 tags para atribuir ao trabalho.
Uma tag é um rótulo que você define e atribui a determinados tipos de AWS recursos. Cada tag consiste em uma chave de tag necessária e um valor de tag opcional. As tags podem ajudá-lo a identificar, categorizar e gerenciar recursos de diferentes maneiras, como por finalidade, proprietário, ambiente ou outros critérios. Para saber mais, consulte Marcar recursos do Macie.
-
(Opcional) Em Avaliar, insira até 1.000 caracteres na caixa Dados da amostra e escolha Testar para testar os critérios de detecção. Macie avalia os dados da amostra e relata o número de ocorrências de texto que correspondem aos critérios. Você pode repetir essa etapa quantas vezes quiser para refinar e otimizar os critérios.
nota
É altamente recomendável que você teste e refine os critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas e resultados de descobertas de dados confidenciais.
-
Quando terminar, escolha Enviar.
O Macie testa as configurações e verifica se pode compilar o regex. Se houver um problema com uma configuração ou com o regex, o Macie exibirá um erro descrevendo o que aconteceu. Depois de resolver qualquer problema, você pode salvar o identificador de dados personalizado.
Depois de criar o identificador de dados personalizado, você pode criar e configurar trabalhos de descoberta de dados confidenciais para usá-lo ou adicioná-lo às suas configurações para descoberta automática de dados confidenciais.