Requisitos de palavras-chave para identificadores de dados gerenciados do Amazon Macie - Amazon Macie

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Requisitos de palavras-chave para identificadores de dados gerenciados do Amazon Macie

Para detectar determinados tipos de dados confidenciais usando identificadores de dados gerenciados, o Amazon Macie exige que uma palavra-chave esteja próxima aos dados. Se esse for o caso de determinado tipo de dado, um tópico posterior nesta seção indicará requisitos específicos da palavra-chave para esses dados.

Se uma palavra-chave precisar estar próxima de um tipo específico de dados, a palavra-chave normalmente precisará estar dentro de 30 caracteres (inclusive) dos dados. Os requisitos adicionais de proximidade variam com base no tipo de arquivo ou no formato de armazenamento de um objeto do Amazon Simple Storage Service (Amazon S3).

Dados estruturados e colunares

Para dados colunares, uma palavra-chave precisa fazer parte do mesmo valor ou estar no nome da coluna ou campo que armazena um valor. Isso vale para pastas de trabalho do Microsoft Excel, arquivos CSV e arquivos TSV.

Por exemplo, se o valor de um campo contiver SSN e um número de nove dígitos que usa a sintaxe de um número do Seguro Social dos EUA (SSN), o Macie poderá detectar o SSN no campo. Da mesma forma, se o nome de uma coluna contiver SSN, o Macie poderá detectar cada SSN na coluna. O Macie trata os valores nessa coluna como se estivessem próximos da palavra-chave SSN.

Dados estruturados e baseados em registros

Para dados baseados em registros, uma palavra-chave precisa fazer parte do mesmo valor ou estar no nome de um elemento do caminho para o campo ou matriz que armazena um valor. Isso vale para contêineres de objetos Apache Avro, arquivos Apache Parquet, arquivos JSON e arquivos JSON Lines.

Por exemplo, se o valor de um campo contém credenciais e uma sequência de caracteres que usa a sintaxe de uma chave de acesso secreta AWS, o Macie pode detectar a chave no campo. Da mesma forma, se o caminho para um campo for $.credentials.aws.key, o Macie poderá detectar uma chave de acesso secreta AWS no campo. O Macie trata o valor no campo como estando próximo às credenciais da palavra-chave.

Dados não estruturados

Não há requisitos adicionais de proximidade para arquivos Adobe Portable Document Format, documentos do Microsoft Word, mensagens de e-mail e arquivos de texto não binários, exceto arquivos CSV, JSON, JSON Lines e TSV. Uma palavra-chave normalmente precisa estar dentro de 30 caracteres (inclusive) dos dados. Isso inclui quaisquer dados estruturados, como tabelas, nesses tipos de arquivos.

As palavras-chave não diferenciam maiúsculas de minúsculas. Além disso, se uma palavra-chave contiver um espaço, o Macie faz automaticamente a correspondência com as variações de palavras-chave que não contêm o espaço ou contêm um sublinhado (_) ou um hífen (-) em vez do espaço. Em certos casos, o Macie também estende ou abrevia uma palavra-chave para abordar variações comuns da palavra-chave.

Para uma demonstração de como as palavras-chave fornecem contexto e ajudam o Macie a detectar tipos específicos de dados confidenciais, assista ao vídeo a seguir: