Requisitos de palavras-chave para identificadores de dados gerenciados - Amazon Macie

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Requisitos de palavras-chave para identificadores de dados gerenciados

Para detectar determinados tipos de dados confidenciais usando identificadores de dados gerenciados, o Amazon Macie exige que uma palavra-chave esteja próxima aos dados. Se esse for o caso de um tipo específico de dados, os tópicos de referência nesta seção indicam os requisitos de palavras-chave para esses dados.

Se uma palavra-chave precisar estar próxima de um tipo específico de dados, a palavra-chave normalmente precisará estar dentro de 30 caracteres (inclusive) dos dados. Os requisitos adicionais de proximidade variam com base no tipo de arquivo ou no formato de armazenamento de um objeto do Amazon Simple Storage Service (Amazon S3).

Dados estruturados e colunares

Para dados colunares, uma palavra-chave precisa fazer parte do mesmo valor ou estar no nome da coluna ou campo que armazena um valor. Esse é o caso das pastas de trabalho, CSV arquivos e TSV arquivos do Microsoft Excel.

Por exemplo, se o valor de um campo contiver ambos SSNe um número de nove dígitos que usa a sintaxe de um número do Seguro Social dos EUA (SSN), Macie poderá detectá-los no campo. SSN Da mesma forma, se o nome de uma coluna contiver SSN, o Macie poderá detectar cada um SSN na coluna. Macie trata os valores nessa coluna como se estivessem próximos da palavra-chave SSN.

Dados estruturados e baseados em registros

Para dados baseados em registros, uma palavra-chave precisa fazer parte do mesmo valor ou estar no nome de um elemento do caminho para o campo ou matriz que armazena um valor. Esse é o caso dos contêineres de objetos do Apache Avro, dos arquivos do Apache Parquet, dos arquivos e dos JSON arquivos Lines. JSON

Por exemplo, se o valor de um campo contiver credenciais e uma sequência de caracteres que usa a sintaxe de um AWS chave de acesso secreta, Macie pode detectar a chave no campo. Da mesma forma, se o caminho para um campo for$.credentials.aws.key, o Macie pode detectar um AWS chave de acesso secreta no campo. O Macie trata o valor no campo como estando próximo às credenciais da palavra-chave.

Dados não estruturados

Não há requisitos adicionais de proximidade para arquivos em formato de documento portátil da Adobe, documentos do Microsoft Word, mensagens de e-mail e arquivos de texto não binários além deCSV,JSON, JSON Linhas e TSV arquivos. Uma palavra-chave normalmente precisa estar dentro de 30 caracteres (inclusive) dos dados. Isso inclui quaisquer dados estruturados, como tabelas, nesses tipos de arquivos.

As palavras-chave não diferenciam maiúsculas de minúsculas. Além disso, se uma palavra-chave contiver um espaço, o Macie faz automaticamente a correspondência com as variações de palavras-chave que não contêm o espaço ou contêm um sublinhado (_) ou um hífen (-) em vez do espaço. Em certos casos, o Macie também estende ou abrevia uma palavra-chave para abordar variações comuns da palavra-chave.

Para uma demonstração de como as palavras-chave fornecem contexto e ajudam o Macie a detectar tipos específicos de dados confidenciais, assista ao vídeo a seguir: