Creación de un identificador de datos personalizado - Amazon Macie

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de un identificador de datos personalizado

Un identificador de datos personalizado es un conjunto de criterios que se definen para detectar datos confidenciales en objetos de Amazon Simple Storage Service (Amazon S3). Al crear un identificador de datos personalizado, se especifica una expresión regular (regex) que define un patrón de texto que debe coincidir en un objeto de S3. También puede especificar secuencias de caracteres y una regla de proximidad para refinar los resultados. Las secuencias de caracteres pueden ser: palabras clave, que son palabras o frases que deben estar cerca del texto que coincide con la expresión regular, o palabras ignoradas, que son palabras o frases que se deben excluir de los resultados. Al utilizar identificadores de datos personalizados, puede complementar los identificadores de datos gestionados que proporciona Amazon Macie y detectar datos confidenciales que reflejen los escenarios, la propiedad intelectual o los datos patentados particulares de su organización.

Por ejemplo, muchas empresas tienen una sintaxis específica para los empleados. IDs Una de esas sintaxis podría ser: una letra mayúscula que indique si un empleado es empleado a tiempo completo (F) o a tiempo parcial (P), seguida de un guión (—) y una secuencia de ocho dígitos que identifica al empleado. Algunos ejemplos son: F—12345678, para un empleado a tiempo completo, y P—87654321, para un empleado a tiempo parcial. Si crea un identificador de datos personalizado para detectar a los empleados IDs que utilizan esta sintaxis, puede utilizar la siguiente expresión regular:. [A-Z]-\d{8} Para afinar el análisis y evitar los falsos positivos, también puedes configurar el identificador para que utilice palabras clave (employeeyemployee ID) y una distancia máxima de coincidencia de 20 caracteres. Con estos criterios, los resultados incluyen texto que coincida con la expresión regular solo si el texto aparece después de la palabra clave empleado o identificador de empleado y todo el texto aparece dentro de los 20 caracteres de una de esas palabras clave.

Para ver una demostración de cómo las palabras clave pueden ayudarle a encontrar datos confidenciales y evitar falsos positivos, vea el siguiente vídeo:

Además de los criterios de detección, si lo desea, puede especificar una configuración de gravedad personalizada para los hallazgos que produzca un identificador de datos personalizado. La gravedad se puede basar en el número de apariciones de texto que coincidan con los criterios de detección del identificador. Si no especificas estos ajustes, Macie asigna automáticamente la gravedad media a todos los hallazgos que produzca el identificador. La gravedad no cambia en función del número de apariciones de texto que coincidan con los criterios de detección del identificador.

Para obtener información detallada sobre estas y otras configuraciones, consulteOpciones de configuración para identificadores de datos personalizados.

Para crear un identificador de datos personalizado

Siga estos pasos para crear un identificador de datos personalizado mediante la consola de Amazon Macie. Para crear un identificador de datos personalizado mediante programación, utilice la CreateCustomDataIdentifieroperación de Amazon Macie. API

  1. Abra la consola Amazon Macie en. https://console.aws.amazon.com/macie/

  2. En el panel de navegación, en Configuración, elija Identificadores de datos personalizados.

  3. Seleccione Crear.

  4. En Nombre, introduzca un nombre único para el identificador de datos personalizado. El nombre puede contener hasta 128 caracteres.

  5. En Descripción, si lo desea, introduzca una breve descripción del identificador de datos personalizado. La descripción puede contener hasta 512 caracteres.

    nota

    Evite incluir datos confidenciales en el nombre o la descripción de un identificador de datos personalizado. Es posible que otros usuarios de tu cuenta puedan ver el nombre o la descripción, en función de las acciones que estén autorizados a realizar en Macie.

  6. En Expresión regular, introduzca la expresión regular (regex) que define el patrón de texto que debe coincidir. La expresión regular puede contener hasta 512 caracteres.

    Macie admite un subconjunto de la sintaxis de patrones proporcionada por la biblioteca Perl Compatible Regular Expressions (). PCRE Para obtener información y consejos adicionales, consulte Criterios de detección para identificadores de datos personalizados.

  7. En el caso de las palabras clave, si lo desea, introduzca hasta 50 secuencias de caracteres (separadas por comas) para definir un texto específico que debe estar cerca del texto que coincida con el patrón de expresiones regulares.

    Macie incluye una aparición en los resultados solo si el texto coincide con el patrón de expresiones regulares y el texto se encuentra dentro de la distancia máxima de coincidencia de una de estas palabras clave. Cada palabra clave puede contener de 3 UTF a 90 a 8 caracteres. Las palabras clave no distinguen entre mayúsculas y minúsculas.

  8. En Ignorar palabras, si lo desea, introduzca hasta 10 secuencias de caracteres (separadas por comas) que definan un texto específico para excluirlo de los resultados.

    Macie excluye una aparición de los resultados si el texto coincide con el patrón de expresiones regulares pero contiene una de estas palabras para omitir. Cada palabra ignorada puede contener de 4 a 90 a UTF 8 caracteres. Las palabras ignoradas distinguen mayúsculas de minúsculas.

  9. En Distancia máxima de coincidencia, si lo desea, introduzca el número máximo de caracteres que pueden existir entre el final de una palabra clave y el final del texto que coincida con el patrón de expresiones regulares.

    Macie incluye una aparición en los resultados solo si el texto coincide con el patrón de expresiones regulares y el texto se encuentra dentro de esta distancia de una palabra clave completa. La distancia puede ser de 1 a 300 caracteres. La distancia por defecto es de 50 caracteres.

  10. En Gravedad, elija cómo determinar la gravedad de los hallazgos de datos confidenciales que produce el identificador de datos personalizado:

    • Para asignar automáticamente la gravedad media a todos los resultados, seleccione Utilizar una gravedad media para cualquier número de coincidencias (opción predeterminada). Con esta opción, Macie asigna automáticamente la gravedad media a un resultado si el objeto de S3 afectado contiene una o más apariciones de texto que coinciden con los criterios de detección.

    • Para asignar la gravedad en función de los umbrales de aparición que especifique, elija Usar una configuración personalizada para determinar la gravedad. A continuación, utilice las opciones Umbral de ocurrencias y Nivel de gravedad para especificar el número mínimo de coincidencias que deben existir en un objeto de S3 para obtener un resultado con la gravedad seleccionada.

      Puedes especificar hasta tres umbrales de incidencia, uno para cada nivel de gravedad que admita Macie: bajo (menos grave), medio o alto (más grave). Si especifica más de uno, los umbrales deben estar en orden ascendente según la gravedad, pasando de bajo a alto. Si un objeto de S3 contiene menos apariciones que el umbral más bajo especificado, Macie no crea ningún resultado.

  11. (Opcional) En el caso de las etiquetas, elija Añadir etiqueta y, a continuación, introduzca hasta 50 etiquetas para asignarlas al identificador de datos personalizado.

    Una etiqueta es una etiqueta que se define y se asigna a determinados tipos de AWS recursos. Cada etiqueta consta de una clave de etiqueta necesaria y un valor de etiqueta opcional. Las etiquetas pueden ayudarle a identificar, clasificar y administrar recursos de distintas formas, como por finalidad, propietario, entorno u otros criterios. Para obtener más información, consulte Etiquetado de los recursos de Macie.

  12. (Opcional) En Evaluar, introduzca hasta 1000 caracteres en el cuadro de Datos de muestra y, a continuación, elija Probar para probar los criterios de detección. Macie evalúa los datos de la muestra e informa del número de apariciones de texto que coinciden con los criterios. Puede repetir este paso tantas veces como desee para refinar y optimizar los criterios.

    nota

    Le recomendamos encarecidamente que pruebe y ajuste los criterios de detección antes de guardar el identificador de datos personalizado. Dado que los identificadores de datos personalizados se utilizan en los trabajos de detección de información confidencial, no puede editar un identificador de datos personalizado después de guardarlo. Esto ayuda a garantizar que tiene un historial inmutable de resultados de datos confidenciales y resultados de detección para las auditorías o investigaciones de privacidad y protección de datos que lleve a cabo.

  13. Cuando haya terminado, elija Enviar.

Macie comprueba la configuración y verifica que puede compilar la expresión regular. Si hay algún problema con una configuración o con la expresión regular, Macie muestra un error que describe el problema. Una vez solucionados los problemas, puede guardar el identificador de datos personalizado. A continuación, puede crear y configurar tareas de detección de datos confidenciales para utilizar el identificador, o añadir el identificador a su configuración para la detección automática de datos confidenciales.