Etiquetado incoherente Datos confidenciales e incorrectos en las etiquetas

Prácticas de etiquetado que se deben evitar

Si bien hay prácticas que se deben implementar a la hora de etiquetar objetos o infraestructuras AWS, también hay prácticas que se deben evitar.

Etiquetado incoherente

Como se explica en la Objetivos sección, sin el etiquetado no se puede lograr un alto nivel de automatización, limpieza o supervisión. Del mismo modo, en el caso de etiquetas incompletas o incoherentes, la información necesaria para la automatización o la supervisión no es completa, lo que conduce a resultados poco fiables.

Imagine un escenario en el que utilice una estrategia de etiquetado para calcular los costes totales de todos los proyectos. La estrategia comienza en la proof-of-concept fase (PoC) y termina en la fase de producción. Considere los siguientes escenarios con etiquetas aplicadas a los datos y recursos para los ejemplos de previsión de ventas P1, D1 y Pr1 del proyecto y para los ejemplos de mantenimiento posventa del proyecto P2, D2 y Pr2.

Previsión de ventas

Ejemplo P1: proyecto PoC (faltan el dominio y la marca de tiempo).


env: "poc"
project: "sales forecasting"

Ejemplo D1: Fase de desarrollo (falta el dominio).


env: "dev"
project: "sales forecasting"
timestamp: 20210505T12:34:55

Ejemplo Pr1: Fase de producción (existen todos los valores).


env: "prod"
project: "sales forecasting"
domain: "machine learning"
timestamp: 20210505T12:34:55

Para la previsión de ventas del proyecto:

El ejemplo P1 no menciona de qué dominio o marca de tiempo proviene el objeto.
El ejemplo D1 tampoco menciona el dominio del proyecto.
El ejemplo Pr1 tiene todos los datos necesarios.

Los ejemplos P1 y D1 darán lugar a informes o estimaciones de planificación incorrectos porque los dominios no están definidos.

Mantenimiento posventa

Ejemplo P2: proyecto PoC (faltan todas las etiquetas).

Ejemplo D2: Fase de desarrollo (falta el proyecto).


env: "dev"
domain: "machine learning"
timestamp: 20210505T12:34:55

Ejemplo Pr2: Fase de producción (existen todos los valores).


env: "prod"
project: "post sales maintenance"
domain: "machine learning"
timestamp: 20210505T12:34:55

Para el mantenimiento posventa del proyecto:

El ejemplo P2 no tiene ninguna información, por lo que no se puede rastrear.
El ejemplo D2 no menciona el nombre del proyecto, por lo que no se puede rastrear.
El ejemplo Pr2 tiene todos los datos necesarios.

Los ejemplos P2 y D2 darán como resultado informes incorrectos, una planificación insuficiente o una notificación insuficiente debido a la falta de etiquetas o a la incoherencia de las etiquetas.

Por lo tanto, es importante implementar la estrategia de etiquetado de forma coherente.

Datos confidenciales e incorrectos en las etiquetas

El etiquetado puede ser contraproducente si se utiliza con información incorrecta, confidencial o privada. Las etiquetas incorrectas pueden producir resultados engañosos. El uso de etiquetas que incluyen datos confidenciales, como información de identificación personal (PII), puede poner en riesgo la seguridad de sus clientes y empleados.

La información en las etiquetas es incorrecta

Imagine un escenario en el que utilice una estrategia de etiquetado para calcular los costes totales de cada dominio o departamento. Acaba de terminar la fase de ingesta de datos y está avanzando hacia el aprendizaje automático. El siguiente ejemplo incluye etiquetas personalizadas que se han copiado de la fase anterior de un proyecto.


env: "development"
project: "sales prediction"
domain: "data ingestion"
timestamp: 20210505T12:34:55

El dominio está etiquetado incorrectamente como data ingestion de la fase anterior del proyecto, en lugar del dominio correcto, que símachine learning. Ahora, los informes del data ingestion dominio mostrarán los costos, el intervalo de tiempo y la asignación de recursos más altos. El machine learning dominio mostrará valores más bajos para esos informes. Esto provocará una planificación, una asignación presupuestaria y una estimación de los plazos incorrectas.

Tener las etiquetas correctas es esencial para que un sistema funcione.

Información confidencial en las etiquetas

AWS proporciona varias herramientas para identificar la PII en los objetos. Estas herramientas incluyen Amazon Macie y la detección de datos AWS Glue confidenciales para encontrar datos que puedan usarse para identificar a las personas. Sin embargo, es importante no utilizar información personal ni datos confidenciales en las etiquetas.

Considere el siguiente ejemplo de un archivo en Amazon S3 que tiene la PII redactada o anonimizada.


{
  firstName: "67A1790DCA55B8803AD024EE28F616A2",
  lastName: "DRG54654DFHJGDYYRD",
  age: 21,
  city : "Frankfurt",
  probability_of_purchase: 48.858093,
  veggieName: "broccoli",
  creditcard: false
}

Puede ver que se han codificado el nombre y los apellidos del cliente. Sin embargo, en este ejemplo, el registro tiene las siguientes etiquetas personalizadas.


owner: "Company XYZ"
about: "John Doe"
contact: "johnthegreat@email.com"
timestamp: 20210505T12:34:55

En este caso, aunque el archivo en sí no contiene información de identificación personal, las etiquetas sí contienen información confidencial. Esto aumenta la probabilidad de que se filtre información, ya que cuando compartes o transfieres un archivo u objeto, también compartes o transfieres sus metadatos. Esto también se aplica a otros AWS recursos, como una base de datos, tablas, trabajos y funciones.

Por lo tanto, es extremadamente importante evitar el uso de información privada en las etiquetas. El mismo concepto se extiende a la información crucial o no pública.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Prácticas recomendadas

Preguntas frecuentes