Uso de Amazon S3 con Amazon ML - Amazon Machine Learning

Ya no actualizamos el servicio Amazon Machine Learning ni aceptamos nuevos usuarios para él. Esta documentación está disponible para los usuarios actuales, pero ya no la actualizamos. Para obtener más información, consulte Qué es Amazon Machine Learning.

Uso de Amazon S3 con Amazon ML

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento para Internet. Puede usar Amazon S3 para almacenar y recuperar cualquier cantidad de datos en cualquier momento y desde cualquier parte de la web. Amazon ML utiliza Amazon S3 como repositorio principal de datos para las siguientes tareas:

  • Obtener acceso a sus archivos de entrada y crear objetos de fuente de datos para la formación y evaluación de sus modelos de ML.

  • Obtener acceso a sus archivos de entrada para generar predicciones por lotes.

  • Cuando genere predicciones por lotes mediante la utilización de los modelos de ML, emitir el archivo de predicciones a un bucket de S3 que especifique.

  • Copiar los datos que ha almacenado en Amazon Redshift o Amazon Relational Database Service (Amazon RDS) en un archivo .csv y cargarlos en Amazon S3.

Para permitir que Amazon ML realice estas tareas, debe concederle permisos a Amazon ML para que obtenga acceso a sus datos de Amazon S3.

nota

No puede extraer archivos de predicción por lotes en un bucket de S3 que solo acepta archivos cifrados en el servidor. Asegúrese de que la directiva de bucket permite cargar archivos sin cifrar confirmando que la política no incluye un efecto Deny para la acción s3:PutObject cuando no existe ningún encabezado s3:x-amz-server-side-encryption en la solicitud. Para obtener más información sobre las políticas de buckets de cifrado del lado del servidor de S3, consulte Protección de datos mediante cifrado del lado del servidor en la Guía del usuario de Amazon Simple Storage Service.

Carga de datos en Amazon S3

Debe cargar los datos de entrada en Amazon Simple Storage Service (Amazon S3), ya que Amazon ML lee datos de las ubicaciones de Amazon S3. Puede cargar sus datos directamente a Amazon S3 (por ejemplo, desde su equipo) o Amazon ML puede copiar los datos almacenados en Amazon Redshift o Amazon Relational Database Service (RDS) a un archivo .csv y cargarlo en Amazon S3.

Para obtener más información sobre cómo copiar los datos de Amazon Redshift o Amazon RDS, consulte Using Amazon Redshift with Amazon ML o Using Amazon RDS with Amazon ML, respectivamente.

El resto de esta sección describe cómo cargar los datos de entrada directamente desde su equipo a Amazon S3. Antes de comenzar los procedimientos de esta sección, debe disponer de los datos en un archivo .csv. Para obtener información sobre cómo dar el formato correcto al archivo .csv para que Amazon ML pueda utilizarlo, consulte Descripción del formato de datos para Amazon ML.

Cargar los datos desde su equipo a Amazon S3
  1. Inicie sesión en la consola de administración de AWS y abra la consola de Amazon S3 en https://console.aws.amazon.com/s3.

  2. Cree un bucket o elija uno existente.

    1. Para crear un bucket, elija Create Bucket (Crear bucket). Asigne un nombre a su bucket, elija una región (puede elegir cualquier región disponible) y, a continuación, seleccione Create (Crear). Para obtener más información, consulte Crear un bucket en la Guía de introducción de Amazon Simple Storage.

    2. Para utilizar un bucket existente, busque el bucket eligiéndolo en la lista All Buckets (Todos los buckets). Cuando aparezca el nombre del bucket, selecciónelo y, a continuación, elija Upload (Cargar).

  3. En el cuadro de diálogo Upload (Cargar), seleccione Add Files (Añadir archivos).

  4. Vaya a la carpeta que contiene el archivo .csv de los datos de entrada y, a continuación, seleccione Open (Abrir).

Permisos

Para conceder permisos para que Amazon ML obtenga acceso a uno de los buckets de S3, debe editar la política del bucket.

Para obtener información sobre la concesión de permiso a Amazon ML para leer datos de su bucket en Amazon S3, consulte Concesión de permisos de Amazon ML para la lectura de datos desde Amazon S3.

Para obtener información sobre la concesión de permisos a Amazon ML para extraer los resultados de la predicción por lotes a su bucket en Amazon S3, consulte Concesión de permisos a Amazon ML para enviar predicciones a Amazon S3.

Para obtener información sobre la administración de permisos de acceso a los recursos de Amazon S3, consulte la Guía para desarrolladores de Amazon S3.