Modelo operativo - SageMaker Mejores prácticas de administración de Studio

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Modelo operativo

Un modelo operativo es un marco que reúne a las personas, los procesos y las tecnologías para ayudar a una organización a ofrecer valor empresarial de manera escalable, coherente y eficiente. El modelo operativo de aprendizaje automático proporciona un proceso de desarrollo de productos estándar para los equipos de toda la organización. Existen tres modelos para implementar el modelo operativo, según el tamaño, la complejidad y los factores que impulsan el negocio:

  • Equipo de ciencia de datos centralizado: en este modelo, todas las actividades de ciencia de datos se centralizan en un solo equipo u organización. Esto es similar al modelo del Centro de Excelencia (COE), en el que todas las unidades de negocio recurren a este equipo para realizar proyectos de ciencia de datos.

  • Equipos de ciencia de datos descentralizados: en este modelo, las actividades de ciencia de datos se distribuyen en diferentes funciones o divisiones empresariales, o en función de diferentes líneas de productos.

  • Equipos de ciencia de datos federados: en este modelo, las funciones de servicios compartidos, como los repositorios de código, los procesos de integración y entrega continuas (CI/CD), etc., son gestionadas por un equipo centralizado, y cada unidad de negocio o función a nivel de producto está gestionada por equipos descentralizados. Esto es similar al modelo integrado, en el que cada unidad de negocio tiene sus propios equipos de ciencia de datos; sin embargo, estos equipos de unidades de negocio coordinan sus actividades con el equipo centralizado.

Antes de decidir lanzar su primer dominio de estudio para casos de uso de producción, considere su modelo operativo y las AWS mejores prácticas para organizar su entorno. Para obtener más información, consulte Cómo organizar su AWS entorno mediante varias cuentas.

La siguiente sección proporciona orientación sobre cómo organizar la estructura de la cuenta para cada uno de los modelos operativos.

En esta sección, presentamos brevemente la estructura contable de un modelo operativo con la que puede empezar y modificar de acuerdo con los requisitos operativos de su organización. Independientemente del modelo operativo que elija, le recomendamos implementar las siguientes prácticas recomendadas comunes:

  • AWS Control TowerÚselo para configurar, administrar y gobernar sus cuentas.

  • Centralice sus identidades con su proveedor de identidad (IdP) AWS IAMe Identity Center con una cuenta de Securitiy Tooling de administrador delegado y permita el acceso seguro a las cargas de trabajo.

  • Ejecute cargas de trabajo de aprendizaje automático con aislamiento a nivel de cuenta en todas las cargas de trabajo de desarrollo, prueba y producción.

  • Transmita los registros de las cargas de trabajo de aprendizaje automático a una cuenta de archivo de registros y, a continuación, filtre y aplique el análisis de registros en una cuenta de observabilidad.

  • Gestione una cuenta de gobierno centralizada para aprovisionar, controlar y auditar el acceso a los datos.

  • Incorpore servicios de seguridad y gobierno (SGS) con las barreras preventivas y de detección adecuadas en cada cuenta para garantizar la seguridad y el cumplimiento, según los requisitos de su organización y de carga de trabajo.

Estructura de cuentas modelo centralizada

En este modelo, el equipo de la plataforma ML es responsable de proporcionar:

  • Una cuenta de herramientas de servicios compartidos que aborda los requisitos de Machine Learning Operations (MLOps) de los equipos de ciencia de datos.

  • Cuentas de desarrollo, pruebas y producción de cargas de trabajo de aprendizaje automático que se comparten entre los equipos de ciencia de datos.

  • Políticas de gobierno para garantizar que la carga de trabajo de cada equipo de ciencia de datos se ejecute de forma aislada.

  • Mejores prácticas comunes.

Un diagrama que muestra la estructura contable de un modelo operativo centralizado.

Estructura contable de un modelo operativo centralizado

Estructura contable modelo descentralizada

En este modelo, cada equipo de aprendizaje automático opera de forma independiente para aprovisionar, administrar y controlar las cuentas y los recursos de aprendizaje automático. Sin embargo, recomendamos que los equipos de aprendizaje automático utilicen un enfoque centralizado de observabilidad y gobernanza de datos para simplificar la gobernanza de los datos y la gestión de las auditorías.

Un diagrama que describe la estructura contable de un modelo operativo descentralizado.

Estructura contable de un modelo operativo descentralizado

Estructura de cuentas modelo federada

Este modelo es similar al modelo centralizado; sin embargo, la diferencia clave es que las cuentas de cada science/ML team gets their own set of development/test/production carga de trabajo de datos permiten un aislamiento físico sólido de sus recursos de aprendizaje automático y, además, permiten a cada equipo escalar de forma independiente sin afectar a los demás equipos.

Documento que describe la estructura contable de un modelo operativo federado.

Estructura contable del modelo operativo federado

Plataforma ML: multitenencia

La multitenencia es una arquitectura de software en la que una sola instancia de software puede atender a varios grupos de usuarios distintos. Un inquilino es un grupo de usuarios que comparten un acceso común con privilegios específicos a la instancia de software. Por ejemplo, si está creando varios productos de aprendizaje automático, cada equipo de producto con requisitos de acceso similares puede considerarse inquilino o equipo.

Si bien es posible implementar varios equipos en una instancia de SageMaker AI Studio (como SageMaker AI Domain), sopese esas ventajas y desventajas, como el radio de alcance, la atribución de costes y los límites de nivel de cuenta, al reunir varios equipos en un único SageMaker dominio de AI Studio. Obtén más información sobre estas ventajas y prácticas recomendadas en las siguientes secciones.

Si necesitas un aislamiento absoluto de los recursos, considera la posibilidad de implementar dominios de SageMaker AI Studio para cada inquilino en una cuenta diferente. En función de tus requisitos de aislamiento, puedes implementar varias líneas de negocio (LOBs) como varios dominios dentro de una sola cuenta y región. Utilice los espacios compartidos para una colaboración prácticamente en tiempo real entre los miembros del mismo equipo/LOB. Con varios dominios, seguirás utilizando las políticas y los permisos de administración de acceso a la identidad (IAM) para garantizar el aislamiento de los recursos.

SageMaker Los recursos de IA creados a partir de un dominio se etiquetan automáticamente con el nombre de Amazon Resource Name (ARN) del dominio y el perfil o espacio del usuario ARN para facilitar el aislamiento de los recursos. Para ver ejemplos de políticas, consulte la documentación sobre el aislamiento de recursos de dominio. Allí podrá consultar la referencia detallada sobre cuándo utilizar una estrategia con varias cuentas o varios dominios, junto con las comparaciones de características de la documentación. También podrá ver ejemplos de scripts para rellenar las etiquetas de los dominios existentes en el repositorio. GitHub

Por último, puede implementar un despliegue de autoservicio de los recursos de SageMaker AI Studio en varias cuentas utilizando. AWS Service Catalog Para obtener más información, consulta Administrar AWS Service Catalog productos en varios Cuentas de AWS y Regiones de AWS.