Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Barreras de protección de implementación para actualizar modelos en producción

Modo de enfoque
Barreras de protección de implementación para actualizar modelos en producción - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las barandillas de implementación son un conjunto de opciones de implementación de modelos en Amazon SageMaker AI Inference para actualizar sus modelos de aprendizaje automático en producción. Con las opciones de implementación totalmente gestionadas, puede controlar el cambio del modelo actual en producción a uno nuevo. Los modos de cambio de tráfico en las implementaciones azul/verde, como el valor controlado y el lineal, le permiten controlar de forma pormenorizada el proceso de cambio de tráfico del modelo actual al nuevo durante la actualización. También hay protecciones integradas, como las reversiones automáticas, que le ayudan a detectar los problemas a tiempo y a tomar medidas correctivas automáticamente antes de que afecten significativamente a la producción.

Las barreras de protección de implementación proporcionan las siguientes ventajas:

  • Seguridad de implementación al actualizar los entornos de producción. Una actualización regresiva de un entorno de producción puede provocar tiempos de inactividad no planificados y afectar al negocio, como un aumento de la latencia del modelo y altas tasas de error. Las barreras de protección de implementación ayudan a mitigar esos riesgos al proporcionar las mejores prácticas y barreras de protección operativa integradas.

  • Implementación totalmente gestionada. SageMaker La IA se encarga de configurar y organizar estas implementaciones y las integra con los mecanismos de actualización de los terminales. No es necesario crear ni mantener mecanismos de orquestación, monitorización o reversión. Puede aprovechar la SageMaker IA para configurar y organizar estas implementaciones y centrarse en aprovechar el aprendizaje automático para sus aplicaciones.

  • Visibilidad. Puede realizar un seguimiento del progreso de su implementación a través de Amazon CloudWatch Events DescribeEndpointAPIo a través de ellos (para los puntos de enlace compatibles). Para obtener más información sobre los eventos de la SageMaker IA, consulte la sección sobre el cambio del estado de despliegue de los endpoints enEventos que Amazon SageMaker AI envía a Amazon EventBridge. Tenga en cuenta que si su terminal utiliza alguna de las funciones de la Exclusiones página, no podrá utilizar CloudWatch los eventos.

nota

Las barreras de protección de implementación solo se aplican a los tipos de puntos de conexión Inferencia asíncrona y Inferencia en tiempo real.

Cómo comenzar

Admitimos dos tipos de implementación para actualizar los modelos en producción: las implementaciones azul/verde y las implementaciones continuas.

  • Implementaciones azul/verde: puede cambiar el tráfico de su flota anterior (flota azul) a una flota nueva (flota verde) con las actualizaciones. Las implementaciones azul/verde ofrecen múltiples modos de cambio de tráfico. Un modo de cambio de tráfico es una configuración que especifica cómo la SageMaker IA dirige el tráfico de los puntos finales a una nueva flota que contiene tus actualizaciones. Los siguientes modos de cambio de tráfico le proporcionan diferentes niveles de control sobre el proceso de actualización de los puntos de conexión:

    • Uso de cambio de tráfico todo a la vez pasa todo el tráfico de puntos de conexión de la flota azul a la flota verde. Una vez que el tráfico pasa a la flota ecológica, CloudWatch las alarmas de Amazon preespecificadas comienzan a monitorizar la flota ecológica durante un período de tiempo determinado (el período de cocción). Si no se activa ninguna alarma durante el período de inactividad, la SageMaker IA cancelará la flota azul.

    • Uso de cambio de tráfico de canario pasa una pequeña parte de su tráfico (un valor controlado) a la flota verde y la monitoriza durante un período de cocción. Si el canario tiene éxito en la flota verde, la SageMaker IA desplaza el resto del tráfico de la flota azul a la flota verde antes de acabar con la flota azul.

    • Uso de cambio de tráfico lineal ofrece una personalización aún mayor en cuanto al número de pasos de cambio de tráfico y el porcentaje de tráfico que se debe cambiar en cada paso. Si bien el cambio de sentido vertical le permite desplazar el tráfico en dos pasos, el cambio lineal lo amplía a n pasos espaciados linealmente.

  • Uso de implementaciones continuas: Puede actualizar su terminal a medida que la SageMaker IA aprovisione la capacidad de forma incremental y desvíe el tráfico a una nueva flota en pasos del tamaño de lote que especifique. Las instancias de la nueva flota se actualizan con la nueva configuración de despliegue y, si no se CloudWatch activa ninguna alarma durante el período de inactividad, la SageMaker IA limpia las instancias de la flota anterior. Esta opción le proporciona un control pormenorizado sobre el número de instancias o el porcentaje de capacidad que se modifica en cada paso.

Puede crear y gestionar su despliegue mediante los AWS Command Line Interface comandos UpdateEndpointy CreateEndpoint SageMaker APIy. Consulte las páginas de implementación individuales para obtener más información sobre cómo configurar su implementación. Tenga en cuenta que si su punto de conexión utiliza alguna de las funciones enumeradas en la página Exclusiones, no podrá utilizar las barreras de protección de implementación.

Para seguir los ejemplos guiados que muestran cómo utilizar las barreras de protección de implementación, consulte nuestros ejemplos de cuadernos de Jupyter para los modos de cambio de tráfico valor controlado y lineal.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.