Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Implemente modelos a JumpStart partir de Amazon SageMaker Studio
En los siguientes pasos, se explica cómo implementar modelos JumpStart con Amazon SageMaker Studio.
Requisitos previos
Compruebe que ha configurado las capacidades de inferencia en sus SageMaker HyperPod clústeres de Amazon. Para obtener más información, consulte Configuración de los clústeres para la implementación de modelos HyperPod .
Cree un despliegue HyperPod
-
En Amazon SageMaker Studio, abre la página de JumpStartdestino desde el panel de navegación izquierdo.
-
En Todos los modelos públicos, elige el modelo que quieras implementar.
nota
Si ha seleccionado un modelo cerrado, tendrá que aceptar el Acuerdo de licencia de usuario final (EULA).
-
Elija SageMaker HyperPod.
-
En la sección Configuración de implementación, JumpStart recomendará una instancia para la implementación. Puede modificar esta configuración si es necesario.
-
Si modifica el tipo de instancia, asegúrese de que sea compatible con el HyperPod clúster elegido. Si no hay instancias compatibles, tendrás que seleccionar un HyperPod clúster nuevo o ponerte en contacto con tu administrador para añadir instancias compatibles al clúster.
-
Para priorizar la implementación del modelo, instala el complemento de gobierno de tareas, crea asignaciones informáticas y configura las clasificaciones de las tareas para la política de clústeres. Una vez hecho esto, debería aparecer una opción para seleccionar una prioridad para la implementación del modelo que se pueda usar como prioridad para otras implementaciones y tareas del clúster.
-
Introduzca el espacio de nombres al que su administrador le ha dado acceso. Puede que tengas que comunicarte directamente con tu administrador para obtener el espacio de nombres exacto. Una vez que se proporciona un espacio de nombres válido, se debe habilitar el botón Implementar para implementar el modelo.
-
-
Elija Implementar y espere a que se cree el punto final.
-
Una vez creado el punto final, seleccione Probar inferencia.
Edite una implementación HyperPod
-
En Amazon SageMaker Studio, selecciona Compute y, a continuación, HyperPodclústeres en el panel de navegación izquierdo.
-
En Implementaciones, elige la implementación del HyperPod clúster que deseas modificar.
-
En el icono de puntos suspensivos verticales (◉), seleccione Editar.
-
En la configuración de despliegue, puede activar o desactivar el escalado automático y cambiar el número máximo de réplicas.
-
Seleccione Guardar.
-
El estado cambiará a Actualización. Cuando vuelva a estar en servicio, los cambios se completarán y verás un mensaje que los confirma.
Eliminar una HyperPod implementación
-
En Amazon SageMaker Studio, selecciona Compute y, a continuación, HyperPodclústeres en el panel de navegación izquierdo.
-
En Implementaciones, elige la implementación del HyperPod clúster que deseas modificar.
-
En el icono de puntos suspensivos verticales (◉), seleccione Eliminar.
-
En la ventana Eliminar HyperPod despliegue, seleccione la casilla de verificación.
-
Elija Eliminar.
-
El estado cambiará a Eliminando. Una vez que se haya eliminado la HyperPod implementación, verás un mensaje que la confirma.