Ajuste con precisión los modelos básicos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajuste con precisión los modelos básicos

Los modelos básicos a los que puede acceder a través de Amazon SageMaker Canvas pueden ayudarle con una variedad de tareas de uso general. Sin embargo, si tiene un caso de uso específico y desea personalizar las respuestas en función de sus propios datos, puede ajustar un modelo básico.

Para afinar un modelo básico, proporciona un conjunto de datos que consta de ejemplos de solicitudes y respuestas de modelos. A continuación, se entrena el modelo básico a partir de los datos. Por último, el modelo básico ajustado puede proporcionarle respuestas más específicas.

La siguiente lista contiene los modelos de base que puede ajustar con precisión en Canvas:

  • Titan Express

  • Falcon-7B

  • Falcon-7B-Instruct

  • Falcon-40B-Instruct

  • Falcon-40B

  • Flan-T5-Large

  • Flan-T5-Xl

  • Flan-T5-Xxl

  • MPT-7B

  • MPT-7B-Instruct

Puede acceder a información más detallada sobre cada modelo de base en la aplicación Canvas mientras ajusta un modelo. Para obtener más información, consulte Ajusta el modelo.

En este tema se describe cómo ajustar los modelos de base en Canvas.

Antes de empezar

Antes de ajustar un modelo base, asegúrese de tener los permisos para los eady-to-use modelos R en Canvas y un rol de AWS Identity and Access Management ejecución que tenga una relación de confianza con Amazon Bedrock, lo que le permitirá a Amazon Bedrock asumir su rol mientras ajusta los modelos base.

Al configurar o editar su SageMaker dominio de Amazon, debe 1) activar los permisos de configuración del eady-to-use modelo Canvas R y 2) crear o especificar un rol de Amazon Bedrock, que es un rol de ejecución de IAM al que se asocia una relación SageMaker de confianza con Amazon Bedrock. Para obtener más información sobre la configuración de estos ajustes, consulte Requisitos previos para configurar Amazon Canvas SageMaker .

Puede configurar el rol de Amazon Bedrock manualmente si prefiere usar su propio rol de ejecución de IAM (en lugar de dejar que SageMaker cree uno en su nombre). Para obtener más información sobre cómo configurar la relación de confianza de su función de ejecución de IAM con Amazon Bedrock, consulte. Conceda a los usuarios permisos para ajustar con precisión los modelos básicos

También debe tener un conjunto de datos formateado para ajustar los modelos de lenguaje de gran tamaño (LLM). La siguiente es una lista de requisitos para su conjunto de datos:

  • El conjunto de datos debe ser tabular y contener al menos dos columnas de datos de texto: una columna de entrada (que contiene ejemplos de solicitudes del modelo) y una columna de salida (que contiene respuestas de ejemplo del modelo).

    Un ejemplo es el siguiente:

    Entrada Salida

    ¿Cuáles son sus condiciones de envío?

    Ofrecemos envío gratuito en todos los pedidos superiores a 50$. Los pedidos de menos de 50$ tienen una tarifa de envío de 5,99$.

    ¿Cómo puedo devolver un artículo?

    Para devolver un artículo, visita nuestro centro de devoluciones y sigue las instrucciones. Debe proporcionar su número de pedido y el motivo de la devolución.

    Tengo problemas con mi producto. ¿Qué puedo hacer?

    Ponte en contacto con nuestro equipo de atención al cliente y estaremos encantados de ayudarte a solucionar el problema.

  • Recomendamos que el conjunto de datos tenga al menos 100 pares de texto (filas de los elementos de entrada y salida correspondientes). Esto garantiza que el modelo básico tenga datos suficientes para realizar ajustes y aumenta la precisión de sus respuestas.

  • Cada elemento de entrada y salida debe contener un máximo de 512 caracteres. Todo lo que sea más largo se reduce a 512 caracteres al ajustar el modelo base.

Al ajustar un modelo de Amazon Bedrock, debe cumplir con las cuotas de Amazon Bedrock. Para obtener más información, consulte Cuotas de personalización de modelos en la Guía del usuario de Amazon Bedrock.

Para obtener más información sobre los requisitos y limitaciones generales de los conjuntos de datos en Canvas, consulteCreación de un conjunto de datos.

Ajuste de un modelo fundacional

Puede ajustar un modelo básico mediante cualquiera de los siguientes métodos en la aplicación Canvas:

  • Durante una conversación sobre cómo generar, extraer y resumir contenido con un modelo básico, elija el icono de ajuste preciso del modelo ().

  • Durante una conversación con un modelo básico, si ha vuelto a generar la respuesta dos o más veces, Canvas le ofrece la opción de ajustar el modelo con precisión. La siguiente captura de pantalla muestra cómo se ve.

    Captura de pantalla de la opción de modelar con precisión base que se muestra en un chat.
  • En la página Mis modelos, puede crear un nuevo modelo seleccionando Nuevo modelo y, a continuación, seleccionando Ajustar con precisión el modelo base.

  • En la página de inicio de eady-to-use los modelos R, puede elegir Crear su propio modelo y, a continuación, en el cuadro de diálogo Crear nuevo modelo, elegir Ajustar el modelo base.

  • Mientras navega por sus conjuntos de datos en la pestaña Data Wrangler, puede seleccionar un conjunto de datos y elegir Crear un modelo. Luego, elige Ajustar el modelo base.

Una vez que haya empezado a afinar un modelo, haga lo siguiente:

Seleccione un conjunto de datos

En la pestaña Seleccionar para ajustar un modelo, puede elegir los datos con los que desea entrenar el modelo base.

Seleccione un conjunto de datos existente o cree uno nuevo que cumpla con los requisitos enumerados en la Antes de empezar sección. Para obtener más información sobre cómo crear un conjunto de datos, consulteCreación de un conjunto de datos.

Cuando haya seleccionado o creado un conjunto de datos y esté listo para continuar, elija Seleccionar conjunto de datos.

Ajusta el modelo

Tras seleccionar los datos, ya está listo para empezar a entrenar y ajustar el modelo.

En la pestaña Ajustar con precisión, haga lo siguiente:

  1. (Opcional) Seleccione Más información sobre nuestros modelos básicos para acceder a más información sobre cada modelo y ayudarle a decidir qué modelo o modelos básicos implementar.

  2. Para seleccionar hasta 3 modelos básicos, abre el menú desplegable y selecciona hasta 3 modelos de base (hasta 2 JumpStart modelos y 1 modelo Amazon Bedrock) que te gustaría ajustar durante el trabajo de formación. Al ajustar varios modelos básicos, puede comparar su rendimiento y, en última instancia, elegir el que mejor se adapte a su caso de uso como modelo predeterminado. Para obtener más información sobre los modelos predeterminados, consulte. Vea los modelos candidatos en la tabla de clasificación del modelo

  3. En Seleccione la columna de entrada, seleccione la columna de datos de texto del conjunto de datos que contiene las indicaciones del modelo de ejemplo.

  4. En la columna Seleccione la salida, seleccione la columna de datos de texto del conjunto de datos que contiene las respuestas del modelo de ejemplo.

  5. (Opcional) Para configurar los ajustes avanzados para el trabajo de entrenamiento, elija Configurar modelo. Para obtener más información sobre los ajustes avanzados de creación de modelos, consulteConfiguraciones avanzadas de creación de modelos.

    En la ventana emergente Configurar modelo, haga lo siguiente:

    1. En el caso de los hiperparámetros, puede ajustar el recuento de épocas, el tamaño del lote, la tasa de aprendizaje y los pasos de calentamiento de la tasa de aprendizaje para cada modelo que haya seleccionado. Para obtener más información sobre estos parámetros, consulte la sección Hiperparámetros de la documentación. JumpStart

    2. Para la división de datos, puede especificar porcentajes sobre cómo dividir los datos entre el conjunto de entrenamiento y el conjunto de validación.

    3. Para el tiempo máximo de ejecución del trabajo, puede establecer la cantidad máxima de tiempo durante el que Canvas ejecuta el trabajo de compilación. Esta función solo está disponible para los modelos de JumpStart base.

    4. Tras configurar los ajustes, seleccione Guardar.

  6. Selecciona Fine-tune para empezar a entrenar los modelos básicos que has seleccionado.

Cuando comience el trabajo de ajuste, puede salir de la página. Cuando el modelo aparezca como Listo en la página Mis modelos, estará listo para su uso y podrá analizar el rendimiento del modelo ajustado con precisión.

Analice el modelo ajustado

En la pestaña Analizar del modelo ajustado, puede ver el rendimiento del modelo.

La pestaña Descripción general de esta página muestra las puntuaciones de perplejidad y pérdida, junto con análisis que permiten visualizar la mejora del modelo a lo largo del tiempo durante el entrenamiento. La siguiente captura de pantalla muestra la pestaña Descripción general.

Captura de pantalla de la pestaña Analizar de un modelo ajustado en Canvas, que muestra las curvas de perplejidad y pérdida.

En esta página, puede ver las siguientes visualizaciones:

  • La curva de perplejidad mide qué tan bien el modelo predice la siguiente palabra de una secuencia o qué tan gramatical es la salida del modelo. Lo ideal es que, a medida que el modelo mejore durante el entrenamiento, la puntuación disminuya y dé como resultado una curva que disminuya y se aplane con el tiempo.

  • La curva de pérdidas cuantifica la diferencia entre el resultado correcto y el resultado previsto por el modelo. Una curva de pérdidas que disminuye y se aplana con el tiempo indica que el modelo está mejorando su capacidad para realizar predicciones precisas.

La pestaña Métricas avanzadas muestra los hiperparámetros y las métricas adicionales del modelo. Se parece a la siguiente captura de pantalla:

Captura de pantalla de la pestaña de métricas avanzadas de un modelo ajustado en Canvas.

La pestaña Métricas avanzadas contiene la siguiente información:

  • La sección de explicabilidad contiene los hiperparámetros, que son los valores establecidos antes del trabajo para guiar el ajuste del modelo. Si no especificó los hiperparámetros personalizados en la configuración avanzada del modelo en la Ajusta el modelo sección, Canvas seleccionará los hiperparámetros predeterminados por usted.

    Para JumpStart los modelos, también puede consultar la métrica avanzada ROUGE (Recall-Oriented Understudy for Gisting Evaluation), que evalúa la calidad de los resúmenes generados por el modelo. Mide qué tan bien el modelo puede resumir los puntos principales de un pasaje.

  • La sección de artefactos le proporciona enlaces a los artefactos generados durante el trabajo de ajuste. Puede acceder a los datos de formación y validación guardados en Amazon S3, así como al enlace al informe de evaluación del modelo (para obtener más información, consulte el párrafo siguiente).

Para obtener más información sobre la evaluación del modelo, puede descargar un informe generado con SageMaker Clarify, una función que puede ayudarle a detectar sesgos en el modelo y en los datos. En primer lugar, genere el informe seleccionando Generar informe de evaluación en la parte inferior de la página. Una vez generado el informe, puede descargar el informe completo seleccionando Descargar el informe o volviendo a la sección de artefactos.

También puedes acceder a un cuaderno de Jupyter que te muestra cómo replicar tu trabajo de ajuste en código Python. Puede usarlo para replicar o realizar cambios programáticos en su trabajo de ajuste o para comprender mejor cómo Canvas ajusta su modelo. Para obtener más información sobre las libretas modelo y cómo acceder a ellas, consulte. Descargue un modelo de cuaderno

Para obtener más información sobre cómo interpretar la información de la pestaña Analizar de su modelo ajustado, consulte el tema. Evalúe el rendimiento de su modelo en Amazon SageMaker Canvas

Tras analizar las pestañas Descripción general y Métricas avanzadas, también puede optar por abrir la tabla de clasificación del modelo, que muestra la lista de los modelos básicos entrenados durante la creación. El modelo con la puntuación de pérdidas más baja se considera el modelo con mejor rendimiento y se selecciona como modelo predeterminado, que es el modelo cuyo análisis se ve en la pestaña Analizar. Solo puede probar e implementar el modelo predeterminado. Para obtener más información sobre la tabla de clasificación del modelo y cómo cambiar el modelo predeterminado, consulteVea los modelos candidatos en la tabla de clasificación del modelo.

Pruebe un modelo perfeccionado en un chat

Después de analizar el rendimiento de un modelo ajustado con precisión, es posible que desee probarlo o comparar sus respuestas con el modelo base. Puede probar un modelo ajustado en un chat con la función Generar, extraer y resumir contenido.

Inicie una conversación con un modelo ajustado seleccionando uno de los siguientes métodos:

  • En la pestaña Analizar del modelo ajustado, elija Probar en modelos básicos eady-to-use R.

  • En la página de eady-to-use modelos de Canvas R, elija Generar, extraer y resumir contenido. A continuación, elija Nuevo chat y seleccione la versión del modelo ajustado que desee probar.

El modelo se inicia en un chat y puedes interactuar con él como con cualquier otro modelo base. Puedes añadir más modelos al chat y comparar sus resultados. Para obtener más información sobre la funcionalidad de los chats, consulteUso de la IA generativa con los modelos fundacionales.

Operacionalice modelos ajustados

Después de ajustar su modelo en Canvas, puede registrarlo en el registro de modelos para integrarlo en los procesos de SageMaker MLOps de su organización. Para obtener más información, consulte Registre una versión del modelo en el registro de SageMaker modelos.

importante

Solo puede registrar modelos JumpStart basados en ajustes precisos, no modelos basados en Amazon Bedrock.