A documentação do contêiner de inferência de grandes modelos (LMI)

A documentação do contêiner de inferência de grandes modelos (LMI) encontra-se no site de documentação da Deep Java Library.

A documentação foi escrita para desenvolvedores, cientistas de dados e engenheiros de aprendizado de máquina que precisam implantar e otimizar grandes modelos de linguagem (LLMs) na Amazon SageMaker AI. Ele ajuda você a usar contêineres LMI, que são contêineres Docker especializados para inferência de LLM, fornecidos pela. AWS Ela apresenta uma visão geral, guias de implantação, guias de usuário para bibliotecas de inferência compatíveis e tutoriais avançados.

Ao usar a documentação do contêiner de LMI, você consegue:

Compreender os componentes e a arquitetura dos contêineres de LMI
Saiba como selecionar o tipo de instância e o backend apropriados para seu caso de uso
Configure e implante LLMs em SageMaker IA usando contêineres LMI
Otimizar o desempenho usando atributos como quantização, paralelismo de tensores e processamentos em lotes contínuos
Compare e ajuste seus endpoints de SageMaker IA para otimizar a taxa de transferência e a latência

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Paralelismo de modelos e inferência de modelos grandes

SageMaker Parâmetros de endpoint de IA para LMI