Recomendação de EC2 instância da Amazon para o CatBoost algoritmo Cadernos de exemplo

CatBoost

CatBoosté uma implementação de código aberto popular e de alto desempenho do algoritmo Gradient Boosting Decision Tree (GBDT). GBDT é um algoritmo de aprendizado supervisionado que tenta prever com precisão uma variável de destino. Para isso, combina um grupo de estimativas de um conjunto de modelos mais simples e mais fracos.

CatBoost introduz dois avanços algorítmicos críticos no GBDT:

A implementação do aumento ordenado, uma alternativa baseada em permutação ao algoritmo clássico
Um algoritmo inovador para processar atributos categóricos

Ambas as técnicas foram criadas para combater uma mudança de predição causada por um tipo especial de vazamento de alvo presente em todas as implementações atualmente existentes de algoritmos de aumento de gradiente. Esta página inclui informações sobre recomendações de EC2 instâncias da Amazon e exemplos de notebooks para CatBoost.

Recomendação de EC2 instância da Amazon para o CatBoost algoritmo

SageMaker CatBoost Atualmente, a IA treina apenas usando CPUs. CatBoost é um algoritmo limitado à memória (em oposição ao limitado à computação). Portanto, uma instância de computação de uso geral (por exemplo, M5) é uma opção melhor do que uma instância otimizada para computação (por exemplo, C5). Além disso, recomendamos que você tenha memória total suficiente em instâncias específicas para armazenar os dados de treinamento.

CatBoost cadernos de amostra

A tabela a seguir descreve uma variedade de exemplos de cadernos que abordam diferentes casos de uso do algoritmo Amazon SageMaker AI CatBoost .

Título do caderno	Descrição
Classificação tabular com Amazon SageMaker AI LightGBM e algoritmo CatBoost	Este caderno demonstra o uso do CatBoost algoritmo Amazon SageMaker AI para treinar e hospedar um modelo de classificação tabular.
Regressão tabular com Amazon SageMaker AI LightGBM e algoritmo CatBoost	Este caderno demonstra o uso do CatBoost algoritmo Amazon SageMaker AI para treinar e hospedar um modelo de regressão tabular.

Para obter instruções sobre como criar e acessar instâncias do notebook Jupyter que você pode usar para executar o exemplo em SageMaker IA, consulte. Instâncias de SageMaker notebook da Amazon Depois de criar uma instância do notebook e abri-la, escolha a guia Exemplos de SageMaker IA para ver uma lista de todas as amostras de SageMaker IA. Para abrir um caderno, escolha a guia Uso e depois escolha Criar cópia.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Ajuste de modelos

Como usar CatBoost