Recommandation d' EC2 instance Amazon pour l' CatBoostalgorithme Exemples de blocs-notes

CatBoost

CatBoostest une implémentation open source populaire et performante de l'algorithme GBDT (Gradient Boosting Decision Tree). L'algorithme GBDT est un algorithme d'apprentissage supervisé qui tente de prédire avec précision une variable cible en combinant un ensemble d'estimations à partir d'un jeu de modèles plus simples et plus faibles.

CatBoost introduit deux avancées algorithmiques critiques pour le GBDT :

L'implémentation d'un renforcement ordonné, une alternative à l'algorithme classique axée sur la permutation
Un algorithme innovant pour le traitement des caractéristiques catégorielles

Les deux techniques ont été créées pour lutter contre un changement de prédiction causé par un type particulier de fuite de cible présent dans toutes les implémentations existantes des algorithmes avec renforcement de gradient. Cette page contient des informations sur les recommandations relatives aux EC2 instances Amazon et des exemples de blocs-notes pour CatBoost.

Recommandation d' EC2 instance Amazon pour l' CatBoostalgorithme

SageMaker CatBoost Actuellement, seuls les trains utilisent l'IA CPUs. CatBoost est un algorithme lié à la mémoire (par opposition à un algorithme lié au calcul). Par conséquent, une instance de calcul à usage général (par exemple, M5) constitue un meilleur choix qu'une instance optimisée pour le calcul (par exemple, C5). De plus, nous vous recommandons d'avoir suffisamment de mémoire totale dans les instances sélectionnées pour contenir les données d'entraînement.

CatBoost exemples de carnets

Le tableau suivant présente une variété d'exemples de blocs-notes qui répondent à différents cas d'utilisation de l' CatBoost algorithme Amazon SageMaker AI.

Titre du bloc-notes	Description
Classification tabulaire avec Amazon SageMaker AI LightGBM et algorithme CatBoost	Ce carnet explique l'utilisation de l' CatBoostalgorithme Amazon SageMaker AI pour entraîner et héberger un modèle de classification tabulaire.
Régression tabulaire avec Amazon SageMaker AI LightGBM et algorithme CatBoost	Ce carnet explique l'utilisation de l' CatBoostalgorithme Amazon SageMaker AI pour entraîner et héberger un modèle de régression tabulaire.

Pour savoir comment créer et accéder à des instances de bloc-notes Jupyter que vous pouvez utiliser pour exécuter l'exemple dans SageMaker AI, consultez. Instances de SageMaker blocs-notes Amazon Après avoir créé une instance de bloc-notes et l'avoir ouverte, choisissez l'onglet Exemples d'SageMaker IA pour voir la liste de tous les exemples d' SageMaker IA. Pour ouvrir un bloc-notes, choisissez son onglet Use (Utiliser), puis Create copy (Créer une copie).

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Réglage d'un modèle

Comment utiliser CatBoost