Importância da transformação de recursos

Considere um modelo de Machine Learning cuja tarefa é decidir se uma transação de cartão de crédito é fraudulenta ou não. Com base no conhecimento geral e na análise de dados de seu aplicativo, você pode decidir quais campos de dados (ou recursos) devem ser incluídos nos dados de entrada. É importante fornecer ao processo de aprendizagem, por exemplo, o valor da transação, o nome do comerciante, o endereço e o endereço do titular do cartão de crédito. Por outro lado, um ID de transação gerado aleatoriamente não contém informações (se sabemos que realmente é aleatório) e não é útil.

Assim que você escolher quais campos incluir, transforme esses recursos para ajudar o processo de aprendizagem. As transformações acrescentam experiência geral aos dados de entrada, permitindo que o modelo de Machine Learning se beneficie dessa experiência. Por exemplo, o seguinte endereço de comerciante é representado como uma string:

"Rua Principal, 123, Rio de Janeiro, RJ 20000-000"

Por si só, o endereço tem limitada capacidade de expressão; é útil apenas para padrões de aprendizagem associados a esse endereço exato. Dividindo-o em suas partes constituintes, no entanto, podemos criar características adicionais, como "Endereço" (Rua Principal, 123), "Cidade" (Rio de Janeiro), "Estado" (RJ) e "CEP" (20000-000). Agora, o algoritmo de aprendizagem pode agrupar transações díspares e descobrir padrões mais abrangentes, talvez alguns CEPs de comerciantes apresentam mais atividades fraudulentas do que outros.

Para obter mais informações sobre a abordagem e o processo de transformação de recursos, consulte Conceitos de Machine Learning.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Transformações de dados para Machine Learning

Transformações de recursos com receitas de dados