Usar as magias da bancada de trabalho do Neptune nos caderno - Amazon Neptune

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usar as magias da bancada de trabalho do Neptune nos caderno

A bancada de trabalho do Neptune oferece vários comandos chamados magias nos cadernos que economizam muito tempo e esforço. Eles se enquadram em duas categorias: magias de linha e magias de célula.

Magias de linha são comandos precedidos por um único sinal de porcentagem (%). Eles recebem apenas entrada de linha, não entrada do resto do corpo da célula. A bancada de trabalho do Neptune oferece as seguintes magias de linha:

As magias de célula são precedidas por dois sinais de porcentagem (%%) em vez de um e usa o conteúdo da célula como entrada, embora também possam usar o conteúdo da linha como entrada. A bancada de trabalho do Neptune oferece as seguintes magias de célula:

Há também duas magias, de linha e de célula, para trabalhar com Machine learning no Neptune:

nota

Ao trabalhar com magias do Neptune, geralmente é possível obter um texto de ajuda usando um parâmetro --help ou -h. Com uma magia de célula, o corpo não pode ficar vazio; portanto, ao obter ajuda, coloque um texto de preenchimento, mesmo que seja um único caractere, no corpo. Por exemplo: .

%%gremlin --help x

Injeção de variável em magia de célula ou de linha

As variáveis definidas em um caderno podem ser referenciadas dentro de qualquer magia de célula ou linha no caderno usando o formato: ${VAR_NAME}.

Por exemplo, suponha que você defina estas variáveis:

c = 'code' my_edge_labels = '{"route":"dist"}'

Depois, esta consulta do Gremlin em uma magia de célula:

%%gremlin -de $my_edge_labels g.V().has('${c}','SAF').out('route').values('${c}')

É equivalente ao seguinte:

%%gremlin -de {"route":"dist"} g.V().has('code','SAF').out('route').values('code')

Argumentos de consulta que funcionam com todas as linguagens de consulta

Os seguintes argumentos de consulta funcionam com as magias %%gremlin, %%opencypher e %%sparql na bancada de trabalho do Neptune:

Argumentos de consulta comuns
  • --store-to (ou -s): especifica o nome de uma variável na qual armazenar os resultados da consulta.

  • --silent: se estiver presente, nenhuma saída será exibida após a conclusão da consulta.

  • --group-by (ou -g): especifica a propriedade usada para agrupar nós (como code ou T.region). Os vértices são coloridos com base no grupo atribuído.

  • --ignore-groups: se estiverem presentes, todas as opções de agrupamento serão ignoradas.

  • --display-property (ou -d): especifica a propriedade cujo valor deve ser exibido para cada vértice.

    O valor padrão para cada linguagem de consulta é o seguinte:

    • Para o Gremlin: T.label.

    • Para o openCypher: ~labels.

    • Para o SPARQL: type.

  • --edge-display-property (ou -t): especifica a propriedade cujo valor deve ser exibido para cada borda.

    O valor padrão para cada linguagem de consulta é o seguinte:

    • Para o Gremlin: T.label.

    • Para o openCypher: ~labels.

    • Para o SPARQL: type.

  • --tooltip-property (ou -de): especifica a propriedade cujo valor deve ser exibido como uma dica de ferramenta para cada nó.

    O valor padrão para cada linguagem de consulta é o seguinte:

    • Para o Gremlin: T.label.

    • Para o openCypher: ~labels.

    • Para o SPARQL: type.

  • --edge-tooltip-property (ou -te): especifica a propriedade cujo valor deve ser exibido como uma dica de ferramenta para cada borda.

    O valor padrão para cada linguagem de consulta é o seguinte:

    • Para o Gremlin: T.label.

    • Para o openCypher: ~labels.

    • Para o SPARQL: type.

  • --label-max-length (ou -l): especifica o tamanho máximo de caracteres de qualquer rótulo de vértice. Padronizado como dez.

  • --edge-label-max-length (ou -le): especifica o tamanho máximo de caracteres de qualquer rótulo de borda. Padronizado como dez.

    Somente no caso do openCypher, é --rel-label-max-length ou -rel.

  • --simulation-duration (ou -sd): especifica a duração máxima da simulação física de visualização. O padrão é 1.500 ms.

  • --stop-physics (ou -sp): desativa a física de visualização após a estabilização da simulação inicial.

Os valores de propriedade desses argumentos podem consistir em uma única chave de propriedade ou em uma string JSON que pode especificar uma propriedade diferente para cada tipo de rótulo. Uma string JSON só pode ser especificada usando injeção de variável.

A magia de linha %seed

A magia de linha %seed é uma maneira conveniente de adicionar dados ao seu endpoint do Neptune que você pode usar para examinar e experimentar consultas do Gremlin, do openCypher ou do SPARQL. Ela oferece um formulário em que você pode selecionar o modelo de dados que deseja examinar (grafo de propriedades ou RDF) e, depois, escolher entre vários conjuntos de dados de exemplo diferentes oferecidos pelo Neptune.

A magia de linha %load

A magia de linha %load gera um formulário que você pode usar para enviar uma solicitação de carregamento em massa ao Neptune (consulte Comando do carregador do Neptune). O arquivo de origem deve ser um caminho do Amazon S3 na mesma região que o cluster do Neptune.

A magia de linha %load_ids

A magia de linha %load_ids recupera os IDs de carga que foram enviados ao endpoint host do caderno (consulte Parâmetros da solicitação Get-Status do carregador do Neptune). A solicitação tem o seguinte formato:

GET https://your-neptune-endpoint:port/loader

A magia de linha %load_status

A magia de linha %load_status recupera o status de carregamento de uma tarefa de carga específica que foi enviada ao endpoint host do caderno, especificado pela entrada de linha (consulte Parâmetros da solicitação Get-Status do carregador do Neptune). A solicitação tem o seguinte formato:

GET https://your-neptune-endpoint:port/loader?loadId=loadId

A magia de linha se assemelha ao seguinte:

%load_status load id

A magia de linha %cancel_load

A magia de linha %cancel_load cancela um trabalho de carregamento específico (consulte Trabalho de cancelamento do carregador do Neptune). A solicitação tem o seguinte formato:

DELETE https://your-neptune-endpoint:port/loader?loadId=loadId

A magia de linha se assemelha ao seguinte:

%cancel_load load id

A magia de linha %status

Recupera informações de status do endpoint host do caderno (%graph_notebook_config mostra o endpoint host).

A magia de linha %gremlin_status

Recupera as informações de status da consulta do Gremlin.

A magia de linha %opencypher_status (também %oc_status)

Recupera o status de uma consulta do opencypher. Essa magia de linha usa os seguintes argumentos opcionais:

  • --queryId ou -q: determina o ID de uma consulta em execução específica para a qual mostrar o status.

  • --cancel_query ou -c: cancela uma consulta em execução. Não assume um valor.

  • --silent ou -s: se --silent estiver definido como true ao cancelar uma consulta, a consulta em execução será cancelada com um código de resposta HTTP de 200. Caso contrário, o código de resposta HTTP seria 500.

  • --store-to: especifica o nome de uma variável na qual armazenar os resultados da consulta.

A magia de linha %sparql_status

Recupera as informações de status da consulta do SPARQL.

A magia de linha %stream_viewer

A magia de linha %stream_viewer exibe uma interface que permite examinar interativamente as entradas registradas nos fluxos do Neptune, se os fluxos estiverem habilitados no cluster do Neptune. Ela aceita os seguintes argumentos opcionais:

  • language: a linguagem de consulta dos dados do fluxo: gremlin ou sparql. O padrão, se você não fornecer esse argumento, será gremlin.

  • --limit: especifica o número máximo de entradas de fluxo a serem exibidas por página. O valor padrão, se você não fornecer esse argumento, será 10.

nota

A magia de linha %stream_viewer é totalmente aceita somente nas versões 1.0.5.1 e anteriores do mecanismo.

A magia de linha %graph_notebook_config

Essa magia de linha exibe um objeto JSON que contém a configuração que o caderno está usando para se comunicar com o Neptune. A configuração inclui:

  • host: o endpoint ao qual se conectar e emitir comandos.

  • port: a porta usada ao emitir comandos para o Neptune. O padrão é 8182.

  • auth_mode: o modo de autenticação a ser usado ao emitir comandos para o Neptune. Deve ser IAM caso você esteja se conectando a um cluster que tenha a autenticação do IAM habilitada. Caso contrário, DEFAULT.

  • load_from_s3_arn: especifica um ARN do Amazon S3 para a magia %load a ser usada. Se esse valor estiver vazio, o ARN deverá ser especificado no comando %load.

  • ssl: um valor booliano que indica se você deve ou não se conectar ao Neptune usando TLS. O valor padrão é true.

  • aws_region: a região em que esse caderno é implantado. Essas informações são usadas para autenticação do IAM e para solicitações %load.

É possível alterar a configuração copiando a saída %graph_notebook_config em uma nova célula e fazendo alterações nela. Depois, se você executar a magia de célula %%graph_notebook_config na nova célula, a configuração será alterada adequadamente.

A magia de linha %graph_notebook_host

Define a entrada de linha como host do caderno.

A magia de linha %graph_notebook_version

A magia de linha %graph_notebook_version gera o número de lançamento do caderno da bancada de trabalho do Neptune. Por exemplo, a visualização do grafo foi introduzida na versão 1.27.

A magia de linha %graph_notebook_vis_options

A magia de linha %graph_notebook_vis_options exibe as configurações de visualização atuais que o caderno está usando. Essas opções são explicadas na documentação do vis.js.

É possível modificar essas configurações copiando a saída em uma nova célula, fazendo as alterações desejadas e, depois, executando a magia de célula %%graph_notebook_vis_options na célula.

Para restaurar os valores padrão das configurações de visualização, você pode executar a magia de linha %graph_notebook_vis_options com um parâmetro reset. Isso redefine todas as configurações de visualização:

%graph_notebook_vis_options reset

A magia de linha %statistics

A magia de linha %statistics é usada para recuperar ou gerenciar estatísticas do mecanismo DFE (consulte Gerenciar estatísticas a serem utilizadas pelo DFE do Neptune). Essa magia também pode ser usada para recuperar um resumo do grafo.

Ela aceita os seguintes parâmetros:

  • --language: a linguagem de consulta do endpoint de estatísticas: propertygraph (ou pg) ou rdf.

    Se não for fornecido, o padrão será propertygraph.

  • --mode (ou -m): especifica o tipo de solicitação ou ação a ser enviada: uma de status, disableAutoCompute, enableAutoCompute, refresh, delete, detailed ou basic).

    Se não for fornecido, o padrão será status, a menos que --summary seja especificado; nesse caso, o padrão será basic.

  • --summary: recupera o resumo do grafo do endpoint do resumo de estatísticas da linguagem selecionada.

  • --silent: se estiver presente, nenhuma saída será exibida após a conclusão da consulta.

  • --store-to: usado para especificar uma variável na qual armazenar os resultados da consulta.

A magia de linha %summary

A magia de linha %summary é usada para recuperar informações de resumo do grafo. Ela está disponível a partir da versão do mecanismo do Neptune 1.2.1.0.

Ela aceita os seguintes parâmetros:

  • --language: a linguagem de consulta do endpoint de estatísticas: propertygraph (ou pg) ou rdf.

    Se não for fornecido, o padrão será propertygraph.

  • --detailed: ativa ou desativa a exibição dos campos de estruturas na saída.

    Se não for fornecido, o padrão será o modo de exibição de resumo basic.

  • --silent: se estiver presente, nenhuma saída será exibida após a conclusão da consulta.

  • --store-to: usado para especificar uma variável na qual armazenar os resultados da consulta.

A magia de célula %%graph_notebook_config

A magia de célula %%graph_notebook_config usa um objeto JSON que contém informações de configuração para modificar as configurações que o caderno está usando para se comunicar com o Neptune, se possível. A configuração assume a mesma forma gerada pela magia de linha %graph_notebook_config.

Por exemplo: .

%%graph_notebook_config { "host": "my-new-cluster-endpoint.amazon.com", "port": 8182, "auth_mode": "DEFAULT", "load_from_s3_arn": "", "ssl": true, "aws_region": "us-east-1" }

A magia de célula %%sparql

A magia de célula %%sparql emite uma consulta do SPARQL para o endpoint do Neptune. Ela aceita a seguinte entrada de linha opcional:

  • -h ou --help: gera o texto de ajuda sobre esses parâmetros.

  • --path: adiciona um prefixo a um caminho para o endpoint SPARQL. Por exemplo, se você especificar --path "abc/def", o endpoint chamado será host:port/abc/def.

  • --expand-all: é uma dica de visualização de consulta que diz ao visualizador para incluir todos os resultados ?s ?p ?o no diagrama do grafo, independentemente do tipo de vinculação.

    Por padrão, uma visualização do SPARQL inclui apenas padrões triplos em que o? é um uri ou um bnode (nó em branco). Todos os outros tipos de vinculação ?o, como strings literais ou números inteiros, são tratados como propriedades do nó ?s que podem ser visualizadas usando o painel Detalhes na guia Grafo.

    Em vez disso, use a dica de consulta --expand-all quando quiser incluir valores literais como vértices na visualização.

    Não combine essa dica de visualização com os parâmetros de explicação, pois as consultas de explicação não são visualizadas.

  • --explain-type: utilizado para especificar o modo de explicação a ser usado (um dos seguintes: dynamic, static ou details).

  • --explain-format: usado para especificar o formato de resposta para uma consulta de explicação (text/csv ou text/html).

  • --store-to: usado para especificar uma variável na qual armazenar os resultados da consulta.

Exemplo de consulta explain:

%%sparql explain SELECT * WHERE {?s ?p ?o} LIMIT 10

Exemplo de consulta de visualização com um parâmetro de dica de visualização --expand-all (consulte Visualização do SPARQL):

%%sparql --expand-all SELECT * WHERE {?s ?p ?o} LIMIT 10

A magia de célula %%gremlin

A magia %%gremlin celular emite uma consulta Gremlin para o endpoint de Neptune usando. WebSocket Ela aceita uma entrada de linha opcional para alternar para o modo explain do Gremlin /> ou API profile do Gremlin e uma entrada de dica de visualização opcional separada para modificar o comportamento da saída de visualização (consulte Visualização do Gremlin).

Exemplo de consulta explain:

%%gremlin explain g.V().limit(10)

Exemplo de consulta profile:

%%gremlin profile g.V().limit(10)

Exemplo de consulta de visualização com um parâmetro de dica de visualização:

%%gremlin -p v,outv g.V().out().limit(10)
Parâmetros opcionais para consultas %%gremlin profile
  • --chop: especifica o tamanho máximo da string de resultados do perfil. O valor padrão, se você não fornecer esse argumento, será 250.

  • --serializer: especifica o serializador a ser usado para os resultados. Os valores permitidos são qualquer um dos valores de enumeração “Serializadores” do tipo MIME ou TinkerPop driver válidos. O valor padrão, se você não fornecer esse argumento, será application.json.

  • --no-results: exibe somente a contagem de resultados. Se não for usado, todos os resultados da consulta serão exibidos no relatório do perfil por padrão.

  • --indexOps: mostra um relatório detalhado de todas as operações do índice.

A magia de célula %%opencypher (também %%oc)

A magia de célula %%opencypher (que também tem a forma abreviada %%oc) emite uma consulta do openCypher para o endpoint do Neptune. Ela aceita os seguintes argumentos de entrada de linha opcionais:

  • mode: o modo de consulta: query ou bolt. O valor padrão, se você não fornecer esse argumento, será query.

  • --group-by ou -g: especifica a propriedade usada para agrupar nós. Por exemplo, code, ~id. O valor padrão, se você não fornecer esse argumento, será ~labels.

  • --ignore-groups: se estiverem presentes, todas as opções de agrupamento serão ignoradas.

  • --display-propery ou -d: especifica a propriedade cujo valor deve ser exibido para cada vértice. O valor padrão, se você não fornecer esse argumento, será ~labels.

  • --edge-display-propery ou -de: especifica a propriedade cujo valor deve ser exibido para cada borda. O valor padrão, se você não fornecer esse argumento, será ~labels.

  • --label-max-length ou -l: especifica o número máximo de caracteres de um rótulo de vértice a ser exibido. O valor padrão, se você não fornecer esse argumento, será 10.

  • --store-to ou -s: especifica o nome de uma variável na qual armazenar os resultados da consulta.

  • --plan-cache ou -pc: especifica o modo de cache do plano a ser usado. O valor padrão éauto. (*o plan-cache só está disponível para o Neptune Analytics)

  • --query-timeout ou -qt: especifica o tempo limite máximo da consulta em milissegundos. O valor padrão é 1800000.

  • --query-parameters ou qp: definições de parâmetros a serem aplicadas à consulta. Essa opção pode aceitar um único nome de variável ou uma representação de string do mapa.

    Exemplo de uso de --query-parameters
    1. Defina um mapa dos parâmetros do openCypher em uma célula do bloco de anotações.

      params = '''{ "name":"john", "age": 20, }'''
    2. Passe os parâmetros para --query-parameters em outra célula com %%oc.

      %%oc --query-parameters params MATCH (n {name: $name, age: $age}) RETURN n
  • --explain-type — Usado para especificar o modo de explicação a ser usado (um dos seguintes: dinâmico, estático ou detalhado).

A magia de célula %%graph_notebook_vis_options

A magia de célula %%graph_notebook_vis_options permite que você defina opções de visualização para o caderno. É possível copiar as configurações geradas pela magia de linha %graph-notebook-vis-options em uma nova célula, fazer alterações nelas e usar a magia de célula %%graph_notebook_vis_options para definir os novos valores.

Essas opções são explicadas na documentação do vis.js.

Para restaurar os valores padrão das configurações de visualização, você pode executar a magia de linha %graph_notebook_vis_options com um parâmetro reset. Isso redefine todas as configurações de visualização:

%graph_notebook_vis_options reset

A magia de linha %neptune_ml

É possível usar a magia de linha %neptune_ml para iniciar e gerenciar várias operações do Neptune ML.

nota

Também é possível iniciar e gerenciar algumas operações do Neptune ML usando a magia de célula %%neptune_ml.

  • %neptune_ml export start: inicia um novo trabalho de exportação.

    Parâmetros
    • --export-url exporter-endpoint: (opcional) o endpoint do Amazon API Gateway em que o exportador pode ser chamado.

    • --export-iam: (opcional) sinalizador indicando que as solicitações para o URL de exportação devem ser assinadas usando SigV4.

    • --export-no-ssl: (opcional) sinalizador indicando que o SSL não deve ser usado ao se conectar ao exportador.

    • --wait: (opcional) sinalizador indicando que a operação deve esperar até que a exportação seja concluída.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status de exportação (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de exportação antes de exibir o status mais recente (padrão: 3.600).

    • --store-tolocation-to-store-result— (opcional) A variável na qual armazenar o resultado da exportação. Se --wait for especificado, o status final será armazenado.

  • %neptune_ml export status: recupera o status de um trabalho de exportação.

    Parâmetros
    • --job-id ID do trabalho de exportação: o ID do trabalho de exportação para o qual recuperar o status.

    • --export-url exporter-endpoint: (opcional) o endpoint do Amazon API Gateway em que o exportador pode ser chamado.

    • --export-iam: (opcional) sinalizador indicando que as solicitações para o URL de exportação devem ser assinadas usando SigV4.

    • --export-no-ssl: (opcional) sinalizador indicando que o SSL não deve ser usado ao se conectar ao exportador.

    • --wait: (opcional) sinalizador indicando que a operação deve esperar até que a exportação seja concluída.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status de exportação (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de exportação antes de exibir o status mais recente (padrão: 3.600).

    • --store-tolocation-to-store-result— (opcional) A variável na qual armazenar o resultado da exportação. Se --wait for especificado, o status final será armazenado.

  • %neptune_ml dataprocessing start: inicia a etapa de processamento de dados do Neptune ML.

    Parâmetros
    • --job-id ID desse trabalho: (opcional) ID a ser atribuído a esse trabalho.

    • --s3-input-uri URI do S3: (opcional) o URI do S3 no qual se encontra a entrada desse trabalho de processamento de dados.

    • --config-file-name nome do arquivo: (opcional) nome do arquivo de configuração desse trabalho de processamento de dados.

    • --store-tolocation-to-store-result— (opcional) A variável na qual armazenar o resultado do processamento de dados.

    • --instance-type (tipo de instância): (opcional) O tamanho da instância a ser usada para esse trabalho de processamento de dados.

    • --wait: (opcional) sinalizador indicando que a operação deve esperar até que o processamento de dados seja concluído.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações do status do processamento de dados (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de processamento de dados antes de exibir o status mais recente (padrão: 3.600).

  • %neptune_ml dataprocessing status: recupera o status de uma tarefa de processamento de dados.

    Parâmetros
    • --job-id ID do trabalho: o ID do trabalho para o qual recuperar o status.

    • --store-to tipo de instância: (opcional) a variável na qual armazenar o resultado do treinamento do modelo.

    • --wait: (opcional) sinalizador indicando que a operação deve aguardar até que o treinamento de modelos seja concluído.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status do treinamento do modelo (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de processamento de dados antes de exibir o status mais recente (padrão: 3.600).

  • %neptune_ml training start: inicia o processo de treinamento de modelos do Neptune ML.

    Parâmetros
    • --job-id ID desse trabalho: (opcional) ID a ser atribuído a esse trabalho.

    • --data-processing-id ID do trabalho de processamento de dados: (opcional) ID do trabalho de processamento de dados que criou os artefatos a serem usados no treinamento.

    • --s3-output-uri URI do S3: (opcional) o URI do S3 no qual armazenar a saída desse trabalho de treinamento de modelos.

    • --instance-type (tipo de instância): (opcional) o tamanho da instância a ser usada para esse trabalho de treinamento de modelos.

    • --store-tolocation-to-store-result— (opcional) A variável na qual armazenar o resultado do treinamento do modelo.

    • --wait: (opcional) sinalizador indicando que a operação deve aguardar até que o treinamento de modelos seja concluído.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status do treinamento do modelo (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de treinamento de modelos antes de exibir o status mais recente (padrão: 3.600).

  • %neptune_ml training status: recupera o status de um trabalho de treinamento de modelos do Neptune ML.

    Parâmetros
    • --job-id ID do trabalho: o ID do trabalho para o qual recuperar o status.

    • --store-to tipo de instância: (opcional) a variável na qual armazenar o resultado do status.

    • --wait: (opcional) sinalizador indicando que a operação deve aguardar até que o treinamento de modelos seja concluído.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status do treinamento do modelo (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de processamento de dados antes de exibir o status mais recente (padrão: 3.600).

  • %neptune_ml endpoint create: cria um endpoint de consulta para um modelo do Neptune ML.

    Parâmetros
    • --job-id ID desse trabalho: (opcional) ID a ser atribuído a esse trabalho.

    • --model-job-id ID do trabalho de treinamento de modelos: (opcional) ID do trabalho de treinamento de modelos para o qual criar um endpoint de consulta.

    • --instance-type (tipo de instância): (opcional) o tamanho da instância a ser usada para o endpoint de consulta.

    • --store-tolocation-to-store-result— (opcional) A variável na qual armazenar o resultado da criação do endpoint.

    • --wait: (opcional) sinalizador indicando que a operação deve aguardar até que a criação do endpoint seja concluída.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de criação do endpoint antes de exibir o status mais recente (padrão: 3.600).

  • %neptune_ml endpoint status: recupera o status de um endpoint de consulta do Neptune ML.

    Parâmetros
    • --job-id ID de criação de endpoint: (opcional) ID de um trabalho de criação de endpoint para o qual relatar o status.

    • --store-tolocation-to-store-result— (opcional) A variável na qual armazenar o resultado do status.

    • --wait: (opcional) sinalizador indicando que a operação deve aguardar até que a criação do endpoint seja concluída.

    • --wait-intervalinterval-to-wait— (opcional) Define o tempo, em segundos, entre as verificações de status (Padrão: 60).

    • --wait-timeout timeout-seconds: (opcional) define o tempo, em segundos, para aguardar a conclusão do trabalho de criação do endpoint antes de exibir o status mais recente (padrão: 3.600).

A magia de célula %%neptune_ml

A magia de célula %%neptune_ml ignora as entradas de linha, como --job-id ou --export-url. Em vez disso, ela permite que você forneça essas entradas e outras dentro do corpo da célula.

Também é possível salvar essas entradas em outra célula, atribuída a uma variável Jupyter, e depois injetá-las no corpo da célula usando essa variável. Dessa forma, é possível usar essas entradas repetidamente sem precisar inseri-las novamente todas as vezes.

Isso só funcionará se a variável de injeção for o único conteúdo da célula. Você não pode usar várias variáveis em uma célula nem uma combinação de texto e uma variável.

Por exemplo, a magia de célula %%neptune_ml export start pode consumir um documento JSON no corpo da célula que contém todos os parâmetros descritos em Parâmetros usados para controlar o processo de exportação do Neptune.

No caderno Neptune-ML-01-Introduction-to-Node-Classification-Gremlin, em Configuring Features na seção Export the data and model configuration, é possível ver como a célula a seguir contém os parâmetros de exportação em um documento atribuído a uma variável do Jupyter chamada export-params.

export_params = { "command": "export-pg", "params": { "endpoint": neptune_ml.get_host(), "profile": "neptune_ml", "useIamAuth": neptune_ml.get_iam(), "cloneCluster": False }, "outputS3Path": f'{s3_bucket_uri}/neptune-export', "additionalParams": { "neptune_ml": { "targets": [ { "node": "movie", "property": "genre" } ], "features": [ { "node": "movie", "property": "title", "type": "word2vec" }, { "node": "user", "property": "age", "type": "bucket_numerical", "range" : [1, 100], "num_buckets": 10 } ] } }, "jobSize": "medium"}

Quando você executa essa célula, o Jupyter salva o documento de parâmetros com esse nome. Depois, é possível usar ${export_params} para injetar o documento JSON no corpo de um %%neptune_ml export start cell da seguinte forma:

%%neptune_ml export start --export-url {neptune_ml.get_export_service_host()} --export-iam --wait --store-to export_results ${export_params}

Formas disponíveis da magia de célula %%neptune_ml

A magia de célula %%neptune_ml pode ser usada das seguintes formas:

  • %%neptune_ml export start: inicia um processo de exportação do Neptune ML.

  • %%neptune_ml dataprocessing start: inicia um trabalho de processamento de dados do Neptune ML.

  • %%neptune_ml training start: inicia um trabalho de treinamento de modelos do Neptune ML.

  • %%neptune_ml endpoint create: cria um endpoint de consulta do Neptune ML para um modelo.