As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Pilar Excelência operacional
O pilar de excelência operacional do AWS Well-Architected Framework se concentra na execução e monitoramento de sistemas e na melhoria contínua de processos e procedimentos. Isso inclui a capacidade de apoiar o desenvolvimento e executar cargas de trabalho de forma eficaz, obter informações sobre suas operações e melhorar continuamente os processos e procedimentos de suporte para agregar valor comercial. Você pode reduzir a complexidade operacional por meio de cargas de trabalho de autorrecuperação, que detectam e solucionam a maioria dos problemas sem intervenção humana. Você pode trabalhar em direção a essa meta seguindo as melhores práticas descritas nesta seção e usando as métricas APIs e os mecanismos do Amazon Neptune Analytics para responder adequadamente quando sua carga de trabalho se desvia do comportamento esperado.
Essa discussão sobre o pilar de excelência operacional se concentra nas seguintes áreas principais:
-
Infraestrutura como código (IaC)
-
Gerenciamento de alterações
-
Estratégias de resiliência
-
Gerenciamento de incidentes
-
Relatórios de auditoria para conformidade
-
Registro em log e monitoramento
Automatize a implantação usando uma abordagem de IaC
As melhores práticas para automatizar a implantação no Neptune usando o IaC incluem o seguinte:
-
Aplique o IaC para implantar gráficos do Neptune Analytics e recursos relacionados. Para uma configuração consistente do ambiente, use o suporte ao Neptune Analytics fornecido AWS CloudFormationpela para provisionar gráficos e endpoints privados.
-
Use CloudFormation para provisionar instâncias do notebook Neptune na Amazon AI. SageMaker Você pode usar notebooks para consultar e visualizar dados em um gráfico do Neptune Analytics.
-
Automatize os procedimentos operacionais do Neptune Analytics, como redimensionar o gráfico, excluir e capturar o gráfico, restaurar o gráfico a partir de um instantâneo e redefinir e recarregar o gráfico. Use a API Neptune Analytics, que está disponível por meio AWS Command Line Interface do AWS CLI() ou do SDK
s. -
Avalie o tempo de atividade necessário do seu gráfico. A análise geralmente é efêmera; o gráfico é necessário somente durante o tempo necessário para executar algoritmos. Se for esse o caso, use o AWS CLI ou SDKs para capturar um instantâneo e excluir o gráfico quando ele não for mais necessário. Em seguida, você poderá restaurá-lo a partir de um snapshot posteriormente, se necessário.
-
Armazene cadeias de conexão externamente do seu cliente. Você pode armazenar cadeias de conexão no AWS Secrets ManagerAmazon DynamoDB ou em qualquer local onde elas possam ser alteradas dinamicamente.
-
Use tags para adicionar metadados aos seus recursos do Neptune Analytics e monitore o uso com base em tags. As tags ajudam a organizar seus recursos. Por exemplo, você pode aplicar uma tag comum a recursos em um ambiente ou aplicativo específico. Você também pode usar tags para analisar o faturamento do uso de recursos; para obter mais informações, consulte Organização e controle de custos usando tags de alocação de AWS custos no Guia do usuário de AWS faturamento. Além disso, você pode usar condições em suas políticas AWS Identity and Access Management (IAM) para controlar o acesso aos AWS recursos com base nas tags usadas nesse recurso. Faça isso usando a chave de condição global
aws:ResourceTag/tag-key
. Para obter mais informações, consulte Controle do acesso aos AWS recursos no Guia do usuário do IAM.
Design das operações
Adote abordagens para melhorar a forma como você opera os gráficos do Neptune Analytics:
-
Mantenha gráficos separados do Neptune Analytics para uso em desenvolvimento, teste e produção. Esses gráficos podem ter conjuntos de dados, usuários e controles operacionais diferentes.
-
Mantenha gráficos separados do Neptune Analytics para diferentes usos. Por exemplo, se dois grupos de usuários analíticos precisarem de gráficos separados com cronogramas, modelos, desempenho, disponibilidade SLAs e padrões de uso diferentes, mantenha gráficos separados para cada grupo.
-
Prepare os usuários e a equipe operacional para as atualizações de manutenção do Neptune Analytics.
Faça mudanças frequentes, pequenas e reversíveis
As recomendações a seguir se concentram em mudanças pequenas e reversíveis que você pode fazer para minimizar a complexidade e reduzir a probabilidade de interrupção da carga de trabalho:
-
Armazene modelos e scripts de IaC em um serviço de controle de origem, como GitHub ou GitLab.
Importante
Não armazene AWS credenciais no controle de origem.
-
Exija que as implantações de IaC usem um serviço de integração contínua e entrega contínua (CI/CD), como ou. AWS CodeDeployAWS CodeBuild Compile, teste e implante código em um ambiente de não produção do Neptune Analytics antes de promovê-lo a um gráfico de produção.
Implemente a observabilidade para obter insights acionáveis
Obtenha uma compreensão abrangente do comportamento, desempenho, confiabilidade, custo e integridade da carga de trabalho. As recomendações a seguir ajudam você a obter esse nível de compreensão no Neptune Analytics:
-
Monitore CloudWatch as métricas da Amazon para o Neptune Analytics. A partir dessas métricas, você pode determinar o tamanho de um gráfico (número de nós, bordas e vetores, mais o tamanho total do byte), a utilização da CPU e as taxas de solicitação e erro de consulta.
-
Crie CloudWatch painéis e alarmes para as principais métricas
NumQueuedRequestsPerSec
, como,,NumOpenCypherRequestsPerSec
GraphStorageUsagePercent
GraphSizeBytes
, e também paraCPUUtilization
as respostas do cliente Neptune encontradas nos registros do seu aplicativo. -
Defina notificações para monitorar a integridade do gráfico do Neptune Analytics, como quando o tamanho do gráfico, a taxa de solicitações ou a utilização da CPU excedem seu limite. Por exemplo, se
GraphStorageUsagePercent
subiu para 90 por cento em um gráfico que você pretende aumentar significativamente, decida se deseja aumentar a capacidade da Unidade de Capacidade de Netuno (m-NCU) otimizada para memória. Se o m-NCU atual for 128, aumentá-lo para 256 reduzirá o armazenamento em cerca de 45 por cento. Se geralmenteNumQueuedRequestsPerSec
for maior que zero, considere aumentar a capacidade m-NCU para fornecer mais capacidade computacional. Como alternativa, você pode reduzir a simultaneidade do lado do cliente.
Aprenda com todas as falhas operacionais
Uma infraestrutura de autorrecuperação é um esforço de longo prazo que se desenvolve em iterações à medida que problemas raros ocorrem ou as respostas não são tão eficazes quanto o desejado. A adoção das seguintes práticas impulsiona o foco em direção a essa meta:
-
Promova a melhoria aprendendo com todas as falhas.
-
Compartilhe o que foi aprendido entre as equipes e a organização. Se várias equipes da sua organização usarem o Neptune, crie uma sala de bate-papo ou um grupo de usuários comum para compartilhar aprendizados e melhores práticas.
Use recursos de registro para monitorar atividades não autorizadas ou anômalas
Use o registro para observar padrões anômalos de desempenho e atividade. Considere as seguintes práticas recomendadas:
-
O Neptune Analytics suporta o registro de ações do plano de controle usando. AWS CloudTrail Para obter mais informações, consulte Como registrar chamadas da API Neptune Analytics usando. AWS CloudTrail Por meio desse recurso, você pode acompanhar a criação, atualização e exclusão dos recursos do Neptune Analytics. Para monitoramento e alertas robustos, você também pode integrar CloudTrail eventos com o Amazon CloudWatch Logs. Para aprimorar sua análise da atividade do serviço Neptune Analytics e identificar alterações nas atividades de Conta da AWS um, você pode CloudTrail consultar registros usando o Amazon Athena. Por exemplo, é possível usar consultas para identificar tendências e isolar ainda mais a atividade por atributos, como endereço IP de origem ou usuário.
-
Você também pode usar CloudTrail para habilitar o registro de atividades do plano de dados do Neptune Analytics, como execuções de consultas. Você pode ver quais consultas estão sendo executadas, sua frequência e sua origem. Por padrão, CloudTrail não registra eventos de dados. Há cobranças adicionais para eventos de dados. Para obter mais informações, consulte Preços do AWS CloudTrail
. -
Você também pode registrar suas chamadas de aplicativo no Neptune Analytics no plano de controle ou no plano de dados. Por exemplo, se você usar o AWS SDK para Python (Boto3)
para fazer consultas, poderá ativar o registro em nível de depuração para obter um rastreamento das consultas no console ou no arquivo. Isso é útil durante o desenvolvimento. Também recomendamos que você capture e registre exceções do seu aplicativo.