AWS Systems Manager OpsCenter
OpsCenter, una función de AWS Systems Manager, proporciona una ubicación central en la que los ingenieros de operaciones y los profesionales de TI pueden ver, investigar y resolver elementos de trabajo operativos (OpsItems) relacionados con los recursos de AWS. OpsCenter está diseñado para reducir la media de tiempo de resolución de problemas que impactan en los recursos de AWS. OpsCenter agrega y estandariza OpsItems en todos los servicios, al tiempo que proporciona datos de investigación contextuales sobre cada OpsItem, OpsItems relacionados y recursos relacionados. OpsCenter también proporciona manuales de procedimientos de automatización de Systems Manager que puede utilizar para resolver problemas rápidamente. Puede especificar datos que se pueden buscar y personalizar para cada OpsItem. También puede ver informes de resumen generados automáticamente sobre OpsItems por estado y origen. Para comenzar a utilizar OpsCenter, abra la consola de Systems Manager
OpsCenter está integrado con Amazon EventBridge y Amazon CloudWatch. Esto significa que puede configurar estos servicios para crear automáticamente un OpsItem en OpsCenter cuando una alarma de CloudWatch ingresa en el estado ALARM
o cuando EventBridge procesa un evento desde cualquier servicio de AWS que publica eventos. La configuración de alarmas de CloudWatch y eventos de EventBridge para crear automáticamente OpsItems le permite diagnosticar y remediar de manera rápida problemas con recursos de AWS desde una consola individual.
Para ayudarlo a diagnosticar problemas, cada OpsItem incluye información contextualmente relevante, como el nombre y el ID del recurso de AWS que generó el OpsItem, los detalles de alarmas o eventos, el historial de alarmas y un gráfico de línea de tiempo de alarma.
Para el recurso de AWS, OpsCenter agrega información de AWS Config, registros de AWS CloudTrail y Amazon CloudWatch Events para que no tenga que navegar por varias páginas de la consola durante la investigación.
En la siguiente lista se incluyen tipos de recursos de AWS y métricas para los cuales los clientes configuran alarmas de CloudWatch que crean OpsItems.
-
Amazon DynamoDB: las acciones de lectura y escritura de bases de datos alcanzan un umbral.
-
Amazon EC2: la utilización de la CPU alcanza un límite
-
Facturación de AWS: los cargos estimados alcanzan un límite
-
Amazon EC2: una instancia no logra hacer una verificación de estado
-
Amazon Elastic Block Store (EBS): la utilización del espacio en disco alcanza un límite
En la siguiente lista se incluyen tipos de reglas de EventBridge configuradas por el cliente para crear OpsItems.
-
AWS Security Hub: alerta de seguridad emitida
-
DynamoDB: un evento de limitación controlada
-
Amazon EC2 Auto Scaling: error al momento de lanzar una instancia
-
Systems Manager: error al momento de ejecutar una automatización
-
AWS Health: una alerta de mantenimiento programado
-
Instancia EC2: cambio de estado de
Running
aStopped
OpsCenter también está integrado con Amazon CloudWatch Application Insights para .NET y SQL Server. Esto significa que puede crear automáticamente OpsItems para problemas detectados en sus aplicaciones. También se pueden integrar OpsCenter con AWS Security Hub para agregar y tomar medidas en cuanto a sus problemas operativos, de seguridad y de rendimiento en Systems Manager.
Los ingenieros de operaciones y los profesionales de TI pueden crear, ver y editar OpsItems mediante la página de OpsCenter en la consola de AWS Systems Manager, las operaciones de la API pública, la AWS Command Line Interface (AWS CLI), AWS Tools for Windows PowerShell, o AWS SDK. Las operaciones de la API pública de OpsCenter también le permiten integrar OpsCenter con los sistemas de administración de casos y los paneles de estado.
¿Cómo puede OpsCenter beneficiar a mi organización?
OpsCenter proporciona una experiencia unificada y estándar para ver problemas relacionados con los recursos de AWS, trabajar con ellos y solucionarlos. Una experiencia estándar y unificada reduce el tiempo que se tarda en solucionar los problemas, en investigar los problemas relacionados y en formar a los nuevos ingenieros de operaciones y profesionales de TI. Una experiencia estándar y unificada también reduce el número de errores manuales en el sistema de administración y de resolución de problemas.
En concreto, OpsCenter ofrece las siguientes ventajas para los ingenieros de operaciones y para las organizaciones:
-
Ya no tendrá que navegar por varias páginas de la consola para ver, investigar y resolver OpsItems relacionados con los recursos de AWS. Los OpsItems se recopilan en los servicios y se guardan en una ubicación central.
-
Puede ver datos relevantes desde el punto de vista contextual para OpsItems que las alarmas de CloudWatch, los eventos de EventBridge y CloudWatch Application Insights para .NET y SQL Server generan automáticamente.
-
Puede especificar el nombre de recurso de Amazon (ARN) de un recurso relacionado con un OpsItem. Al especificar los recursos relacionados, OpsCenter utiliza la lógica integrada para evitar que se cree un OpsItems duplicado.
-
Puede ver los detalles y la información sobre la resolución de OpsItems similares.
-
Puede ver rápidamente información sobre los manuales de procedimientos de Automatización de Systems Manager y ejecutarlos para resolver problemas.
¿Cuáles son las características de OpsCenter?
-
Creación automática y manual de OpsItem
OpsCenter está integrado con Amazon CloudWatch. Esto significa que puede configurar CloudWatch para crear un OpsItem en OpsCenter automáticamente cuando una alarma ingresa en el estado
ALARM
o cuando Amazon EventBridge procesa un evento desde cualquier servicio de AWS que publica eventos. También puede crear OpsItems manualmente.OpsCenter también está integrado con Amazon CloudWatch Application Insights para .NET y SQL Server. Esto significa que puede crear automáticamente OpsItems para problemas detectados en sus aplicaciones.
-
OpsItems detallados y consultables
Cada OpsItem incluye varios campos de información, incluido un título, un ID, una prioridad, una descripción, el origen del OpsItem, y la fecha y la hora en que se actualizó por última vez. Cada OpsItem también incluye las siguientes características configurables:
-
Status (Estado): Pendiente, En curso, Resuelto o Pendiente y En curso.
-
Related resources (Recursos relacionados): un recurso relacionado es el recurso afectado o el recurso que inició el evento de EventBridge que creó el OpsItem. Cada OpsItem incluye una sección Related resources (Recursos relacionados) donde OpsCenter enumera automáticamente el nombre de recurso de Amazon (ARN) del recurso relacionado. También puede especificar los ARN de los recursos relacionados manualmente. Para algunos tipos de ARN, OpsCenter crea automáticamente un enlace profundo que muestra detalles sobre el recurso por lo que ya no es necesario visitar otras páginas de la consola para ver dicha información. Por ejemplo, si especifica el ARN de una instancia de EC2, puede ver todos los detalles proporcionados por EC2 acerca de la instancia en OpsCenter. Puede añadir los ARN de recursos relacionados adicionales manualmente. Cada OpsItem puede enumerar un máximo de 100 ARN de recursos relacionados. Para obtener más información, consulte Adición de recursos relacionados a un OpsItem.
-
Related and Similar OpsItems (OpsItems relacionados y similares): la característica Related OpsItems (OpsItems relacionados) le permite especificar los ID de OpsItems relacionados de algún modo con el OpsItem actual. La característica Similar OpsItem (OpsItem similar) revisa de forma automática los títulos y las descripciones del OpsItem y, a continuación, enumera los OpsItems que pueden estar relacionados o que le pueden interesar.
-
Searchable and private operational data (Datos operativos privados y consultables): los datos operativos son datos personalizados que proporcionan información detallada útil de referencia acerca del OpsItem. Por ejemplo, puede especificar archivos de registro, cadenas de error, claves de licencia, sugerencias para resolver problemas u otros datos pertinentes. Escriba los datos operativos como pares clave-valor. La clave tiene una longitud máxima de 128 caracteres. El valor tiene un tamaño máximo de 20 KB.
Los datos personalizados se pueden consultar, pero con restricciones. Para la característica Searchable operational data (Datos operativos consultables), todos los usuarios con acceso a la página de información general de OpsItem (tal como indica la operación de la API DescribeOpsItems) pueden ver y realizar búsquedas en los datos especificados. Para la característica Private operational data (Datos operativos privados), solo los usuarios con acceso a OpsItem pueden ver los datos (tal como indica la operación de la API GetOpsItem).
-
Deduplication (Desduplicación): si especifica los recursos relacionados, OpsCenter utiliza la lógica integrada para evitar que se cree un OpsItems duplicado. OpsCenter también incluye una característica llamada Información de las operaciones, que muestra información sobre OpsItems duplicados. Para limitar aún más el número de OpsItems duplicados en su cuenta, puede especificar manualmente una cadena de desduplicación para una regla de evento de EventBridge. Para obtener más información, consulte Administración de OpsItems duplicados.
-
-
Edición múltiple de OpsItems: Puede seleccionar varios OpsItems en OpsCenter y editar uno de los siguientes campos: Status (Estado), Priority (Prioridad), Severity (Severidad) y Category (Categoría).
-
Soluciones sencillas usando manuales de procedimiento
Cada OpsItem incluye una sección llamada Runbooks (Manuales de procedimientos) con una lista de manuales de procedimientos de Automatización de Systems Manager que se pueden utilizar para solucionar problemas comunes con los recursos de AWS de forma automática. Si abre un OpsItem, elija un recurso de AWS para ese OpsItem y, a continuación, elija el botón Run automation (Ejecutar automatización) de la consola y, luego, OpsCenter proporciona una lista de manuales de procedimientos de Automation que se pueden ejecutar en el recurso de AWS que generó el OpsItem. Después de ejecutar un manual de procedimientos de Automation desde un OpsItem, el manual de procedimientos se asocia automáticamente al recurso relacionado de OpsItem para futura referencia. Además, si configura reglas de OpsItem en EventBridge de forma automática mediante el uso de OpsCenter, EventBridge asocia automáticamente manuales de procedimientos para eventos comunes. OpsCenter mantiene un registro de 30 días de manuales de procedimientos de Automation ejecutados para un OpsItem. Para obtener más información, consulte Resolución de problemas de OpsItem.
-
Change notification (Cambiar notificación): puede especificar el ARN de un tema de Amazon Simple Notification Service (SNS) y publicar notificaciones cada vez que se modifica o edita un OpsItem. El tema de SNS debe existir en la misma Región de AWS del OpsItem.
-
Comprehensive OpsItem search capabilities (Numerosas opciones de búsqueda de): OpsCenter proporciona numerosas opciones de búsqueda para ayudarle a localizar los OpsItems rápidamente. A continuación, mostramos algunos ejemplos de cómo realizar búsquedas: ID de OpsItem, Título, Hora de última modificación, Valor de datos operativos, Origen e ID de automatización de una ejecución de manual de procedimientos, por citar solo algunos. Puede limitar aún más los resultados de búsqueda aplicando filtros de estado.
-
Informes de resumen de OpsItem
OpsCenter incluye una página de informes de resumen que muestra automáticamente las siguientes secciones:
-
Status summary (Resumen de estado): resumen de OpsItems por estado (Abierto, En curso, Resuelto, Abierto y En curso).
-
Sources with most open OpsItems (Orígenes con OpsItems más abiertos): desglose de los servicios principales de AWS con OpsItems abiertos.
-
OpsItems by source and age (por origen y antigüedad): recuento de los OpsItems agrupados por origen y días desde su creación.
Para obtener más información sobre la visualización de informes de resumen de OpsCenter, consulte Visualización de informes de resumen de OpsCenter.
-
-
Compatibilidad con la capacidad de registro y la auditoría
Puede auditar y registrar las acciones de usuarios de OpsCenter en su Cuenta de AWS a través de la integración con otros servicios de AWS. Para obtener más información, consulte Visualización de registros e informes de OpsCenter.
-
Acceso de la consola, CLI, PowerShell y SDK a las capacidades de OpsCenter
Puede trabajar con OpsCenter mediante la consola de AWS Systems Manager, AWS Command Line Interface (AWS CLI), AWS Tools for PowerShell, o el AWS SDK de su elección.
¿Se integra OpsCenter con mi sistema de administración de casos existente?
OpsCenter está diseñado para complementar sus sistemas de administración de casos existentes. Puede integrar OpsItems en su sistema de administración de casos existente empleando operaciones de la API pública. También puede mantener flujos de trabajo del ciclo de vida manuales en los sistemas actuales y utilizar OpsCenter como un centro de investigación y corrección de errores.
Para obtener más información acerca de las operaciones de la API pública de OpsCenter, consulte las siguientes operaciones de la API en la Referencia de la API de AWS Systems Manager.
¿Se cobra por usar OpsCenter?
Sí. Para más información, consulte Precios de AWS Systems Manager
¿Funciona OpsCenter con los nodos administrados híbridos y locales?
Sí. Puede utilizar OpsCenter para investigar y solucionar problemas con los nodos administrados locales configurados para Systems Manager. Para obtener más información acerca de la configuración de los servidores locales y las máquinas virtuales de Systems Manager, consulte Administrador de servidores en entornos híbridos y multinube con Systems Manager.
¿Cuáles son las cuotas de OpsCenter?
Puede ver las cuotas para todas las capacidades de Systems Manager en Service Quotas de Systems Manager en la Referencia general de Amazon Web Services. A menos que se indique lo contrario, cada cuota es específica de la región.