Descripción
Importante empresa solicita Ingeniero de observabilidad TI en modalidad hibrida(3 presenciales/ 2 teletrabajo) en horario de Lunes a jueves de 9:00 a 18:30 hrs Viernes de 9:00 a 16.00 hrs. Con mínimo 4 años de experiencia laboral en el área de Tecnología y 2 años de experiencia en áreas relacionadas con monitoreo u observabilidad.
Experiencia
• Experiencia en monitoreo, soporte de plataformas, operación TI, observabilidad o continuidad operacional.
• Experiencia práctica en construcción y mantención de dashboards y alertas en plataformas de observabilidad (idealmente Datadog).
• Experiencia monitoreando infraestructura, plataformas, APIs o servicios tecnológicos.
• Deseable experiencia en ambientes críticos o de alta disponibilidad.
Conocimientos técnicos
• Manejo de Datadog para creación y mantención de dashboards, monitors, métricas, logs y trazabilidad.
• Conocimiento de monitoreo de servidores, aplicaciones, APIs, servicios e infraestructura.
• Comprensión de métricas operativas y técnicas como disponibilidad, latencia, consumo, errores y capacidad.
• Conocimiento básico de gestión de incidentes y soporte operativo.
• Deseable entendimiento de conceptos como observabilidad, SLI/SLO y buenas prácticas de monitoreo.
Competencias requeridas
• Orientación al detalle.
• Capacidad analítica.
• Proactividad para identificar brechas de monitoreo.
• Trabajo colaborativo con equipos técnicos.
• Comunicación clara y efectiva.
Objetivo del cargo
Responsable de operar y ejecutar las capacidades de observabilidad de la compañía, aplicándolas sobre plataformas, infraestructura, APIs y servicios TI. Su foco estará en la construcción, mantención y ajuste de paneles, monitores y alertas en la plataforma Datadog, asegurando visibilidad operativa, detección oportuna de incidentes y apoyo a la continuidad operacional.
Principales responsabilidades
• Implementar y mantener tableros, monitores y alertas en Datadog, de acuerdo con los lineamientos y estándares definidos.
• Aplicar monitoreo sobre infraestructura, plataformas, APIs, integraciones y servicios TI críticos.
• Ejecutar configuraciones y ajustes de observabilidad para asegurar cobertura sobre componentes tecnológicos.
• Revisar continuamente métricas, logs, eventos y trazas para identificar desviaciones, anomalías o degradaciones de servicio.
• Ajustar umbrales, criterios de alerta y visualizaciones para mejorar la efectividad del monitoreo y reducir ruido operativo.
• Apoyar la detección temprana de incidentes mediante alertamiento oportuno y visibilidad técnica de los servicios.
• Generar paneles operativos y reportes de seguimiento para equipos de tecnología y continuidad operacional.
• Trabajar con equipos de infraestructura, operaciones, soporte y desarrollo para incorporar o mejorar monitoreo en nuevos componentes o servicios.