Es una disciplina que aplica los principios de la ingeniería de software a los problemas de operaciones y de infraestructura. El objetivo de SRE es crear sistemas de software escalables y altamente confiables. Ayuda a ordenar el caos en arquitecturas complejas de microservicios, dando visibilidad para decidir cuándo desplegar o retroceder basándose en datos. Para lograrlo, se apoya en la definición de contratos claros entre servicios (SLOs), el uso de timeouts razonables y la implementación de ""circuit breakers"", asegurando que la fiabilidad sea una característica diseñada y no una casualidad.