En muchas organizaciones de TI, los incentivos no se alinean con los desarrolladores, que buscan agilidad, y los operadores, que se enfocan en la estabilidad. La ingeniería de confiabilidad de sitios (SRE) es el enfoque que usa Google para alinear los incentivos entre los equipos de desarrollo y operaciones, y brindar asistencia en la producción de servicios fundamentales. Adoptar las prácticas técnicas y culturales de la SRE puede ayudar a mejorar la colaboración entre las empresas y sus departamentos de TI. En este curso se presentan las prácticas clave de la SRE de Google y la función importante que tienen los líderes empresariales y de TI en el éxito de la adopción organizacional de este enfoque.
Overview
Syllabus
- Te damos la bienvenida a Developing a Google SRE Culture
- Este módulo consiste en una descripción general del curso. Aprenderás por qué este curso es útil para los líderes de TI y los líderes empresariales que desean adoptar una cultura de SRE, y conocerás los temas que se cubrirán en cada módulo.
- Qué son DevOps y SRE, y por qué existen
- En este módulo, se explican los componentes de la filosofía de DevOps, por qué surgió la ingeniería de confiabilidad de sitios y quién puede y debe aplicar la SRE en una organización.
- SLO con consecuencias
- En este módulo, se abordan el valor de la SRE para una organización, así como los conceptos técnicos y culturales fundamentales para reducir los entornos organizacionales aislados y aceptar el fracaso como algo normal. Se incluyen temas como las prácticas técnicas de SRE para realizar análisis retrospectivos libres de culpa, los objetivos de nivel de servicio (SLO), el porcentaje de error aceptable y las prácticas culturales de la SRE para garantizar la seguridad psicológica, fomentar una visión unificada, impulsar la colaboración y comunicación, motivar el uso compartido del conocimiento y no culpabilizar.
- Mejora el mañana
- Las pruebas continuas y graduales, así como la automatización, son muy importantes en la cultura de la SRE. Este módulo se centra en los conceptos técnicos de la SRE, como la integración continua, la entrega continua y la creación de versiones canary, según el pilar de DevOps que indica que los cambios se deben implementar de forma gradual. Conocerás los conceptos de trabajo repetitivo y automatización, y te familiarizarás con la idea de automatizar el trabajo de este año. También aprenderás sobre las prácticas culturales de la SRE sobre design thinking, prototipado y cómo apoyar a tus equipos cuando se produzcan cambios.
- Regula la carga de trabajo
- En este módulo, conocerás las prácticas de la SRE que se relacionan con la medición de todos los aspectos, en particular la confiabilidad y el trabajo repetitivo, y el concepto de supervisión. También cubriremos los conceptos culturales fundamentales de la definición de objetivos, la transparencia y la toma de decisiones basada en datos.
- Aplica la SRE en tu organización
- En este módulo, hablaremos de cómo evaluar y comprender la madurez de tu organización y su preparación para adoptar los principios, las prácticas y la cultura de la SRE. También analizaremos los tipos de habilidades que se buscan a la hora de contratar nuevos ingenieros de confiabilidad de sitios y cómo desarrollar las habilidades de tu personal actual. Finalmente, te aconsejaremos para que comiences a establecer una organización de SRE y te informaremos sobre la asistencia adicional que nuestros equipos de Servicios Profesionales de Google Cloud pueden proporcionarle a tu organización en tu recorrido hacia la SRE.
- Evaluación final
- Evalúa tus conocimientos generales sobre las prácticas técnicas y culturales de la SRE de Google con este cuestionario sumativo. Debes obtener una puntuación del 80% para aprobar. Esta evaluación es obligatoria para recibir tu certificado de finalización del curso.
Taught by
Google Cloud Training