Einführung in Site Reliability Engineering
Site Reliability Engineering (SRE) hat sich in den vergangenen Jahren als moderner Ansatz für den Betrieb verteilter Systeme etabliert. Im Zuge des Workshops werden die Teilnehmer:innen in relevante Konzepte von SRE wie z.B. Service Level Objectives (SLOs), Postmortems und Root-Cause-Analysen eingeführt.
Als Roter Faden wird uns dabei die "SRE Pyramid" aus dem Google-SRE-Buch dienen, deren einzelne Themen in Blöcken bearbeitet werden.
Die erlernten Konzepte und Ideen werden wir durch Beispiele, Gruppenarbeiten und Diskussionen vertiefen. Am Ende sollen die Teilnehmer:innen ein pragmatisches und Tool-agnostisches Verständnis von SRE mitnehmen, das sie auch in ihrem eigenen Alltag einsetzen können.
Vorkenntnisse
- Grundkenntnisse im Betrieb von Verteilten Systemen
- Grundkenntnisse Verteilter Systeme
- Grundkenntnisse von Kubernetes sind hilfreich für das Nachvollziehen der Beispiele
Lernziele
- Motivieren der Teilnehmer:innen, sich mit dem Thema SRE auseinanderzusetzen
- Vermitteln relevanter Bausteine für dein eigenen Einsatz
- Vermitteln von Best Practices und Lessons Learned aus unserer eigenen Erfahrung
- Ausblick wo es mit dem Thema hingehen kann