DevOps: Die Kultur
DevOps = Development + Operations
Kernprinzipien:
- Zusammenarbeit (Dev + Ops nicht getrennt)
- Automatisierung (CI/CD, IaC)
- Kontinuierliche Verbesserung
- Kundenfokus (schnelle Releases)
DevOps ist KEINE Rolle, es ist eine Kultur!
"DevOps Engineer" ist eigentlich ein Widerspruch.
In der Praxis: oft Platform/Infrastructure-Engineer.
DevOps-Erfolgsmetriken (DORA-Metrics):
Deployment Frequency (Elite: mehrmals/Tag)
Lead Time to Change (Elite: < 1h)
Change Failure Rate (Elite: < 5%)
Time to Restore (Elite: < 1h)
SRE: Die Implementierung
SRE = Site Reliability Engineering
Erfindet von Google 2003 (Ben Treynor Sloss)
"SRE ist was passiert wenn ein Software-Engineer
Operations-Aufgaben bekommt"
SRE-Kernkonzepte:
SLI: Service Level Indicator
Mess-Wert (z.B. Fehlerrate, Latenz)
SLO: Service Level Objective
Zielwert fuer SLI (z.B. 99.9% Verfuegbarkeit)
SLA: Service Level Agreement
Vertragliche Verpflichtung (< SLO!)
Error Budget:
100% - SLO = erlaubte Downtime
99.9% SLO = 8.7h/Jahr Error Budget
Error Budget Praxis
Error Budget Management:
Alle Downtime-Minuten "kosten" Error-Budget.
Wenn Budget aufgebraucht:
→ Keine neuen Features!
→ Nur Stabilitaets-Arbeit bis Budget wieder voll.
Beispiel:
SLO: 99.9% Verfuegbarkeit/Monat
Budget: 0.1% von 30 Tagen = 43.2 Minuten
Incidents diesen Monat:
Datenbankausfall: 15 Min
Deployment-Fehler: 10 Min
Netzwerkproblem: 5 Min
Verbrauchtes Budget: 30 Min
Restliches Budget: 13.2 Min
→ Noch 13 Minuten fuer riskante Deployments!
Toil-Reduktion
Toil = Manuelle, repetitive Arbeit ohne dauerhaften Wert
Typischer Toil:
- Manuell Logs analysieren
- Manuell Tickets bearbeiten (Passwort reset)
- Manuell Kapazitaet erhoehen
SRE-Regel: Max. 50% der Zeit fuer Toil
Rest: Automation, Verbesserungen, Projekte
Toil-Messung:
Zeit pro Woche fuer Toil tracken
Oberhalb 50%: SRE braucht Unterstuetzung oder mehr Automation
Toil-Automation-ROI:
Toil: 4h/Woche
Automation-Aufwand: 40h
Break-Even: 40h / 4h = 10 Wochen
DevOps vs SRE fuer KMU
KMU 10-50 Mitarbeiter:
Empfehlung: DevOps-Kultur (keine eigenen SREs)
Platform-Engineer: Infrastructure + CI/CD
KMU 50-200 Mitarbeiter:
1 DevOps/Platform-Engineer
SRE-Prinzipien (SLOs, Error Budgets) optional
KMU 200+ Mitarbeiter / mehrere Produkte:
Sinnvoll: SRE-Team oder SRE-Praktiken einfuehren
SLOs definieren, Toil-Tracking
FAQ
Braucht jedes Unternehmen einen SRE?
Nein. SRE ist fuer Unternehmen die Ziel-Verfuegbarkeit (z.B. 99.99%) sehr ernst nehmen und dies systematisch messen. KMU profitieren von DevOps-Kultur und einzelnen SRE-Prinzipien.
Fazit
DevOps ist die Kultur, SRE die strukturierte Methode. Fuer KMU: DevOps-Kultur sofort, SRE-Prinzipien (SLOs, Error Budget, Toil-Automation) schrittweise einfuehren.
DevOps-Beratung fuer KMU in Heidelberg, Mannheim und der Rhein-Neckar-Region. Beratung anfragen.