Linuxguide

DevOps vs SRE – Was ist der Unterschied 2025?

Site Reliability Engineering als Google-Antwort auf DevOps

S
SeeColors IT
11. Juni 20264 Min. Lesezeit128 Aufrufe

DevOps: Die Kultur

DevOps = Development + Operations

Kernprinzipien:
  - Zusammenarbeit (Dev + Ops nicht getrennt)
  - Automatisierung (CI/CD, IaC)
  - Kontinuierliche Verbesserung
  - Kundenfokus (schnelle Releases)

DevOps ist KEINE Rolle, es ist eine Kultur!
"DevOps Engineer" ist eigentlich ein Widerspruch.
In der Praxis: oft Platform/Infrastructure-Engineer.

DevOps-Erfolgsmetriken (DORA-Metrics):
  Deployment Frequency (Elite: mehrmals/Tag)
  Lead Time to Change (Elite: < 1h)
  Change Failure Rate (Elite: < 5%)
  Time to Restore (Elite: < 1h)

SRE: Die Implementierung

SRE = Site Reliability Engineering

Erfindet von Google 2003 (Ben Treynor Sloss)
"SRE ist was passiert wenn ein Software-Engineer
 Operations-Aufgaben bekommt"

SRE-Kernkonzepte:
  SLI: Service Level Indicator
    Mess-Wert (z.B. Fehlerrate, Latenz)

  SLO: Service Level Objective
    Zielwert fuer SLI (z.B. 99.9% Verfuegbarkeit)

  SLA: Service Level Agreement
    Vertragliche Verpflichtung (< SLO!)

  Error Budget:
    100% - SLO = erlaubte Downtime
    99.9% SLO = 8.7h/Jahr Error Budget

Error Budget Praxis

Error Budget Management:

Alle Downtime-Minuten "kosten" Error-Budget.
Wenn Budget aufgebraucht:
  → Keine neuen Features!
  → Nur Stabilitaets-Arbeit bis Budget wieder voll.

Beispiel:
  SLO: 99.9% Verfuegbarkeit/Monat
  Budget: 0.1% von 30 Tagen = 43.2 Minuten

  Incidents diesen Monat:
    Datenbankausfall: 15 Min
    Deployment-Fehler: 10 Min
    Netzwerkproblem: 5 Min
  Verbrauchtes Budget: 30 Min
  Restliches Budget: 13.2 Min

  → Noch 13 Minuten fuer riskante Deployments!

Toil-Reduktion

Toil = Manuelle, repetitive Arbeit ohne dauerhaften Wert

Typischer Toil:
  - Manuell Logs analysieren
  - Manuell Tickets bearbeiten (Passwort reset)
  - Manuell Kapazitaet erhoehen

SRE-Regel: Max. 50% der Zeit fuer Toil
Rest: Automation, Verbesserungen, Projekte

Toil-Messung:
  Zeit pro Woche fuer Toil tracken
  Oberhalb 50%: SRE braucht Unterstuetzung oder mehr Automation

Toil-Automation-ROI:
  Toil: 4h/Woche
  Automation-Aufwand: 40h
  Break-Even: 40h / 4h = 10 Wochen

DevOps vs SRE fuer KMU

KMU 10-50 Mitarbeiter:
  Empfehlung: DevOps-Kultur (keine eigenen SREs)
  Platform-Engineer: Infrastructure + CI/CD

KMU 50-200 Mitarbeiter:
  1 DevOps/Platform-Engineer
  SRE-Prinzipien (SLOs, Error Budgets) optional

KMU 200+ Mitarbeiter / mehrere Produkte:
  Sinnvoll: SRE-Team oder SRE-Praktiken einfuehren
  SLOs definieren, Toil-Tracking

FAQ

Braucht jedes Unternehmen einen SRE?
Nein. SRE ist fuer Unternehmen die Ziel-Verfuegbarkeit (z.B. 99.99%) sehr ernst nehmen und dies systematisch messen. KMU profitieren von DevOps-Kultur und einzelnen SRE-Prinzipien.

Fazit

DevOps ist die Kultur, SRE die strukturierte Methode. Fuer KMU: DevOps-Kultur sofort, SRE-Prinzipien (SLOs, Error Budget, Toil-Automation) schrittweise einfuehren.

DevOps-Beratung fuer KMU in Heidelberg, Mannheim und der Rhein-Neckar-Region. Beratung anfragen.

Artikel teilen

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Inhalte zu erstellen.

Kommentar hinterlassen

Verwandte Artikel