Die DORA-Metriken zur Beurteilung von Softwareteams


prozesse produktivität metriken
Start Blog Die DORA-Metriken zur Beurteilung von Softwareteams

Technologieorientierte Teams brauchen einen Weg, ihre Leistung zu messen. Welche Metriken helfen bei der Bewertung des aktuellen Status und von Veränderungen?

DORA bietet hierfür einen evidenzbasierten Rahmen, der auf jahrelanger Forschung beruht. Der Verlauf dieser Untersuchungen hat vier Metriken – Change Lead Time, Deployment Frequency, Change Fail Rate und Failed Deployment Recovery Time – wiederholt validiert, die eine effektive Methode zur Messung der Ergebnisse des Softwarebereitstellungsprozesses darstellen.

DORA hat darüber hinaus zum Ziel, die Fähigkeiten zu verstehen, die die Leistung von Teams in Hinsicht auf Softwarelieferung und -betrieb bestimmen. DORA hilft Teams zudem dabei, diese Fähigkeiten anzuwenden, was letztlich zu einer besseren Unternehmensleistung führt.

Die Geschichte hinter DORA

DORA steht für „DevOps Research and Assessment“ und begann als ein Forschungsprojekt unter der Leitung von Dr. Nicole Forsgren, Gene Kim, Nigel Kersten und Jez Humble. Was mit dem „2014 State of DevOps Report“ begann, entwickelte sich zu einer der umfassendsten und einflussreichsten Untersuchungen im Bereich der Softwareentwicklung.

Das DORA-Team startete mit einer grundlegenden Frage: Was unterscheidet erfolgreiche Softwareorganisationen von weniger erfolgreichen? Im Gegensatz zu vielen anderen Studien, die sich auf Meinungen oder populäre Praktiken konzentrierten, nahm DORA einen streng wissenschaftlichen Ansatz ein. Das Forschungsteam sammelte über die Zeit Daten von 39.000 Fachleuten aus verschiedenen Branchen und von Unternehmen unterschiedlicher Größe.

Ende 2018 wurde DORA von Google übernommen, was die Forschung weiter verstärkte und die Ergebnisse einer noch breiteren Öffentlichkeit zugänglich machte. Seitdem hat Google die jährlichen „State of DevOps Reports“ fortgeführt und die Erkenntnisse kontinuierlich erweitert.

Der aktuelle „Accelerate State of DevOps 2024“ beispielsweise untersucht die Auswirkungen auf bzw. von Burnout, Flow, Zufriedenheit im Beruf, Produktivität sowie der Leistung von Organisation, Produkt und Team.

Die vier DORA-Metriken im Detail

Das DORA-Team identifizierte vier Schlüsselmetriken, die stark mit der Leistungsfähigkeit von Softwareentwicklungsteams korrelieren. Diese Metriken bieten eine ausgewogene Sicht auf Durchsatz und Stabilität – zwei Faktoren, die oft als Gegensätze betrachtet werden und bei Hochleistungsteams Hand in Hand gehen.

Change Lead Time – Vorlaufzeit für Änderungen

Definition: Wie lange dauert es, einen Code-Commit oder eine Änderung bis zur erfolgreichen Bereitstellung in der Produktionsumgebung zu bringen?

Messung: Zeit vom ersten Commit bis zur erfolgreichen Bereitstellung in Produktion.

Bedeutung: Diese Metrik zeigt, wie schnell ein Team auf Geschäftsanforderungen oder Kundenfeedback reagieren kann. Sie ist ein direkter Indikator für die Effizienz des Entwicklungs- und Bereitstellungsprozesses.

Leistungsstufen auf Basis des Reports 2024:

  • Elite: Weniger als ein Tag
  • Hoch: Zwischen einem Tag und einer Woche
  • Mittel: Zwischen einer Woche und einem Monat
  • Niedrig: Zwischen einem und sechs Monaten

Deployment Frequency – Bereitstellungshäufigkeit

Definition: Wie oft stellt ein Team Änderungen in der Produktionsumgebung bereit?

Messung: Anzahl der Deployments pro Zeiteinheit (z. B. pro Tag, Woche oder Monat).

Bedeutung: Diese Metrik zeigt, wie schnell ein Team Änderungen umsetzen kann und ist ein Indikator für die Flexibilität des Entwicklungsprozesses. Eine höhere Frequenz deutet auf kleinere Änderungen hin, die leichter zu testen und bei Problemen rückgängig zu machen sind.

Leistungsstufen auf Basis des Reports 2024:

  • Elite: Nach Bedarf, mehrmals täglich
  • Hoch: Zwischen einmal täglich und einmal wöchentlich
  • Mittel: Zwischen einmal wöchentlich und einmal pro Monat
  • Niedrig: Zwischen einmal monatlich und einmal alle sechs Monate

Change Fail Rate – Änderungsfehlerrate

Definition: Welcher Prozentanteil der Bereitstellungen auf der Produktionsumgebung führt zu Fehlern oder Ausfällen, die einen Hotfix oder ein Rollback erfordern?

Messung: Anzahl der fehlgeschlagenen Änderungen, geteilt durch die Gesamtzahl der Änderungen.

Bedeutung: Diese Metrik reflektiert die Qualität des Codes und die Wirksamkeit der Testprozesse. Eine niedrige Fehlerrate bedeutet, dass Teams mit Vertrauen liefern können, ohne nachträgliche Probleme befürchten zu müssen.

Leistungsstufen auf Basis des Reports 2024:

  • Elite: 5 %
  • Hoch: 20 %
  • Mittel: 10 %
  • Niedrig: 40 %

Failed Deployment Recovery Time – Zeit bis zur Wiederherstellung des Dienstes

Definition: Wie lange benötigt ein Team für die Wiederherstellung nach einem fehlgeschlagenen Deployment?

Messung: Zeit vom Auftreten einer Störung bis zur vollständigen Wiederherstellung des Dienstes.

Bedeutung: Diese Metrik zeigt die Widerstandsfähigkeit eines Teams und seine Fähigkeit, auf Probleme zu reagieren. Sie ist entscheidend für die Begrenzung der Auswirkungen von Ausfällen auf Kunden und das Geschäft.

Leistungsstufen auf Basis des Reports 2024:

  • Elite: Weniger als eine Stunde
  • Hoch: Weniger als ein Tag
  • Mittel: Weniger als ein Tag
  • Niedrig: Zwischen einer Woche und einem Monat

Über die Metriken hinaus: Weitere Erkenntnisse aus der DORA-Forschung

Die DORA-Forschung geht weit über die vier Kernmetriken hinaus und bietet tiefe Einblicke in eine Vielzahl von Faktoren, die zu erfolgreicher Softwareentwicklung beitragen.

Die vier DORA-Leistungsstufen

Die DORA-Analysen zeigen, dass jedes Team in jeder Branche in der Lage ist, ein hohes Maß an Leistung bei der Softwarebereitstellung zu erzielen.

Dabei unterteilen die Forschenden die Teams in solche mit hoher, mittlerer und geringer Leistung und stellen fest, dass es sie in allen Unternehmenstypen und Branchen gibt.

Wichtig zu verstehen ist, dass diese Werte nicht im Voraus festgelegt werden, sondern aus den Antworten auf die Umfrage zur Erhebung der DORA-Daten hervorgehen. Somit ergibt sich jedes Jahr eine Momentaufnahme der Leistung bei der Softwarebereitstellung zu erhalten.

Die vier Leistungsstufen auf Basis des Reports 2024 sind:

  • Elite: Teams mit außergewöhnlicher Leistung in allen Metriken
  • Hoch: Teams mit überdurchschnittlicher Leistung
  • Mittel: Teams mit durchschnittlicher Leistung
  • Niedrig: Teams mit langsamer Bereitstellung und instabilen Systemen

Diese Unterteilung hilft Organisationen, ihre aktuelle Situation im Vergleich genauer zu bestimmen und gezieltere Verbesserungsstrategien zu entwickeln.

Das DORA-Fähigkeitsmodell

Die DORA-Wissenschaftler haben 29 Fähigkeiten identifiziert, die zu einer verbesserten Softwarebereitstellung führen. Diese sind in drei Kategorien eingeteilt:

  1. Lernumfeld: Wartbarkeit von Code, Qualität der Dokumentation, Befähigung von Teams zur Tool-Auswahl, generative Organisationskultur, Berufszufriedenheit, Lernkultur, Team-Experimente, transformationale Führung und Wohlbefinden
  2. Effiziente Prozesse: Continuous Delivery, Verwaltung von Datenbankänderungen, Automation beim Deployment, flexible Infrastruktur, lose gekoppelte Teams, Vereinfachung bei Änderungsgenehmigungen, Trunk-Based-Development, Versionskontrolle, Visual Management, Work-in-Progress-Limits und Arbeiten in kleinen Chargen
  3. Schnelles Feedback: Continuous Integration, Kundenfeedback, Monitoring, Monitoring-Systeme zur Unterstützung von Geschäftsentscheidungen, umfassende Security, proaktive Benachrichtigungen bei Fehlern, Testautomation, Testdatenmanagement und Sichtbarkeit von Arbeit im Wertstrom

Der Capability Catalog stellt für alle diese Kategorien und Fähigkeiten Material zur Verfügung, um die Softwarebereitstellung zu beschleunigen und die Gesamtleistung des Unternehmens zu verbessern.

Herangehensweise und Fallstricke bei der Implementierung der DORA-Metriken

Grundsätzlich beginnt der Weg zur Verbesserung mit einem kundenorientierten Ziel und einer Basismessung. Im Folgenden praktische Schritte, um die vier Metriken im Unternehmen einzuführen und damit Veränderungen zu untersuchen:

  1. Festlegen eines Bereiches oder eines Ergebnisses: Welche primäre Anwendung oder Dienstleistung soll verbessert werden? Und mit welchem Ziel – genauer: welchen konkreten Nutzen hat eine Kundin von diesen Verbesserungen?
  2. Ausgangspunkt oder aktuellen Zustand bestimmen: Beginn ist die Messung der aktuellen Leistung in allen vier Metriken. Diese Null-Messung bildet die Grundlage, um die Auswirkungen von Veränderungen erkennen zu können.
  3. Automatisierte Messungen etablieren: Implementierung von Werkzeugen, die diese Metriken automatisch erfassen und darstellen. Viele moderne DevOps-Plattformen bieten integrierte DORA-Messfunktionen. Im Zweifelsfall tut es auch eine eigene Implementierung oder die Nutzung des hausinternen Business-Intelligence-Tools. Die Entscheidung über das Werkzeug sollte nicht allzu viel Zeit in Anspruch nehmen – schlussendlich ist es nicht das eigentliche Ziel, sondern Mittel zum Zweck.
  4. Hypothese entwickeln: Welche Maßnahmen können das Team dem Wunschzustand näher bringen?
  5. Plan zur Verbesserung: Welchen Weg muss ein Team gehen und zu welchen Maßnahmen verpflichtet es sich? Wie kann das DORA-Fähigkeitsmodell helfen zu verstehen, welche Fähigkeiten entwickelt werden müssen?
  6. Iterativ verbessern: Implementierung der Verbesserungen in kleinen, messbaren Schritten, kontinuierliche Überwachung der Auswirkungen und damit Bewertung der Veränderung. Und dann geht es wieder von vorne los, mit neuen Zielen und neuen Hypothesen.

Während die vier DORA-Metriken ein leistungsstarkes Beobachtungswerkzeug sind, gibt es einige Herausforderungen und Risiken, die bei der Einführung berücksichtigt werden sollten:

  • Metrik-Fixierung: Das bloße Streben nach besseren Zahlen ohne Verständnis der zugrundeliegenden Prinzipien kann zu Optimierungen führen, die nicht den beabsichtigten Wert liefern.
  • Fixierung auf die Leistungsstufen: Die vier Leistungsstufen dienen als Orientierung und als Benchmark. Die Erreichung einer höheren Stufe an sich ist nur dann ein gutes Ziel, wenn das Unternehmen und seine Kunden damit einen messbaren Mehrwert haben.
  • Kontextuelle Unterschiede: Nicht alle Teams operieren unter gleichen Bedingungen. Faktoren wie Branche, Produkttyp und regulatorische Anforderungen können die erreichbaren Ziele beeinflussen.
  • Übergangsperioden: Die Umstellung auf neue Arbeitsweisen kann zunächst zu einer Verschlechterung der Metriken führen, bevor Verbesserungen sichtbar werden.
  • Throughput-Metriken vs. Stability-Metriken: Die vier Metriken beeinflussen sich gegenseitig. Also kann es beispielsweise gut sein, dass die Deployment Frequency steigt und dafür die Change Fail Rate steigt, da die Geschwindigkeit zu Kosten der Qualität erkauft wurde. Es gilt also, ein gutes Gleichgewicht zu finden.
  • Vollständiges Bild: DORA-Metriken allein erfassen nicht alle Aspekte erfolgreicher Softwareentwicklung. Sie sollten durch andere Messgrößen wie z. B. Kundenzufriedenheit, Produktqualität und Mitarbeiterengagement ergänzt werden.

Die erfolgreiche Einführung der DORA-Metriken ist keine einmalige Aktivität, sondern ein kontinuierlicher Lernprozess. Diese Metriken dienen nicht nur als Leistungsindikatoren, sondern als Kompass für Anpassungen. Das Ziel sind nicht perfekte Metriken, sondern Teams, die kontinuierlich besser werden im Liefern von Mehrwert für Kunden und das Unternehmen.

Fazit

Die DORA-Metriken bieten einen wissenschaftlich fundierten Rahmen für die Messung und Verbesserung der Softwareentwicklungsleistung. Sie verbinden technische Praktiken mit messbaren Geschäftsergebnissen und zeigen, dass Geschwindigkeit und Stabilität keine Gegensätze sein müssen.

Für Team- und Abteilungsleiter in Softwareabteilungen sind die DORA-Metriken nicht nur ein Werkzeug zur Leistungsmessung, sondern ein Leitfaden für die kontinuierliche Verbesserung. Die Integration dieser Metriken in Arbeitsabläufe kann den Weg zu höherer Produktivität, besserer Qualität und letztlich zu einem größeren Beitrag zum Unternehmenserfolg ebnen.

Die eigentliche Kraft der DORA-Forschung liegt, neben den Metriken selbst, in der Erkenntnis, dass technische Exzellenz und Geschäftserfolg untrennbar miteinander verbunden sind. Teams, die dieses Verständnis in ihre tägliche Arbeit integrieren, sind am besten positioniert, um heute und in Zukunft erfolgreich in der Softwareentwicklung zu sein.

Schnapp Dir die 7 Fragen für hochproduktive Entwicklungsteams und buche Deine kostenlose Teamanalyse und wir finden gemeinsam heraus, wie ich Dich am wirkungsvollsten unterstützen kann.

Vorheriger Beitrag