Skalierung von SRE-Prozessen: Unternehmen investieren mehr in die Standortzuverlässigkeit

München, Starnberg, 22. März 2022 - SREs benötigen eine einheitliche Plattform, die Zuverlässigkeit, Sicherheit und Automatisierung ermöglicht; neuer Dynatrace-Report...

Zum Beitrag: Dynatrace hat die neue Studie „State of SRE Report“ veröffentlicht. (1) Sie basiert auf einer Umfrage unter 450 Site Reliability Engineers (SREs). Demnach spielen diese Experten eine immer strategischere Rolle. Unternehmen müssen zunehmend sicherstellen, dass ihre Teams über die Informationen und intelligente Automatisierung verfügen, die zur Beschleunigung der digitalen Transformation nötig sind. Das Wachstum neuer Technologien, die in der Cloud-nativen Entwicklung eingesetzt werden, hat jedoch zu einer Explosion der Komplexität geführt, die diese Bemühungen erschwert. Die Studie zeigt:

  • 88 Prozent der SREs glauben, dass heute mehr Verständnis für die strategische Bedeutung ihrer Rolle besteht als vor drei Jahren.

  • SREs verwenden derzeit den größten Teil ihrer Zeit darauf, die MTTR (mittlere Wiederherstellungszeit) zu reduzieren (67%), Automatisierungscode zu erstellen und zu pflegen (60%) und sicherzustellen, dass Schwachstellen schnell erkannt und beseitigt werden (58%).

  • 68 Prozent der SREs gehen davon aus, dass ihre Rolle im Bereich Sicherheit in Zukunft zentraler wird, da Unternehmen weiterhin Bibliotheken von Drittanbietern wie Log4j für die Entwicklung Cloud-nativer Anwendungen einsetzen.

  • 99 Prozent der SREs stoßen bei der Definition und Erstellung von SLOs zur Bewertung von Service Levels für Anwendungen und Infrastruktur auf Herausforderungen. Die häufigsten sind:

  • Zu viele Datenquellen (64%)

  • Schwierigkeiten, die wichtigsten Metriken für einen Service zu finden (54%)

  • Die Unfähigkeit der Überwachungstools, die SLO-Leistung einfach zu definieren und zu verfolgen (36%)

  • 68 Prozent der SREs geben an, dass isolierte Teams und mehrere Tools es erschweren, sich auf eine Version der „Wahrheit“ über die Service Levels zu einigen.


Abb.: SLI-based Performance Dashboard with insights into each Test Step as well as visibility into process and infrastructure metrics (Bildquelle: Dynatrace Tutorial- Guide to automated SRE-driven performance engineering).

Anmerkung: Ein SLI (Service Level Indicator) misst die Compliance mit einem SLO- (Service Level Objective) Wert. Um Compliance mit einem jeweiligen SLA zu erreichen, muss der SLI die definieerten Bedingungen im SLA erfüllen oder übertreffen.

Link > https://sre.google/sre-book/service-level-objectives/

Kommentarauszug Bernd Greifeneder, Gründer und Chief Technology Officer bei Dynatrace: „Zuverlässigkeit, Erfahrung und Sicherheit sind zu kritischen Erfolgsfaktoren in einer Welt geworden, in der jede Sekunde Ausfallzeit zu Umsatzeinbußen, sinkenden Aktienkursen und dauerhafter Rufschädigung führt. Deshalb ist SRE von zentraler Bedeutung, um die digitale Transformation schneller voranzutreiben. Die meisten Unternehmen stehen jedoch bei der Einführung von SRE-Prozessen am Anfang...“


Weitere Ergebnisse der Studie betreffen:

  • 85 Prozent der Unternehmen berichten, dass ihre Fähigkeit zur Skalierung der SRE-Prozesse von Automatisierungs- und KI-Funktionen abhängt.

  • 71 Prozent der Unternehmen setzen verstärkt auf Automatisierung in allen Bereichen des Lebenszyklus, um den Arbeitsaufwand für Entwickler und SREs zu reduzieren.

  • Unternehmen nutzen die Automatisierung im SRE-Bereich vor allem zur Behebung von Sicherheitslücken (61%) und Anwendungsfehlern (57%), zur Beschleunigung der Bereitstellung (56%) und zur Vorhersage von SLO-Verstößen (55%).

  • SREs sagen, dass Teams durch AIOps mehr Prozesse automatisieren können, um besser Service-Levels kontinuierlich einzuhalten (64%), Probleme mit den größten Auswirkungen auf die Anwenderzufriedenheit zu priorisieren (63%) und Schwachstellen zur Minimierung von Ausfallzeiten zu priorisieren (62%).

  • Bis 2025 wollen 85 Prozent der SREs Entwicklung, Betrieb und Sicherheit auf der gleichen Observability-Plattform standardisieren.

Self-Service Observability und Monitoring-as-Code-Funktionen sind laut Dynatrace der Schlüssel, damit Entwicklungsteams mit nur wenigen Klicks Feedbackschleifen in ihre Anwendungen einbauen können. Auf diese Weise übernehmen SREs die Führung, um über die grundlegende Automatisierung hinauszugehen und eine intelligente Orchestrierung von Nutzungsmöglichkeiten und Geschäftsergebnissen zu erreichen. Dadurch können Unternehmen die digitale Transformation schneller vorantreiben, und zwar durch sich selbst reparierende Cloud-Anwendungen, die schnell mit den Geschäftsanforderungen skalieren.

(1) Quelle: Die Studie basiert auf einer weltweiten Umfrage unter 450 SREs aus großen Unternehmen mit mehr als 1.000 Mitarbeitenden, davon 150 aus EMEA, 150 aus den USA und 150 aus dem asiatisch-pazifischen Raum. Sie wurde von Coleman Parkes durchgeführt und von Dynatrace in Auftrag gegeben.


Querverweis: