Mein Herz schlägt für die IT. In mir steckt ein Entwickler. Ich liebe es, Kundenprobleme mit Software zu lösen, Programme zu schreiben und auszuprobieren, ob sie funktionieren. Ich genieße es neue Software zu suchen und auszuprobieren. Mir macht es Spass, einen Lieferantenpitch und Business Cases für neue Unternehmenssoftware vorzubereiten.
Aber was sehe ich, wenn ich in verschiedene IT-Abteilungen von Unternehmen blicke: Sparen an allen Ecken und Enden. Viele Leute haben das Unternehmen verlassen. Die übrigen sind damit beschäftigt, die Systeme am Laufen zu halten. An neue Systeme oder neue Projekte ist gar nicht zu denken. Keine Zeit, kein Geld, kein Managementinteresse. Gibt es denn nichts, was etwas Linderung verschafft? Doch, und zwar von jemandem der gar dachte, dass sein Tool dafür zum Einsatz kommt.
Wenn wir an Prozessverbesserungen in der IT (oder allgemein im Dienstleistungsbereich) denken, fallen uns Stichworte wie ITIL oder CMMI ein. Bei den meisten lösen diese Worte eher schlechte Gefühle aus: zu aufwändig, zu teuer, zu bürokratisch, nur für Großunternehmen, lange Projekte ohne Mehrwert usw.
Die Idee, Abläufe in der IT zu klären, um mehr Zeit für die wichtigen Dinge zu bekommen, finde ich ja richtig. Aber ich suche nach Wegen, die sich praktisch selbst finanzieren. Bei ITIL und CMMI sieht es immer so aus, als bräuchte man erstmal ein paar hundert Personentage, bis wir die Erleichterung merken.
Nicht so bei Visible Ops /1/. Irgendwie bin ich vor ein paar Jahren auf dieses Buch von Gene Kim, George Spafford und Kevin Behr gestoßen. Die Autoren haben ein paar Jahre lange verschiedene IT-Abteilungen beobachtet.
Und nun kommt das Interessante: Gene Kim bemerkte, dass sehr gut organisierte IT-Abteilungen Tripwire dazu benutzen, um ihr Change Management abzusichern. Schadcode war nur eins von vielen Problemen. Viel häufiger war aber der Fall, dass es Systemausfälle auf Grund von technischen Änderungen gab. Das war sogar sehr häufig: Bei vier von fünf Sstemausfällen war die Ursache eine technische Änderung. Gut, dass man sich mit Tripwire nun ansehen konnte, was sich konkret geändert hatte und welche Daten man wiederherstellen muss.
Als diese IT-Abteilungen das herausgefunden hatten, war klar, was die beste Reaktion auf Systemausfälle ist: Nicht lange analysieren, sondern erst den letzten Change zurücknehmen. Das System läuft vorerst wieder und die IT hat Zeit, sich den Fehler genauer anzusehen.
Damit haben die IT-Abteilungen Zeit gewonnen und Stress reduziert. Diese Zeit haben sie in das Automatisieren gesteckt. Sie haben mit den Werkzeugen, die sie hatten, Skripte erstellt, die Changes automatisch verteilen aber auch wieder schnell zurücknehmen. Das hatte einen weiteren Vorteil: Die Spezialisten, die ja selten Zeit haben, brauchen sich nicht mehr um Standardänderungen zu kümmern. Sie nehmen sich nun die wirklich schwierigen Fälle vor.
Es gab noch eine weitere Verbesserung: Das Team hatte nun Zeit, über anstehende Änderungen zu sprechen. Change Management bedeutet nicht, jeden Change abzublocken. Sondern es geht darum, gemeinsam zu überlegen, ob an alles gedacht wurde, was schief gehen kann, damit man besser vorbereitet ist. Standardchanges wurden automatisch freigegeben. Wieder Zeit gewonnen.
Was würde ich mit der gesparten Zeit machen? Hier sind meine Ideen:
Update vom 21.02.2014: Eine kurze Zusammenfassung der wichtigsten Schritte bei Visible Ops gibt auf der Seite von WikiSummaries (siehe http://www.wikisummaries.org/Visible_Ops).
Aber was sehe ich, wenn ich in verschiedene IT-Abteilungen von Unternehmen blicke: Sparen an allen Ecken und Enden. Viele Leute haben das Unternehmen verlassen. Die übrigen sind damit beschäftigt, die Systeme am Laufen zu halten. An neue Systeme oder neue Projekte ist gar nicht zu denken. Keine Zeit, kein Geld, kein Managementinteresse. Gibt es denn nichts, was etwas Linderung verschafft? Doch, und zwar von jemandem der gar dachte, dass sein Tool dafür zum Einsatz kommt.
Wenn wir an Prozessverbesserungen in der IT (oder allgemein im Dienstleistungsbereich) denken, fallen uns Stichworte wie ITIL oder CMMI ein. Bei den meisten lösen diese Worte eher schlechte Gefühle aus: zu aufwändig, zu teuer, zu bürokratisch, nur für Großunternehmen, lange Projekte ohne Mehrwert usw.
Die Idee, Abläufe in der IT zu klären, um mehr Zeit für die wichtigen Dinge zu bekommen, finde ich ja richtig. Aber ich suche nach Wegen, die sich praktisch selbst finanzieren. Bei ITIL und CMMI sieht es immer so aus, als bräuchte man erstmal ein paar hundert Personentage, bis wir die Erleichterung merken.
Nicht so bei Visible Ops /1/. Irgendwie bin ich vor ein paar Jahren auf dieses Buch von Gene Kim, George Spafford und Kevin Behr gestoßen. Die Autoren haben ein paar Jahre lange verschiedene IT-Abteilungen beobachtet.
Wie ein Internetwurm das Change Management verbesserte
Das war vor allem für Gene Kim interessant. Ein Paper von Dr. Spafford über Internet-Würmer /2/ veranlasste ihn, zur Purdue University zu gehen und dort Sicherheitssoftware zu entwickeln /3/. Dabei entstand Tripwire, eine Software, die Änderungen am Dateisystem überwacht. So etwas ist nützlich, wenn man Veränderungen durch Viren und anderen Schadcode befürchtet.Und nun kommt das Interessante: Gene Kim bemerkte, dass sehr gut organisierte IT-Abteilungen Tripwire dazu benutzen, um ihr Change Management abzusichern. Schadcode war nur eins von vielen Problemen. Viel häufiger war aber der Fall, dass es Systemausfälle auf Grund von technischen Änderungen gab. Das war sogar sehr häufig: Bei vier von fünf Sstemausfällen war die Ursache eine technische Änderung. Gut, dass man sich mit Tripwire nun ansehen konnte, was sich konkret geändert hatte und welche Daten man wiederherstellen muss.
Als diese IT-Abteilungen das herausgefunden hatten, war klar, was die beste Reaktion auf Systemausfälle ist: Nicht lange analysieren, sondern erst den letzten Change zurücknehmen. Das System läuft vorerst wieder und die IT hat Zeit, sich den Fehler genauer anzusehen.
Damit haben die IT-Abteilungen Zeit gewonnen und Stress reduziert. Diese Zeit haben sie in das Automatisieren gesteckt. Sie haben mit den Werkzeugen, die sie hatten, Skripte erstellt, die Changes automatisch verteilen aber auch wieder schnell zurücknehmen. Das hatte einen weiteren Vorteil: Die Spezialisten, die ja selten Zeit haben, brauchen sich nicht mehr um Standardänderungen zu kümmern. Sie nehmen sich nun die wirklich schwierigen Fälle vor.
Es gab noch eine weitere Verbesserung: Das Team hatte nun Zeit, über anstehende Änderungen zu sprechen. Change Management bedeutet nicht, jeden Change abzublocken. Sondern es geht darum, gemeinsam zu überlegen, ob an alles gedacht wurde, was schief gehen kann, damit man besser vorbereitet ist. Standardchanges wurden automatisch freigegeben. Wieder Zeit gewonnen.
Lohnt sich VisibleOps?
Das Visible Ops Handbook beschreibt diese Schritte gut und verständlich. Beim Lesen wird sofort klar, dass ein Umsetzungsschritt den nächsten zeitlich finanziert ("self-fueling steps"). Aber wie groß ist die Ersparnis? Gene hat auf der Velocity-Konferenz im Juni 2011 die Unterschiede aufgezeigt /4/. Im Vergleich zum normalen (chaotischen) Vorgehen können IT-Abteilungen mit Visible Ops mehr erreichen:- 6mal mehr Systeme betreuen
- 8fache Anzahl an Projekten und IT-Services
- der Anteil der ungeplanten Arbeitszeit geht von 35-40 % auf unter 10 % zurück
- 10mal kürzere Reparaturzeit bei kritischen Systemausfällen
Was würde ich mit der gesparten Zeit machen? Hier sind meine Ideen:
- Mehr Zeit beim Kunden verbringen, um die Probleme besser zu verstehen, die ich mit Software lösen kann.
- Meine teuren Systeme ansehen und prüfen, ob ich sie durch billigere ersetzen kann
- Mit anderen IT-Abteilungen aus der Branche treffen/vernetzen
- Zu normalen Zeiten nach Hause gehen :-)
Update vom 21.02.2014: Eine kurze Zusammenfassung der wichtigsten Schritte bei Visible Ops gibt auf der Seite von WikiSummaries (siehe http://www.wikisummaries.org/Visible_Ops).
Anmerkungen
- /1/ Kim, Gene ; Spafford, George ; Behr, Kevin: The Visible Ops Handbook : Implementing ITIL in 4 Practical and Auditable Steps. Revised First Edition. Eugene, Oregon: Information Technology Process Institute, 2005, bestellbar unter http://www.itpi.org/the-visible-ops-handbook-review.html
- /2/ Spafford, Eugene H. "The Internet worm program: An analysis." ACM SIGCOMM Computer Communication Review 19.1 (1989): 17-57, abrufbar unter http://spaf.cerias.purdue.edu/tech-reps/823.pdf
- /3/ Anthony M. Freed: Morris Worm’s 25th Anniversary: What Have We Learned? Nothing ..., erschienen im Firmenblog "State of Security" von Tripwire Inc., am 01.11.2013, abrufbar unter http://www.tripwire.com/state-of-security/top-security-stories/morris-worms-25th-anniversary-learned/
- /4/ Gene Kim: Creating the Dev/Test/PM/Ops Supertribe: From "Visible Ops" To DevOps, Vortrag auf der Velocity 2011 Konferenz, gehalten am 15.06.2011, Vortragsfolien abrufbar unter http://velocityconf.com/velocity2011/public/schedule/detail/21123
Kommentare
Kommentar veröffentlichen