Praxis für Führungskräfte

10 Tipps, wie Sie IT-Probleme lösen

01.11.2010 von Thomas Pelkmann und John D.  Halamka
Deadlines einhalten, Abläufe erklären, mit Anwendern reden: Bei Störungen darf keine Panik ausbrechen. Ein IT-Chef verrät, wie er mit Ausfällen umgeht.

John D. Halamka, CIO bei der CareGroup Healthcare System, hat Erfahrungen mit IT-Ausfällen. In einem Beitrag für Computerworld.com schreibt Halamka darüber, wie man am besten mit solchen Problemen umgeht. Wir haben seine zehn Ratschläge für unsere Leser übersetzt:

1. Sobald ein Problem identifiziert ist, versuchen Sie es einzugrenzen. Fragen Sie dafür die Anwender nach ihren Problemen. Verlassen Sie sich nicht auf Monitoring-Tools, die Ihnen mitteilen, es sei alles in bester Ordnung. Testen Sie Applikationen und Infrastrukturen lieber selber. Es hat ja einen Grund, wenn Mitarbeiter den Ausfall von Systemen beklagen.

2. Wenn sich ein Ausfall mit großen Auswirkungen andeutet, ohne dass Sie die Ursache schon kennen, läuten Sie die Alarmglocken. Denn wer zu spät einschreitet, riskiert aufgrund zögerlicher Reaktionen längere Ausfallzeiten.

3. Machen Sie die Prozesse und Abläufe bei der Fehlersuche transparent. Sorgen Sie durch stündliche Updates, häufige Meetings und das Prinzip, nach dem viele Augen mehr sehen als eins, für den Überblick aller. So verhindern Sie Betriebsblindheit und Fokussierungen auf unwichtige Teilaspekte.

4. Trotz der regelmäßigen Reports und Meetings: Sorgen Sie dafür, dass Ihre Mitarbeiter noch zum Arbeiten kommen. Wenn 90 Prozent der Problemlösungsarbeit darin besteht, Management, Mitarbeiter der Fachabteilungen und sich selbst über den Fortgang der Dinge zu informieren, bleibt keine Zeit mehr für die eigentliche Arbeit.

5. Verfahren Sie nach dem Prinzip Ockhams Rasiermesser, nach dem von mehreren Theorien über denselben Gegenstand die einfachste vorzuziehen ist. Das gilt auch für IT-Probleme: Die einfachste Erklärung ist in aller Regel die richtige.

Firewall-Panne: Zuerst nach simplen Fehlern suchen

Bei einem unserer Störfälle deutete alles auf eine nicht funktionierende Firewall-Komponente hin. Die Tests und Diagnosen unseres Dienstleisters ergaben aber, dass die Firewall tadellos funktionierte. So gab es Raum für Vermutungen über einen groß angelegten DoS-Angriff auf das Netzwerk oder über Probleme mit dem Server-Betriebssystem.

Statt diesen Theorien zu folgen, haben wir die einfachste Erklärung getestet und die Firewall kurzzeitig vom Netz genommen. Das führte uns schnell zur naheliegendsten Lösung. Grundsätzlich gilt: Komplexe Probleme lassen sich in der Regel auf einen einzigen einfachen Fehler zurück führen.

6. Es ist wichtig, Deadlines in der Problembewältigung zu setzen. Damit verhindern Sie Aussagen wie "in einer Stunde läuft alles wieder". Ist ein Problem auf einen planmäßigen Umbau in der Infrastruktur zurückzuführen, setzen Sie sich ebenfalls eine Deadline für das Zurücksetzen des Systems - und: Halten Sie sich an den Termin.

Ich vergleiche das gerne mit einer meiner vielen Bergwanderungen, bei denen ich mir eine feste Zeit für die Rückkehr setze. Das Erreichen des Gipfelkreuzes wäre toll, aber die Rückkehr zum Auto ist ein unbedingtes Muss. Setzen Sie Meilensteine bei Änderungsprozessen und halten Sie sich daran, egal, ob Ihr Gefühl Ihnen etwas anderes sagt.

Bei IT-Ausfällen: Anwendern nicht die Gründe verschweigen

7. Kommunizieren Sie mit den Anwendern in Ihrem Unternehmen. Hier gibt es nur "zu wenig", nicht aber "zu viel". Viele Betroffene akzeptieren Ausfallzeiten, wenn Sie ihnen die Gründe dafür erklären und sie darüber informieren, in welchen Schritten Sie das Problem abarbeiten.

8. Legen Sie keinen falschen Stolz an den Tag. Es ist schwer, Fehler einzugestehen und einzuräumen, dass man auch mal etwas nicht weiß. Andererseits: Während der Fehlerbehebung sind Schuldzuweisungen und Tadel tabu. Wenn ein Problem behoben ist, ist noch genug Zeit für Manöverkritik, um Ausfälle für die Zukunft zu vermeiden. Konzentrieren Sie sich darauf, die Anwender an die Arbeit zurück zu bringen, anstatt Ihr Ego zu pflegen.

9. Verkünden Sie keine vorzeitigen Siege. Es ist verlockend, ein Problem als gelöst anzusehen und den Anwendern von diesem Erfolg zu berichten. Ich empfehle Ihnen mindestens 24 Stunden ununterbrochenen Service unter Volllast, bevor Sie Vollzug melden.

10. Insgesamt sollten sich IT-Verantwortliche auf ihre regelmäßigen Abläufe und Prozesse konzentrieren, nicht auf tägliche Ereignisse. Ausfälle bringen viel Ärger und Aufregung bei Kollegen, Mitarbeitern und Vorgesetzten mit sich. Aber das vergeht auch wieder. Wenn Sie sich langfristig und kontinuierlich um die Verbesserung der Service-Qualität bemühen, anstatt bei kurzfristigen Ausfällen wie paralysiert zu verharren, werden Sie, strategisch gesehen, den größeren Erfolg haben.

Ausfälle sind immer schmerzhaft, aber sie können auch Leute zusammenbringen, vertrauensbildend wirken, die Kommunikation fördern und die Prozesse verbessern. Das beste Ergebnis eines unserer jüngsten Ausfälle war ein Plan, wie wir mit solchen Ereignissen künftig besser umgehen werden. Dazu kam eine verbesserte Infrastruktur und bei meinen Mitarbeitern ein breiteres Verständnis für die Netzwerk-Architektur. Das nenne ich ein exzellentes Resultat mit Langzeitwirkung.