Incident Management: Das passiert, wenn unsere Kunden eine Störung melden

Störungen in IT-Systemen sind nicht nur ärgerlich, sondern können teuer werden. Hier braucht es gute Methoden, um dem Problem schnell Herr zu werden. Der Service Desk von SALT Solutions arbeitet mit ausgereiften Prozessen, um Störungen bei Kunden schnell und nachhaltig beheben zu können.

Am Service Desk von SALT Solutions kommen täglich Meldungen von Kunden an, die eine Störung in Ihrem IT-System haben. Diese Unternehmen haben beispielsweise SAP EWM oder SAP ERP im Einsatz und haben sich entschieden, den Support für diese Systeme an SALT Solutions auszulagern.

Wenn es zu einer Systemstörung kommt, muss schnell reagiert werden. In individuellen Vereinbarungen sichert der Service Desk von SALT Solutions den Kunden bestimmte Reaktionszeiten und Lösungszeiten zu. Für die Kunden sind die Zeitfenster essentiell. Je nachdem wie ein Unternehmen aufgebaut ist, kann eine Störung im IT-System sehr schnell ernste Konsequenzen nach sich ziehen: Wenn Waren im Lager nicht mehr bewegt werden können, weil die automatisierte Fördertechnik stillsteht, oder wenn Bestellungen nicht ausgelöst werden, weil in den Warenbeständen ein Fehler ist, ziehen diese Störungen große Kreise, die mitunter geschäftskritische Auswirkungen haben.

Bevor so etwas passieren kann, melden die Systemanwender Störungen an den Service Desk von SALT Solutions. Ab hier ist es Aufgabe der Support Mitarbeiter, möglichst schnell eine möglichst gute Lösung für das Problem zu finden. Wie wir dabei vorgehen, ist fest vorgeschrieben.

Aufnahme der Störung im Ticketsystem

Der Incident kann sowohl telefonisch als auch per Mail an SALT Solutions gemeldet werden. Wenn ein Incident telefonisch gemeldet wird, erfasst ein Support-Mitarbeiter vollständig manuell ein Ticket. Mails werden automatisch als Ticket importiert, allerdings muss auch hier ein Mitarbeiter noch einmal manuell eingreifen, beispielsweise um eine korrekte Priorisierung zu gewährleisten.

Folgende Informationen müssen aufgenommen werden:

  • eine Beschreibung der Fehlersituation
  • relevante Systemreferenzen (z.B. Lieferungsnummer)
  • relevante Ansprechpartner beim Kunden (Melder, weitere) und deren Kontaktdaten
  • eine Priorisierung
  • eine Kategorisierung
  • ggf. Ticketnummern in anderen Ticketsystemen
  • ggf. Pflege weiterer Ticketsysteme des Kunden oder Dritter

Bearbeitung und Lösungssuche

Die Lösungssuche eines Incidents erfolgt in der Regel nach folgendem Muster:

1. Der Mitarbeiter kennt den Fall bzw. die Lösung bereits und weiß direkt was er tun muss.

2. Der Mitarbeiter prüft, ob er in der kundenspezifischen Wissensdatenbank (Known Error Database) etwas zu den Symptomen der Störung oder der konkreten Fehlermeldung findet.

Für jeden Kunden existiert bei SALT Solutions ein Wiki, das alle Informationen zum Kunden enthält. Dazu gehören:

  • Organisatorische Daten wie Kundenvereinbarungen zu Reaktions- Lösungs- und Servicezeiten
  • Anleitungen zum Kundenticketsystem
  • Prozessdokumentation
  • Anstehende Changes und Wartungen des Kundensystems
  • Rezeptartige Beschreibungen von Workarounds zu bekannten Störungen

3. Der Mitarbeiter prüft, ob er im kundenübergreifenden Wiki einen Workaround findet.

4. Der Mitarbeiter prüft, ob er in alten Tickets einen Workaround findet.

5. Der Mitarbeiter versucht selbstständig einen Workaround zu erarbeiten

  • Interpretation der Fehlermeldung
  • Prüfung der Dokumentation zur Fehlermeldung
  • Recherche zur Fehlermeldung (z.B. Google)
  • Vergleich mit anderen funktionierenden Fällen (z.B. Telegrammverkehr einer vergleichbaren Einlagerung, Belegfluss und Parameter einer vergleichbaren Lieferung etc.)
  • Debugging

6. Nächste Eskalationsstufe: Der Mitarbeiter unterrichtet den verantwortlichen Service Desk Expert über das Ticket und eine gemeinsame Lösungssuche wird gestartet.

7. Nächste Eskalationsstufe: Mit Zustimmung des Service Desk Experts wird die Meldung an das Kundenteam kommuniziert und wiederum eine gemeinsame Lösungssuche gestartet oder das Ticket übergeben.

Je früher in diesem Prozess ein Lösungsansatz gefunden wird, der funktioniert, desto früher endet auch der Prozess. Gegebenenfalls kann er bei Folgefehlern oder neuen Erkenntnissen auch wieder von vorne starten.

Ticketabschluss: Der Regelbetrieb ist wiederhergestellt

Der Incident wird abgeschlossen, wenn der Anwender die Entstörung bestätigt. Das heißt, dass der Regelbetrieb des Kunden wiederaufgenommen werden kann.

In Einzelfällen ist zu diesem Zeitpunkt die Ursache der Störung noch nicht behoben oder sogar unbekannt. Dies hat aber keine Auswirkung auf den Abschluss des Incident-Tickets, denn dieses hat zum Ziel, den Regelbetrieb beim Kunden wiederherzustellen. Bei Bedarf wird aber ein Problem-Ticket für die Ursachenfindung – Root Cause Analysis (RCA) – und deren Behebung eröffnet. Dies richtet sich nach den Vereinbarungen mit dem Kunden und der Rücksprache mit dem Melder.

Beim Incident-Abschluss ist es wichtig, alles zu dokumentieren, was möglicherweise in Zukunft hilfreich sein kann. Es erfolgt eine entsprechende Verschlagwortung des Incidents. Existiert für die Ursache oder den verwendeten Workaround ein Problem-Ticket wird dies am Incident referenziert. Diese Maßnahmen ermöglichen Statistiken zu den aufgetretenen Störungen und bieten Chancen zur Identifikation von Verbesserungspotentialen. Existiert für den verwendeten Workaround keine Beschreibung im Wiki, oder ist die bestehende Beschreibung durch den neuen Fall noch zu ergänzen, so wird zudem das Wiki aktualisiert, um zukünftige Störungen schneller beheben zu können.

Die feste Systematik, nach der wir Incidents bearbeiten, ist wichtig, damit wir möglichst effizient arbeiten können. Durch die verschiedenen Eskalationsstufen werden zum richtigen Zeitpunkt die Mitarbeiter zur Lösungssuche hinzugenommen, die an dieser Stelle die meiste Kompetenz haben. Die meisten Störungen werden allerdings behoben, ohne, dass Mitarbeiter außerhalb des Service Desks involviert werden müssen. Durch unsere langjährige Erfahrung mit den Systemen und den Prozessen bei vielfältigen Kunden, verfügen unsere Mitarbeiter über so viel Expertise, dass wir den Großteil der Störungen schnell und eigenständig lösen können.

Für unsere Mitarbeiter am SD und vor allem in der Rufbereitschaft ist es immer wieder ein Ansporn, sich die Anwender in den Lägern dieser Welt in Erinnerung zu rufen, denen man an diesem Tag geholfen hat.

Nicht nur Incident Management: Support über Störungen hinaus

Über konkrete Störungen in IT-Systemen hinaus, bietet SALT Solutions auch die Funktion des Single Point of Contact (SPoC) an. Hierbei können Kunden sämtliche Störungen, zum Beispiel auch Hardwarethemen beim Service Desk von SALT Solutions melden. Der Service Desk gibt solche Meldungen weiter, denn solche Probleme werden hier nicht gelöst. Für den Kunden hat dies aber den großen Vorteil, dass er nur eine Kontaktperson hat.

Darüber hinaus laufen beim Service Desk auch Meldungen auf, die keine Incidents, also Störungen, betreffen und durch ein Kundenteam bearbeitet werden. Dabei handelt es sich um Problems (Ursachenforschung und nachhaltige Vermeidung von Incidents) oder Requests for Changes (RfCs – Änderungswünsche am bestehenden System / Prozess). So wird sichergestellt, dass Störungen nicht wiederholt auftreten, oder die Systeme immer den Wünschen der Kunden entsprechen.

© puhhha - stock.adobe.com

Zurück