Die Daten Hacker

Process Mining ist der große Trend in der Datenanalytik: Die smarte Visualisierung der Unternehmensprozesse soll zeigen, wo es hakt und welche Abläufe sich wie verbessern lassen.

In jedem Unternehmen laufen täglich verschiedene Prozesse ab: Eine Lieferung geht ein, eine Bestellung geht raus. Mitarbeiter machen Angebote und begleichen Rechnungen. Damit alle diese Prozesse glatt über die Bühne gehen, haben viele Unternehmen feste Abläufe entwickelt. So muss eine Rechnung zum Beispiel geprüft und frei geschalten sein, ehe die Buchhaltung deren Betrag überweisen darf. Doch je mehr solcher Prozesse es gibt, desto mehr Fehler können sich einschleichen – und diese zu finden, ist oft reinste Detektivarbeit.

Rudolf Kuhn ist Prozessberater bei der Firma ProcessGold in Schwalbach und hat bereits viele Workshops gemacht, um Prozessabläufe auf Herz und Nieren zu prüfen. „Jeder Mitarbeiter weiß genau, wie ein Prozess ablaufen soll. Es gibt aber stets eine immense Lücke zwischen dem, was die Leute glauben, wie Prozesse abzulaufen haben – und wie sie tatsächlich ablaufen“, sagt er. Nach seinen Workshops setzt Kuhn alles, was ihm die Mitarbeiter erzählt haben, wie ein Puzzle zusammen. Dabei muss er oft intuitiv entscheiden, an welchen Stellen Prozesse womöglich aus dem Ruder laufen – zum Beispiel wo die Mitarbeiter Rechnungen bezahlen, obwohl die Freigabe fehlt. Die Spurensuche ist nicht einfach: In manchen Unternehmen laufen in einem Monat mehrere Millionen solcher Prozesse ab.

Was die Berater und Unternehmen brauchen, ist eine nüchterne Maschine, die in den Prozess-Massen akribisch auf Fehlersuche geht – und zwar Daten-getrieben und weit weg von subjektiven Beteiligten-Interviews und Dokumentationen. Genau das verspricht das so genannte Process Mining. Die Idee hinter dem Begriff ist simpel: Jeden Tag produzieren Unternehmen Daten. Jeder Prozess hinterlässt digitale Spuren, sei es in der Beschaffung, im Einkauf, in der Buchhaltung oder Logistik sowie bei allem, was Kunden zum Beispiel in Onlineshops erledigen, also sämtliche Interaktionen mit der Webseite. Diese Prozesse werden in einfachen Workflow-Systemen festgehalten, in komplexen betriebswirtschaftlichen Systemen wie die von SAP oder in Nutzer-Statistiken. Process Mining bedeutet, sämtliche Prozessabläufe so zu visualisieren, dass man ungetrübt sehen kann, wie sie in der Realität ablaufen. Denn Daten lügen nicht – sie zeigen schonungslos die Schwachstellen auf.

Wie bei vielen guten Idee stellt sich eigentlich die Frage, warum nicht schon früher jemand darauf kam? Und in der Tat hat schon vor über zehn Jahren der niederländische Informatik-Professor an der Technischen Universität Eindhoven Wil van der Aalst die mathematischen Grundlagen für Process Mining gelegt. Aber es dauerte, bis die Prozessor- und Speicherleistungen der Rechner die notwendigen Algorithmen effektiv abarbeiten konnten. Erst 2008 und 2009 begannen die ersten Unternehmen mit der Entwicklung entsprechender Produkte. Die von zwei deutschen Doktoranden gegründete Firma Fluxicon in Eindhoven ist einer der Vorreiter und nach wie vor am Markt. In Deutschland etablierte sich kurze Zeit später die Firma Celonis in München, die seitdem eng mit SAP kooperiert. Es folgten weitere Anbieter von Produkten wie ARIS, SNP, minit oder ProcessGold. Inzwischen kann man schon von einem Hype rund um Process Mining reden.

Eine Schwierigkeit des Process Mining ist, dass sich die benötigten Daten nicht so einfach in dem benötigten Format aus den Systemen in den Unternehmen heraus ziehen lassen. „Die Kunden sind in der Regel nicht dazu in der Lage, sie zu liefern“, sagt Kuhn. „Sie wissen häufig nicht, wo diese Daten zu finden sind.“ Das liege an der Komplexität der Datenbanken. In SAP-Systemen kann ein einzelner Einkaufsablauf Daten schon einmal auf rund 40 bis 50 verschiedene Datenbank-Tabellen verteilen – und insgesamt gibt es bei SAP bis zu 200.000 solcher Tabellen. „Da müssen Sie also erst einmal wissen, welche Daten sie finden müssen, wie die Tabellen verknüpft sind und wo sich welche Aktivität wieder spiegelt“, sagt Kuhn. „ Wir haben die ersten Jahre unter anderem damit verbracht, das rauszukriegen. Und wir lernen in jedem Projekt noch immer dazu.“

Alle Daten sind schon da

Das besondere an Process Mining ist, dass die Software nicht nur Stichproben behandelt. Sie durchforstet alle Daten eines bestimmten Zeitraums mit allen Varianten eines Prozesse. Dafür müssen die Daten, nachdem sie gefunden wurden, aus den Datenbanken gelesen und zusammen gefügt werden, so dass die Software darin nach Mustern suchen kann, die sie graphisch aufbereitet – inklusive Durchlauf- oder Kennzahlen.

Die Visualisierung ähnelt einem Familienstammbaum mit Eltern, Großeltern, Tanten und Urenkeln. Und je tiefer man in einen Stammbaum hineinschaut, desto überraschter ist man, wie weit verzweigt die Familie ist. Ebenso zeigt eine Process-Mining-Grafik, wie verästelt die Prozesse eines Unternehmens tatsächlich ablaufen, selbst wenn sie in der Firmenplanung geradlinig aussehen. Es ist ein wenig so, als hätten die Prozesse regelmäßig heimliche Affären, aus denen fortlaufend Prozesskinder hervorgehen, die den offiziellen Stammbaum in alle Richtungen ausdehnen. Die unerwarteten Verästelungen weisen auf die Probleme hin. Kuhn arbeitete zum Beispiel mit einer großen Versicherung zusammen. Die ließ für ihre Vertriebsmitarbeiter 10.000 Visitenkarten drucken. Die Visualisierung zeigte, dass die Visitenkarten bereits 17 Sekunden nach der Bestellung ausgeliefert waren. „Das wäre in der Tat ein erstaunlich effizienter Prozess“, sagt Kuhn. „Das Process Mining deckte in diesem Fall auf, dass die Bestellung telefonisch getätigt und erst nach Auslieferung in das System eingetragen wurde.“

Manchmal zeigen sich auch seltsame Schleifen. Eine Bank erkannte zum Beispiel, dass ein Mitarbeiter eine Liquiditätsbetrachtung für ein und denselben Fall rund zwanzig Mal berechnet hatte – jemand hatte wohl so lange mit den Zahlen jongliert, bis das System den Liquiditätsnachweis akzeptierte. In einem anderen Fall fand ein Unternehmen den Grund für die Beschwerden seiner Kunden mit dem ausgelagerten Help-Desk-Service: Die Firma – die Fälle nur abrechnen durfte, wenn sie diese in einer bestimmten Zeit abschloss – lieferte zwar auf dem Papier nahezu perfekte Zahlen. Doch das Process Mining zeigte, dass sie langatmige Fälle einfach öffnete und gleich wieder schloss, um sie außerhalb der gemessenen Zeit zu betreuen.

Im Process Mining geht es demnach sowohl um Effizienz als auch um Risikominimierung. Die Daten verraten, ob Lieferanten Termine einhalten, Mitarbeiter mehrmals beauftragte Lieferanten jedes Mal als Einzellieferant anlegen, statt einen günstigeren Rahmenvertrag abzuschließen – oder ob sie die Reihenfolge „Bestellung, Lieferung, Rechnung und Auszahlung“ strikt einhalten. „Früher ging ich in die Workshops für die Prozessanalyse mit der Frage, wie Prozesse verlaufen“, sagt Kuhn. „Heute beginne ich mit der Frage, warum ein Prozess nicht so läuft, wie er soll.“ Ein Mitbewerber von ProcessGold ist Celonis. Die Firma wurde 2011 von drei Studierenden der Technischen Universität München gegründet. Damals arbeiteten sie zunächst mit dem Bayrischen Rundfunk zusammen. Dabei entstanden erste Prototypen. Dann kamen Kunden wie Siemens hinzu. Inzwischen macht Celonis einen Umsatz von zehn Millionen Euro im Jahr. Bei Siemens wird die Process Mining Software von Celonis von mehr als 1.000 Mitarbeitern verwendet. „Sie untersuchen fast jeden Prozess, den man sich vorstellen kann“, sagt Julian Baumann, Unternehmenssprecher von Celonis.

Auf Spurensuche

Unternehmen, die mit Hilfe von Process Mining auf Spurensuche gehen möchten, brauchen drei Typen von Daten: zunächst die Case-ID, also die eindeutige Identifizierung eines Falls. Das kann zum Beispiel die Kunden- oder Bestellnummer sein. Zweitens benötigen sie einen Zeitstempel, den Buchhaltungssysteme meist automatisch bei jeder Aktivität eintragen. Und drittens ist die Aktivitätsbezeichnung erforderlich, also zum Beispiel, ob es sich um eine Bestellung oder eine Rechnungsfreigabe handelt.

Baumann sagt: „Das Schöne ist, dass so gut wie jeder diese Daten hat und wir sie unabhängig von der Branche anbinden können. Die Unternehmen müssen eigentlich nichts machen. Es ist unser Anspruch, eine Software bereitzustellen, die mit den vorhandenen Daten funktioniert.“ Ein paar Tage dauere es, bis es eingerichtet sei und meist gäbe es innerhalb einer Woche erste Ergebnisse. „Wir treffen uns anschließend mit dem Management und schauen, welche Erkenntnisse man heraus lesen kann“, sagt Baumann. Ziel sei, dass die Unternehmen die Software später ohne tiefere IT-Kenntnisse bedienen können, um die eigenen Fragestellungen abzuarbeiten. Die können sehr unterschiedlich sein.

Ein Celonis-Kunde betreibt zum Beispiel einen Webshop. Er wollte mit Process Mining die Costumer Journey analysieren. „Erstaunlicherweise machen die gängigen Web-Analyse-Tools wie Google Analytics das nur rudimentär“, sagt Matthias Stierle, Data Scientist bei Celonis. Die Process-Mining-Visualisierung zeigt dagegen alle Nutzerströme auf einem Blick. Zum Beispiel, dass knapp 150.000 Nutzer auf der Hauptproduktseite landeten und gerade mal 10.000 das aufwendig produzierte Werbevideo ansahen. Nur die Hälfte davon kaufte im Shop ein – also fünf Prozent aller Besucher. Dagegen kaufte ein Drittel aller Nutzer eines 360-Grad-Viewers das entsprechende Kleidungsstück auch. Das Video hätte sich das Unternehmen somit schenken können, den Viewer hingegen sollte es ausbauen. Suchmaschinen-Statistiken zeigen solche Besucherströme zwar ebenfalls, aber Shop-Betreiber müssen sich erst mühsam durchklicken, um die relevanten Zusammenhänge zu erkennen.

Für wen lohnt sich Process Mining überhaupt?

Lohnt sich Process Mining also tatsächlich für so gut wie alle Unternehmen? Die Entwickler solcher Software würden es bejahen, sofern eine Firma auch nur eine durchschnittliche Anzahl an Kunden und somit Daten hat. Matthias Weidlich, Informatik-Professor an der Humboldt Universität in Berlin, sieht es ähnlich, plädiert aber für eine realistische Herangehensweise. „Die heutigen Process Mining-Tools machen das naheliegende und sind darin relativ mächtig, sofern man entsprechende Daten vorliegen hat. Die Anbieter dieser Tools gehen allerdings davon aus, dass die Daten in den Eventlogs genau beschreiben, wann ein Ereignis oder eine Aktivität anfängt und aufhört. Aber in der Praxis ist das nicht immer so eindeutig festgelegt.“ Man könne nicht unbedingt Anfang und Ende eines Prozesses ablesen.

Und: Je komplexer die IT Infrastruktur sei, desto schwieriger werde es, die Daten zusammen zu bringen. Der Aufwand dafür sei der derzeit größte Kostenfaktor beim Einsatz von Process Mining. Daher sollte man vorab prüfen, ob es sich lohne. Weidlich sagt: „In allen Projekten, in welchen ich involviert war, wurden die Kosten, um bestimmte Einsichten zu erlangen, durch Process Mining massiv reduziert – einfach weil die Alternative oft nur die langwierige manuelle Datenerhebung und Analyse durch teure Prozessexperten ist.“ Anne Rozinat, Mitgründerin von Process Mining-Anbieter Fluxicon, sagt, eine Firma sollte sich zunächst fragen, inwiefern überhaupt Prozesse relevant für ein Problem seien. „Liegen die Probleme tatsächlich in Prozessabläufen?“, sagt sie. „In einem Callcenter kann zum Beispiel der Inhalt der Gespräche nicht von Process Mining-Tools erfasst werden. Wenn da etwas nicht gut laufe, sei das nicht unbedingt ein Problem des Prozessablaufs, sondern des Gesprächsverlaufs. Rozinat empfiehlt Firmen, ehe sie Process Mining einsetzen, sich in einem kostenlosen Online-Kurs der Universität Eindhoven (https://www.coursera.org/learn/process-mining) über die Möglichkeiten und Grenzen der Technik zu informieren. Dort und bei den meisten Process Mining-Enwicklerfirmen könne man zudem in einer Demo mit eigenen Daten ein wenig herum experimentieren.

Nächstes Level

Die Unternehmen arbeiten derweil bereits an einer neuen Generation von Process Mining. Da die Produkte noch alle jung sind, gebe es Entwicklungspotential, heißt es. Celonis hat zum Beispiel Ende2016 die Software „Celonis PI“ eingeführt, ein System des maschinellen Lernens. Im typischen Process Mining lesen die Nutzer aus der Visualisierung mögliche Schwachstellen heraus – in dem neuen System werden sie von der Software automatisch identifiziert. Diese vergleicht die Soll- und Ist-Prozesse und erkennt Abweichungen. Die Software schlägt dann Verbesserungen vor. ProcessGold bietet eine vergleichbare Funktion an.

Zudem arbeiten die Firmen daran, so genannte Predictive Analytics zu integrieren. Einige dieser Tools können bereits die Dauer von Prozessabläufen abschätzen, sofern die Prozesse ähnlich verlaufen wie in der Vergangenheit. In Zukunft soll die Software sogar automatisch Abläufe korrigieren, indem sie zum Beispiel bei möglicher Lieferverzögerung die davon abhängigen Folgetermine ändert. Solche wohlklingenden Zusatz-Features sind derzeit noch eher Bestandteil des Marketings der Entwickler. Kleinere Firmen dürften mit den Basisfunktionen des Process Mining in der Regel auskommen. Und auch Matthias Weidlich geht davon aus, dass diese in den nächsten Jahren auch im Mittelstand weiter Fuß fassen werden.

Dieser Text erschien in t3n.