Mit „R“ bessere Analysen im Self-Service erstellen

Durch Self-Service und einen hohen Anspruch an Usability wurde es Nutzern ermöglicht, Berichte und Dashboards selbst zu erstellen. Lücken im Customizing und der Datenmodellierung werden mit Programmiersprache „R“ geschlossen – effizient und unabhängig von Entwicklern und Administratoren.

Das Schlagwort „Self-Service“ ist nun schon seit einiger Zeit in der Welt der Business Intelligence (BI) präsent. Tools haben einen Sprung in Sachen Benutzerfreundlichkeit und Effizienz gemacht. Der Anwender sollte befähigt werden, Berichte und Dashboards selbst anzufertigen. Oberflächen wurden übersichtlicher und moderner. Diagramme erstellen geht wie von selbst: nur ein paar individuelle Einstellungen vornehmen und fertig. Entwickler und Datenbank-Administratoren wurden in die zweite Reihe verbannt. Wer schon ausgiebig mit Tools wie Power BI oder Cognos Analytics gearbeitet hat, weiß aber, dass auch diese Tools Grenzen haben.

Nicht umsonst ist Excel noch immer so ein populäres Tool. Dies liegt nicht nur an der Gewohnheit der Nutzer, sondern vor allem an der Vielschichtigkeit des Programms. Ungeschulte Anwender können bereits Tabellen und Diagramme anfertigen. Genauso können Bastler und Enthusiasten mit einer genauen Vorstellung Datenreihen einzeln konfigurieren und Berichte durch VBA-Makros, versteckte Zellen und Arbeitsblätter beliebig ergänzen. Von der Summe zweier Spalten bis hin zu umfangreichen, mehrstufigen Analysen ist alles vertreten und der Übergang fließend.

Problematiken bei bestehenden Tools

Und genau an dieser Tiefe scheitern viele moderne Tools. Einstellungsmöglichkeiten sind einfach, klar und übersichtlich, doch damit auch begrenzt. Datenquellen werden ohne viel Aufwand eingebunden und angezeigt. Aber was ist, wenn mehr Informationen benötigt werden als die Datenquelle direkt liefert?

Moderne Datenquellen sind allgemeingültig und berichtsunabhängig von der IT bereitgestellt und damit nicht auf einen speziellen Bericht zugeschnitten. Aufbereitete Daten für Analysen könnten zwar zur Verfügung gestellt werden, aber widersprechen dem Gedanken des Self-Service, der Unabhängigkeit des Analysten. Also was tun? Bei Excel bleiben?

Mit „R“ erhält die Datenaufbereitung eine neue Qualität

Natürlich haben die Entwickler der modernen Tools diese Lücke erkannt. An dieser Stelle kommt „R“ ins Spiel. „R“ ist eine Programmiersprache, welche vor allem durch Datenanalyse und Aufbereitung glänzt und deshalb unter Data-Analysten weit verbreitet ist.

Programme wie Power BI oder Tableau bieten heutzutage die Möglichkeit der Unterstützung von „R“-Skripten. Der „Otto-Normalverbraucher“ nutzt die vorhandenen Annehmlichkeiten und der geübte Anwender kann sich in „R“ soweit vertiefen, wie er es für notwendig hält. Aber wie sieht das genau aus?

Auswertung und Diagrammdarstellung mit „R“

Ein typisches Szenario aus dem Handel ist eine Umsatz-Tabelle: Klar strukturiert mit allen Informationen, die man für Umsatzbuchungen benötigt. Aber was ist, wenn Sie eine statistische Auswertung dazu haben möchten? Vielleicht dazu noch auf einstellbaren Untergliederungen und Gruppierungen? Minimum, Maximum und Durchschnitt sind mit Bordmitteln noch möglich, alles Weitere wird schon schwieriger. Genau dort kommt dann eine „R“-Prozedur als Datenquelle zum Einsatz, welche in wenigen Zeilen aus der einfachen Liste die nötigen Werte berechnet.

Quellcode R-Source in Power-BI
Der benötigte Quellcode R-Source in Power BI

Die Ergebnisse werden in Power BI als Matrix dargestellt.
Die Ergebnisse werden in Power BI als Matrix dargestellt

Ähnlich verhält es sich mit Diagrammen. In neunzig Prozent der Fälle werden die vorgefertigten Diagramme genutzt: Einfach, schnell, effizient und interaktiv. Gerade wenn Sie die Darstellung für eine Präsentation aufbereiten oder Dashboard-artige Anwendungen konzipieren möchten, in denen Daten äußerst kompakt dargestellt werden müssen, geschieht es regelmäßig, dass dies nicht mit vorgefertigten Methoden gelöst werden kann. In diesen Fällen nutzt der Analyst „R“, um sich das Diagramm so zu modellieren und anzureichern, wie er es braucht.

Das folgende Beispieldiagramm wurde komplett mit „R“ erstellt. Es ist ein Bestandsverlauf in Form eines Wasserfalldiagramms, worin die Maximal-, Minimal-, Anfangs- und Endbestände automatisiert eingefügt sind.

Dazu wurden die Warenbewegungen in einem passend ausgerichteten Diagramm gruppiert dargestellt, um die Bestandsänderungen nachvollziehen zu können.

Warenbewegungsdiagramm
Der Bestandsverlauf und die Bestandsbewegungen als übersichtliches Diagramm

Datenanalysen und Präsentationen erhalten eine bessere Qualität

Als Fazit lässt sich sagen, dass sich die Grenzen der Self-Service BI mit „R“ verschoben haben. Es wird sicher nicht alle Probleme lösen, aber eigene Analysen (unabhängig von Excel oder der IT) und benutzerdefinierte Graphiken sind ein großer Schritt hin zum unabhängigen Analysten.

Die Modellierung braucht Zeit, aber es ist erfreulich, dass es eine Möglichkeit gibt, den Datenanalysen und Präsentationen inhaltlich eine neue Qualität zu geben.

© anyaberkut - stock.adobe.com

Zurück