Schritt für Schritt von Rohdaten zu Erkenntnissen (Analyse-Fahrplan)


Zuletzt aktualisiert am 22.06.2023

Hast du dich auch schon mal gefragt, was eigentlich alles dazu gehört, wenn du „deine Daten auswerten“ willst? Oder wie die bunten Diagramme und Tabellen zustande kommen, von denen Erkenntnisse abgeleitet werden, um das Unternehmen / den Unternehmensbereich voranzubringen? 

Die Kenntnis über den Datenanalyse-Prozess ist insofern wichtig, da dieser eine Struktur darstellt, die einem hilft mit den vielfältig vorhandenen Daten auch wirklich nachhaltig und effizient zu arbeiten. Der Datenanalyse-Prozess soll der Analyse Struktur geben, um sich in den vielen Daten nicht “zu verlieren” und aus den Daten auch wertvolle Erkenntnisse zu gewinnen. 

Falls du direkt zu einem der Schritte springen möchtest, klicke hier: 

Der Datenanalyse-Prozess vereinfacht in 5 Schritten

Fragst du Analysten, wie sie aus Rohdaten Erkenntnisse machen, werden sie dir mit großer Wahrscheinlichkeit alle von den gleichen Prozessschritten erzählen, wie sie zu einem Ergebnis in der Datenanalyse kommen. 

So kann man grob 5 Teilschritte zusammenfassen, die du befolgen solltest, um effizient zu einem Ergebnis deiner Analyse zu kommen:

9BMbiKuswGzbL7sQOJIUYBGPCklXGsSMaIdJXS71qazTP6T QbyiQ0VrlMHhWlwKE6JsybCr6BGp6vjnKGI2ZISQOzLLu4N0PBArcoNUzQE4cGN8IO8eQRig6ihXjja 87t4FIsY

(Mein Zusatztipp: Dokumentiere jeden dieser Schritte, um später nachvollziehen zu können, was warum gemacht wurde)

  1. Anforderungsdefinition
  2. Aufbereitung der Datengrundlage
  3. Verarbeitung der Daten (Datenanalyse)
  4. Visualisierung der Ergebnisse (Datenvisualisierung)
  5. Interpretation der Daten (Erkenntnisse → Handlungsfolgen)

Schritt 1: Anforderungsdefinition

Wie eingangs erwähnt, haben Unternehmen heutzutage eine große Menge an Daten in verschiedenen “Ausprägungen” und in vielen Systemen. Um aus diesen großen Datenmengen Erkenntnisse zu gewinnen, muss also erstmal eingegrenzt werden.

Im ersten Schritt ist es wichtig alle Anforderer, die diese Analyse betreffen könnte, mit einzubeziehen. Gegebenenfalls kann die Anforderungsphase auch als Ergebnis haben, dass zwei statt einer geplanten Analysen gemacht werden müssen, da die Anforderungen der unterschiedlichen Anforderer zu weit auseinander ging. Wenn du als Einzelunternehmer alleine in der Analyse unterwegs bist, setze dir wie auch in anderen unternehmerischen Fragestellung die verschiedenen Abteilungsbrillen auf. 

Stelle dir zu Beginn die folgenden Fragen:

  1. Welche Fragen sollen mit der Analyse beantwortet werden?
  2. Welche Kennzahlen geben dir Aufschluss über ein positives / negatives Ergebnis (Key Performance Indicator)?
  3. Welche Datenquellen kommen grundsätzlich in Frage?
  4. Gibt es bereits Vermutungen oder Erwartungen an die Ergebnisse? Wenn ja, welche? (Untersuche aber nicht nur diese Vermutungen!)
  5. Welche möglichen Handlungsfolgen kann es geben?

Wie bereits in der Übersicht beschrieben, bin ich ein großer Fan der Dokumentation: Ungeachtet dessen, ob du die Analyse alleine planst, durchführst und anwendest oder in den einzelnen Schritte unterschiedliche Personen involviert sind, es ist immer hilfreich die Gedankengänge und Schritte über den Verlauf hinweg nachzuvollziehen.

Schritt 2: Aufbereitung der Datengrundlage

Anschließend an die erste Planung, geht es in die Daten. Hier ist es weiterhin sinnvoll zu dokumentieren, damit im Nachhinein nachvollzogen werden kann, was warum gemacht wurde.

An dieser Stelle kannst du dir folgende Fragen stellen:

  1. Welche Daten sind für die Beantwortung der Fragestellung relevant?
  2. Welche Daten sind verfügbar / nutzbar?
  3. Wie bekommst du die dafür notwendigen Daten?

Denn bevor du die Daten verarbeiten kannst, musst du erstmal wissen, welche Daten überhaupt relevant und auch verfügbar und nutzbar sind. 

Hierzu schaue in die im ersten Schritt definierten Datenquellen rein und 

  • welche Datenquellen du zusammenführen möchtest
  • definiere, welche Datenfelder du brauchst,
  • wie gut die Datenqualität ist

Der zweite Schritt ist oft der zeitaufwendigste Teil oder blockiert sogar die weitere Analyse, da die Daten, die man auswerten wollte entweder gar nicht vorhanden sind oder die Datenqualität nicht ausreicht, um gute Ergebnisse zu produzieren. Trifft eines der beschriebenen Fälle ein, muss die Datenerhebung nochmal erfolgen oder korrigiert werden und die Analyse solange pausiert werden bis die Daten in der gewünschten Qualität vorhanden sind.

Schritt 3: Verarbeitung der Daten (Datenanalyse)

Erst im dritten Schritt sind wir in der eigentlichen Datenanalyse. Hier befassen wir uns mit der technischen Verarbeitung der Daten: Je nach Fragestellung und Datenumfang kann in diesem Schritt theoretisch alles passieren von einfachen Formeln in Excel über Gruppierungen der Daten in einer SQL-Datenbank bis zur Anwendung von Machine Learning Modellen.

Die Kernfragen in diesem Schritt sind: 

  1. Wie verarbeitest du die Daten, so dass du damit etwas anfangen kannst?
  2. Wie kannst du sicherstellen, dass die Analyse ein weiteres Mal durchgeführt werden kann?
  3. Wie sind die Daten “beschaffen” / verteilt (deskriptive Analysen)?

Die hier zum Einsatz kommenden Tools variieren auch stark: Je nachdem, wie umfangreich ein Unternehmen in die Datenanalyse einsteigt, werden Tabellenkalkulationsprogramme wie Excel und Google Spreadsheets teilweise komplett durch komplexere SQL-Abfragen und / oder Programmiersprachen wie Python oder R ersetzt.

Das Ziel ist es hier die Daten so zu verarbeiten, dass sie die gestellten Fragen beantworten und von der jeweiligen Visualisierungssoftware gut verarbeitet werden können.

Schritt 4: Visualisierung der Ergebnisse

Während wir im dritten Schritt fast ausschließlich in Tabellen unterwegs waren (außer in der deskriptiven Analyse, die für den vierten Schritt auch hilfreich sein kann), wird es nun visuell und grafischer. In der Datenvisualisierung geht es darum Daten ein für den Betrachter einfach nachvollziehbares “Bild” zu überführen. Denn dieses Bild wird die Basis der Interpretation in Schritt 5 sein.

In der Visualisierung sollten folgende Fragen beantwortet werden:

  • Wie können die Informationen in ihrer Reihenfolge logisch angeordnet werden?
  • Welche Darstellungsformen unterstreichen welche Ergebnisse?
  • Werden die Ergebnisse gemeinsam interpretiert oder von jedem Betrachter einzeln?
  • Welche zusätzliche Informationen sollten dem Betrachter bereitgestellt werden?

In der Visualisierung kommen unterschiedliche Tools zum Einsatz: Von der Visualisierung in Excel / Google Spreadsheets über Business Intelligence Tools wie Google Data Studio, Tableau oder Datapine bis hin zu selbst programmierten Python- oder R-Lösungen.

Gerade wenn BI Tools eingesetzt werden, lassen sich die Daten sehr flexibel visualisieren und mit den Ergebnissen anwendergerecht arbeiten. Jedoch ist hier zu sagen, dass den Anwendern die begrenzte Aussagefähigkeit bei geringen Datenmengen oder dem Unterschied zwischen Korrelation und Kausalität klar sein sollte.

Schritt 5: Interpretation der Daten → Handlungsfolgen

Der fünfte und letzte Schritt ist der für das Unternehmen entscheidende: Welche Erkenntnisse werden aus den Daten und welche Handlungen werden wiederum daraus abgeleitet?

Hierfür ist es gut, wenn die Anforderung an die Analyse (Schritt 1) gut dokumentiert wurde, da sie nun als Leitfaden für die Ergebnisse dienen kann.

Folgende Fragen können hier hilfreich sein:

  1. Wie fällt die Antwort auf deine Fragestellung(en) aus?
  2. Lassen sich die eingangs vermuteten Aussagen bestätigen?
  3. Welche Ergebnisse sind überraschend?
  4. Welche Erkenntnisse lassen sich in Handlungen übersetzen?
  5. Wo sind weitere Analysen notwendig?

Gerade wenn die Ergebnisse überraschend sind, ist es den Entscheidern für die Interpretation oft wichtig, das Zustandekommen der Ergebnisse der Analyse nachvollziehen zu können. Oft hilft dabei eine argumentativ belegbare Vorgehensweise in der Analyse. 

Der Analyse-Prozess kann ein Kreislauf sein

Sind in Schritt 5 weitere Analysen notwendig, wird zu Schritt 1 des Analyse-Prozesses zurückgekehrt. 

0gMd1 JMaXO3vmawB8vJN Jy3Vr5XUN7gm7fd4VtZZCB1KHcIXgFXjjzfo5wkHfnvJZKTd2Inx ZKQLPsFHSwGWD60Wa Iu3rNHwIUHZZ6oZ1XtYnROAehtNBKu Up4FGRuhqOon

Tatsächlich wird in der Praxis manchmal sogar von anderen Zwischenschritten wieder in die Anforderungsdefinition zurückgegangen, allerdings gilt es dies zu vermeiden, da die einzelnen Schritte schon ziemlich zeitintensiv sind. Je besser der Analyst das Business und die Anforderungen einschätzen kann, desto effizienter wird man zu einem Ergebnis kommen.

Durch den Analyse-Kreislauf wird deine komplette Datenanalyse effizient und zielführend, denn du hinterfragst deinen Prozess und deine Tools indirekt für jeden Use Case. Das soll dich natürlich nicht dazu bewegen, ständig Tools und Prozesse zu wechseln, sondern gerade am Anfang einer großen Datenstrategie zu überlegen, was für dein Business und die Datenanalyse nachhaltig und sinnvoll ist.

1 Kommentar

Schreibe einen Kommentar