Storytelling mit Daten – das ist die Königsdisziplin im Business Storytelling. Eine Disziplin, die in Zeiten von Big Data immer wichtiger wird. Worauf kommt es dabei an? Wie gelangt man von Daten zur überzeugenden Story? Was sind die Stolpersteine? Das fragte ich Simon Henning Nehls, Senior Consultant Data Science der Hamburger IT- und Managementberatung holisticon.
Beginnen wir mal ganz einfach. Daten ohne Story sind …
… eine vergebene Chance.
Eine Story ohne Daten ist …
… erst mal nur eine Meinung.
Ich analysiere Daten nicht zum Selbstzweck, sondern mit einer konkreten Business-Frage
In einem Blogeintrag schreibst du: „Ein Bereich, der bisher von der Professionalisierung weitestgehend ‚verschont‘ blieb, ist das Data Storytelling. Gerade weil viele Datenprodukte technischer Natur sind, sind das verpasste Chancen. Für das Business relevante Erkenntnisse könnten deutlich besser kommuniziert werden.“ Welche Ansätze würdest du für Storytelling mit Daten konkret verfolgen?
Ich erzähle sicher nichts Neues, wenn ich behaupte, dass in immer mehr Lebensbereichen Daten anfallen – neu ist vielleicht, dass diese Daten auch heute noch kaum ausgewertet werden. Oft sind sie nur für die operative Steuerung eines Systems notwendig. Wirklich systematisch fingen Unternehmen häufig erst in den letzten 20 Jahren an, diese Daten auch analytisch (also aggregiert) zu betrachten.
Hier gibt es naheliegende und weniger naheliegende Beispiele:
Der E-Commerce-Shop, der mich trackt, ist noch recht einleuchtend. Aber auch z.B. im öffentlichen Nahverkehr werden mittlerweile Daten nicht nur zur momentanen Steuerung genutzt, sondern sie werden auch im Nachhinein verfügbar und auswertbar gemacht (teilweise sogar veröffentlicht). Bei den Verkehrsbetrieben, um hier nur mal ein Beispiel zu nennen, versprechen sich die Anwender Erkenntnisse zum Spritsparen oder zu optimierten Wartungsintervallen und formulieren entsprechende Analysefragen und -aufträge.
Was Anwender und Auftraggeber aber präsentiert oder berichtet bekommen, sind häufig Analysen und selten Ergebnisse oder noch besser Erkenntnisse. Also vielmehr das „Was haben wir gemacht?“ als das „Was kam raus?“ und noch viel weniger das „Und was folgt nun daraus bzw. was machen wir nun damit?“
Jede gute Analyse beginnt also mit einem schlichten Perspektivenwechsel: Nicht „Was kann ich analysieren“ sondern „Was ist für meinen Auftraggeber wirklich von Interesse?“ und „Welches Problem versucht er damit zu lösen“?
Insights – not Data
Wie gehst du dabei vor? Wie kommst du Schritt für Schritt von Daten zur Story?
Ich analysiere Daten nicht zum Selbstzweck, sondern vor einem Use-Case-Hintergrund oder einer konkreten Business-Frage.
Auch wenn man dem CRISP-DM-Vorgehensmodell deutlich anmerkt, dass es seine Ursprünge in den 90ern hat, so hat es genau hier seine Berechtigung. Mein Rezept:
- Finde heraus, was mit den Erkenntnissen gemacht werden soll. Welche Entscheidung und welche Motivation liegen hinter der Analyseaufgabe? Gibt es Hypothesen?
- Suche dir die dafür relevanten Daten und beschränke dich auf diese. Versichere dich, dass das die relevanten Daten sind.
- Analysiere gründlich. Sind die Daten plausibel? Wenn aus „Millionen €“ in einer Präsentation plötzlich „Tausende €“ werden, weil das Dezimalkomma es nicht über den Atlantik geschafft hat, macht das die schönste Geschichte kaputt, da es die Glaubwürdigkeit kaputtmacht.
- Ziehe Schlussfolgerungen aus den Analyseergebnissen. Kommuniziere, trotz agilem Vorgehen und enger Abstimmung, nicht voreilig. Eine Aussage, einmal in der Welt, ist schwer wieder einzuholen. Mache Limitationen deutlich. Sei offen darüber, über was du keine Aussage treffen kannst.
- Und endlich kommt der spannende Teil: Verknüpfe die vor dir liegenden Punkte zu einer Geschichte. Hierbei helfen die Hypothesen. Fokussiere dich auf eine oder zwei Haupthypothesen oder -erkenntnisse.
Eine gute Geschichte besteht wahrscheinlich zur Hälfte aus Weglassen und zur anderen Hälfte aus Veranschaulichen
Für einen Energieversorger habe ich mich mal sehr intensiv mit Kundenwanderungen (also Kündigung und Vertragsabschlüssen) beschäftigt. Es gab die Hypothese, dass ein Umzug ein klassischer Zeitpunkt sei, seinen Stromvertrag zu kündigen. Hier habe ich dann mit einer Wendung gearbeitet.
Mithilfe einer konkreten Kundin und ihres Verlaufs in der Kundendatenbank konnten wir Rückschlüsse über ihr Verhalten zeigen. Zunächst Kundin für mehrere Jahre, regelmäßige Ablesungen, alle Rechnungen bezahlt, wahrscheinlich geheiratet, da Namensänderung, infolgedessen erhöhter Verbrauch und (das wissen wir nicht aus den Daten) wahrscheinlich wurde die Wohnung zu klein. Es folgten Umzugsmeldung in eine andere Straße und die Kündigung des Vertrags. Alle Produktmanager*innen stimmten mir hier zu, dass wir gerade eben einen sehr typischen Kundenlebenszyklus gesehen haben. Dann jedoch die Überraschung: Dieses Verhalten trat nur bei ca. 1/5 aller Umzüge auf. Die meisten Kunden blieben also auch nach einem Umzug dem Stromanbieter treu.
Nach dem Erstaunen ergaben sich sofort Folgefragen nach Unterschieden zwischen denen, die gekündigt haben und denen, die das nicht getan haben.
Die klassische Excelliste muss nicht zwingend auf Beifall stoßen
Was, glaubst du, hindert Analysten daran, so vorzugehen und Storytelling mit Daten zu nutzen?
Ich sehe vor allem drei Hindernisse:
- Aufwand und Scheu
Storytelling mit Daten ist definitiv aufwändiger und kostet deutlich mehr Zeit, so vorzugehen; man muss sich trauen, auch mal etwas auszuprobieren – auch auf die Gefahr hin, dass dies nicht bei allen Kunden und Auftraggebern gut ankommt. Die klassische Excelliste muss nicht zwingend auf Beifall stoßen. Bei Geschichten spielen das Publikum und der Zuhörer eine größere Rolle. Darauf muss man sich einlassen.
- Falsches Selbstverständnis
Bei einem ehemaligen Kunden traten die Analysten mit dem Credo auf „We deliever insights – not data“. So simpel, so wahr: Wenn ich mich nur als Datenlieferant sehe, bin ich nicht in der Rolle eines aktiven Sparringspartners, der sich dem Werkzeug ‚Story Telling‘ bedienen kann, um Erkenntnisse zu kommunizieren.
- Der Anspruch auf Vollständigkeit
Vielleicht ist dies das größte Hindernis: Bei einer Analyse stoße ich ja nicht nur auf eine Erkenntnis, sondern meist auf eine ganze Reihe. Für eine gute Geschichte muss ich aber weglassen können. Meist spitze ich die Geschichte auf eine, maximal zwei Erkenntnisse zu, die in einem Meeting fokussiert diskutiert werden. Die anderen Erkenntnisse, die vielleicht auch noch komplexer zu analysieren wären, lässt man zunächst bewusst links liegen.
Was genau brauchen Analysten, um besser in der Kommunikation zu werden?
Das technische Handwerkszeug ist da, was vielmehr fehlt, ist häufig das Verständnis dafür, dass gute Kommunikation Teil eines Data Products oder einer Analyse ist. Erst dann kann ich bei einer Aufwandsschätzung die Kommunikation, also zum Beispiel eine Story, wie die Verpackung bei einem Waschmittel, mitdenken und schließlich auch mitbepreisen.
Daten-Journalismus ist eine gute Inspirationsquelle
A propos Verpackung: Welche Rolle spielt beim Storytelling mit Daten die Story, welche Rolle Bild, welche Rolle Grafik?
Dies ist natürlich sehr abhängig davon,um welche Analysesituation und Zielgruppe es sich handelt.
Für komplexe Zusammenhänge nutze ich in der jüngsten Vergangenheit vermehrt großflächig Bilder und Icons. Eine Powerpointfolie, die nur ein passendes Icon ausstellt, verbunden mit einer klaren Botschaft auf der Tonspur, wird sehr gut erinnert. Man sollte da natürlich aufpassen, sollten solche Folien, wie es häufig Unternehmenspraxis ist, fröhlich weitergeleitet werden.
Du erwähnst in einem deiner Beiträge Datenjournalismus. Siehst du darin ein Vorbild?
Gute Journalisten schaffen eine Reduktion aufs Wesentliche und so haben guten Reportagen eine Wirkung auf den Leser. Insoweit hat der Datenjournalismus sicher Vorbildcharakter. Visualisierungen sind da sicher der gemeinsamen Nenner: Ganz großartig fand ich da die Visualisierungen von Patrick Stotz, Caroline Wiemann und Kollegen zur letzten Bundestagswahl: ‚Jamaika ist eine westdeutsche Insel‘, die ja auf der Idee von Tim Wallace aus der NY Times beruhen.
Auch lohnend sind die Arbeiten des Interaktiv-Teams der Berliner Morgenpost, die einen sehr spielerischen Ansatz in die Beschäftigung mit Daten und die Aufbereitung bringen.
Hast du eigentlich einen Helden im Vermitteln von Daten?
Nicht in meiner eigentlichen Disziplin, dem Data Story Telling – wahrscheinlich sind wir einfach noch nicht soweit! Zudem sollten wir bedenken, dass ein ganz großer Teil der Analystenarbeit natürlich innerhalb von Unternehmen und damit im Verborgenen stattfindet. Vorbilder finde ich da wirklich eher wieder im Datenjournalismus:
Der schon erwähnte Patrick Stotz vom Spiegel macht das ziemlich großartig. Bei ihm ist es häufig der unerwartete Einsatz von Karten, die eine Botschaft intuitiv erschließen lassen.
Ein weiteres Kartenbeispiel: Als Vorbild darf sicher die ARTE-Produktion ‚Mit offenen Karten/ Le Dessous des cartes‘ nicht fehlen. So reduziert und so nüchtern Zusammenhänge aufzuzeigen und damit potentielle Kausalbeziehungen zu erschließen: bravo!
Ich nutze häufig Metaphern, um Zusammenhänge zu verdeutlichen
Ist diese Form journalistischen Storytellings deiner Meinung nach wegweisend für Analysten?
„Wegweisend“ ist mir schon ein wenig zu groß – da sind die Zielgruppe und das Datenprodukt dann doch häufig zu unterschiedlich. Aber als Inspirationsquelle für Storytelling mit Daten bei Analysten ist gerade Datenjournalismus sicher gut geeignet. Ein Blick auf die Shortlist des Data Journalism Awards lohnt sicher immer.
Verspüren Daten-Analysten eigentlich wirklich einen Mangel bei der Vermittlung von Daten oder nur die Kollegen, die die Daten nicht so lesen können?
Für mich geht es hier ausdrücklich nicht um fröhliches ‚Mit-dem-Finger-aufeinander-Zeigen‘. Wir sind als Daten-Analysten Dienstleister und unsere Leistung ist nun mal häufig Entscheidungsunterstützung. Das Akzeptanzkriterium muss also schlichtweg sein, ob besagte Entscheidung mithilfe der Analyse besser getroffen werden konnte. Erfüllen wir das nicht, haben wir unseren Job nicht gut gemacht! Frei nach dem Motto: „Es muss den Gästen und nicht dem Koch schmecken.“
Welche Rolle spielt Software? Welche würdest du empfehlen? Warum?
Mit den Bordmittel und entsprechenden Paketen/Libraries von Python und R kommt man schon recht weit. Alles ist Open Source, gut dokumentiert und die Anzahl an Tutorials (z.B. für das Graphikpaket ggplot 2 für R) fast endlos. Spielt die Geschichte auf einer Karte, kann es sich durchaus lohnen, sich in ein Geo-Datenbanksystem wie PostGIS und das Geoinformationssystem QGIS einzuarbeiten.
Ich plädiere für eine branchenagnostische Disziplin Storytelling mit Daten
Prädikative Modelle brauchen auch Storys, oder?
Ja! Prädiktive Modelle brauchen meiner Erfahrung nach deutlich mehr Veranschaulichung und Erklärung als klassische Analysen der Vergangenheit, um richtig eingesetzt werden zu können.
Ein Modell gut zu erklären, das im Stil einer Glaskugel die Zukunft vorhersagt und Aktionen mit Wahrscheinlichkeitswerten attribuiert, ist eine Herausforderung. Bei einem Churn-Prediction-Modell (also ein Modell zur Vorhersage der kundenindividuellen Kündigungsaffinität) ist die Geschichte oft anekdotisch: mithilfe der wichtigsten erklärenden Variablen wird also eine Person skizziert, die beschließt, den Telefon- oder Stromvertrag zu kündigen. Hier muss man sehr aufpassen, dass prädiktive Modelle ja meist keinen Kausalzusammenhang aufzeigen, sondern nur Korrelationen (und ähnlichen Gleichlauf) von Ereignissen wiedergeben. Geschichten im Sinne von „Weil das…ist jenes passiert, dies hat zu… geführt“ würde dem Zuhörer also ein falsches Bild vermitteln.
An welche Art Storytelling denkst du dabei? Richtige Geschichten oder mehr Metaphern oder Vergleiche? Eine präzise Sprache, die erklärt, was die Daten und Charts bedeuten?
Wie schon beschrieben, nutze ich häufig Metaphern, um einzelne Zusammenhänge zu verdeutlichen. Geht es um größere Probleme, wie die oben gerade beschriebene Klassifikation im Kündigungsvorhersagemodell, nutze ich auch „richtige Geschichten“, die einen Helden haben, der auf der Suche nach dem günstigsten Stromtarif ist. Hier eignen sich, gerade bei komplexeren Algorithmen, Methoden wie LIME (Local Interpretable Model-Agnostic Explanations), um dem Trade-off „Accuracy – Transparency“ ein Schnippchen zu schlagen.
Woran hakt es denn konkret bei der Kommunikation der Daten?
Beim Beantworten einer Fragestellung mithilfe von Datenanalyse „operationalisieren“ wir die Fragstellung. Wir suchen also die Entsprechung des Sachverhalts aus der „wirklichen“ Welt in den zur Verfügung stehenden Daten. In dieser Dimension analysieren wir. Die Fragestellung, die es zu beantworten gilt, ist aber immer noch in der „wirklichen“ Welt. Hierin müssen wir also auch die Antwort transportieren. Genau dieser Schritt wird häufig vergessen.
Das schwerste ist der Rücktransfer in die wirkliche Welt
Gibt es so etwas wie übergreifenden Datengeschichten – oder ist das Branchenspezifisch. In der Medizin anders als im Handel als im Bereich Bildung? Das heißt: Ließe sich eine übergreifende Disziplin Storytelling mit Daten begründen?
Ich plädiere für eine branchenagnostische Disziplin Storytelling mit Daten. Natürlich muss man immer die branchenspezifische Fachlichkeit beachten, jedoch ist dies wie in der prädiktiven Modellierung: Ich kann z.B. mithilfe von Sensordaten bald kaputtgehende Maschinen erkennen oder die schon beschriebenen kündigungsaffinen von den treuen Kunden versuchen zu unterscheiden. Fachlich natürlich etwas komplett anderes – Algorithmisch jedoch sehr ähnlich inklusive der gleichen Schwierigkeiten wie fehlenden Werten oder unbalancierten Zielvariablen.
Du sagst, es wäre wichtig, eine gemeinsame Sprache zwischen Data Science, Fachabteilung und Management zu finden. Was genau heißt das, woran fehlt es sprachlich gesehen?
Eine gemeinsame Sprache ist sicher ein hehres Ziel, vielleicht reicht auch schon das Verständnis dafür, dass Begriffe unterschiedlich belegt sind. So bezeichnet ein „Feature“ z.B. im Data Science einen „Inputfaktor“ für ein Modell, in der Softwareentwicklung geht es beim Wort „Feature“ jedoch um einen Funktionsbaustein. Ähnlich verhält es sich mit dem „Modell“ selbst…
Vielleicht zum Schluss noch einmal kurz und knapp: Was ist so schwer zu vermitteln? Die Daten? Die Modelle? Die Filter? Die Szenarios? Die Erkenntnisse aus den Daten? Die Handlungsempfehlungen?
Das schwerste beim Storytelling mit Daten ist wohl der schon angesprochene Rücktransfer in die wirkliche Welt. Die Operationalisierung (also hinein in die Datenwelt) ist schon komplex, die Rückholung der Erkenntnisse aber der Knackpunkt. Hier sehe ich Data Story Telling als wichtiges Hilfsmittel.
Lesen Sie dazu auch mein Interview mit Frank Pörschmann aus dem Vorstand der Digital Analytics Associations e.V., Deutschlands größtem Fachverband für Datenexperten.