Zuerst kommt die Entscheidung und dann erst die Daten? ​Diese Ansicht steht in krassem Gegensatz zu vielen KI- und datenfokussierten Vordenkern, die dazu neigen, mit Daten zu beginnen und dann nach Mechanismen zu suchen, um diese zu nutzen. Dabei ist der Weg bei der Entscheidung zu beginnen wesentlich kostengünstiger, jedenfalls wenn unser Ziel das Lösen von Problemen ist.

Das ganze Gerede von Daten als dem neuen Öl hat dazu geführt, dass noch immer viel zu viel Aufwand für die Anhäufung und Bereinigung von Daten im Vorfeld der Entscheidungsmodellierung betrieben wird. Niemand wäre es eingefallen zuerst so viel Öl wie möglich zu pumpen und erst dann zu überlegen für was es eigentlich zu gebrauchen ist...

Es gibt nicht wenige Organisationen, die jahrelang versucht haben in ihrem Datawarehouse eine vollständige und einheitliche Sicht ihrer operativen Daten abzubilden. Es wurde immenser Aufwand betrieben die Schlüssel zu finden, um hunderte Tabellen sinnvoll und mit den richtigen Zeitbezügen zusammenzuführen.  Was, wenn eine Analyse der relevanten Entscheidungswege eine Verknüpfung von nur zwei Tabellen für einen Großteil der benötigten Einsichten ausreichen würde? In vielen besonders volatilen Umgebungen gibt es vielleicht noch gar keine Daten für die aufgetretene Situation, einfach weil sie brandneu ist. Hier müssen wir Annahmen über die Zukunft treffen und mögliche Konsequenzen abschätzen. 

Wir schlagen deshalb vor in gewisser Weise rückwärts zu arbeiten. Man beginnt mit dem Problem, überlegt die möglichen Handlungen und sammelt erst danach die Daten dazu. Verbindet man dann ganz am Ende "die Punkte" zwischen Daten und Nutzen, stellt man vermutlich fest, dass einige Datenfelder eine große, andere eine nicht so große Wirkung entfaltet haben. So spielt vielleicht der Preis des Produktes eine wesentlich wichtigere Rolle als das Gewicht, jedenfalls wenn man nicht gerade Hanteln verkauft. Obwohl das ein ziemlich triviales Beispiel ist, wird deutlich, dass ohne ein gewisses Wissen darüber, wie Daten mit Entscheidungen in Verbindung stehen, keine Unterscheidung zwischen hochwichtigen und weniger wichtigen Daten getroffen werden kann.  Ohne dieses Wissen beschäftigen sich letztlich die teuren Datenspezialisten mit irgendwas und alle wundern sich, dass die IT so langsam und dazu auch noch teuer ist...