Eine immer zentraler werdende Herausforderung im Unternehmen besteht darin, mit einer
Vielzahl von Datenspeichern umzugehen: Business Warehouses, Datenbanken, Edge Storages, Rechenzentren, Clouds, Anwendungen, Analytic-Tools, APIs,Tabellenkalkulationen usw. Um hier mehr Überblick zu gewinnen boomt seit einer Weile eine neue Art von BI-Werkzeug: Der Datenkatalog.
 


KollaborativerDatenkatalog

 

Ein Datenkatalog ist erfolgreich, wenn er die zentrale Anlaufstelle für Daten aller Art bildet. Neben Suche und Zugang zu Daten, garantiert er einheitliche Qualitätsstandards und ermöglicht ein föderiertes Berechtigungsmanagement, Auditing und Monitoring. 

Die verschiedenen Anbieter decken diese Anforderungen mit unterschiedlichem Fokus ab. So gibt es Datenkataloge mit Spezialisierung auf Datenintegration/-virtualisierung oder Berechtigungsmanagement, allgemein für Datenmanagement, oder speziell für Data Lakes oder Datenverarbeitung/ETL. Braucht man also mehr als einen Datenkatalog? 

So divers wie die Angebote sind auch die Anforderungen von Unternehmen. Fachanwender benötigen andere Informationen als technische Nutzer. Macht es dann überhaupt Sinn von einem Datenkatalog zu sprechen oder braucht es gar mehrere anwenderspezifische Datenkataloge? 

Diese Frage läuft immer auf eine Abwägung von Aufwand und Komplexität heraus. Wenn die Anforderungen der Nutzergruppen weit voneinander entfernt sind oder inhaltlich wenig Überschneidungen vorliegen, können zwei unabhängige Kataloge die bessere Lösung sein. Zwei kleine und übersichtliche Kataloge erzeugen weniger Abhängigkeiten und sind einfacher zu betreiben.  

In einem Beispielszenario soll Analysten die Arbeit erleichtert werden, indem ihnen ein Katalog der Businessdaten zur Verfügung gestellt wird. Für Maschinendaten zur Produktionssteuerung existiert bereits ein Data Lake-Datenkatalog. Obwohl auch aggregierte Maschinendaten für die Analysten von Bedeutung sind, wäre es unsinnig den vorhandenen, eher technisch orientierten Katalog zu erweitern. Stattdessen stellt ein zusätzlicher BI-orientierter Datenkatalog die bessere Lösung dar. 

Bei Überschneidungen der Inhalte oder Anforderungen bedeuten zwei Datenkataloge jedoch doppelten Aufwand und erhöhte Komplexität, sodass ein einziger Katalog sinnvoller ist. Als gemeinsame Anlaufstelle kann er die Zusammenarbeit und damit Effizienz weiter stärken. In diesem Fall ist besonders darauf zu achten, dass die Nutzererfahrung (UX) für alle Nutzergruppen gut ist, sodass der Katalog auch tatsächlich genutzt wird.  

Eine Controllerin möchte beispielsweise neben den Dateninhalten auch deren Bedeutung (Business-Glossar) im Katalog erklärt sehen, während ein Data Scientist noch an Diagrammen zur Datenabstammung und Qualität interessiert ist. 

Auch ein Datenkatalog löst nicht alle Probleme

Art und Anzahl sind wichtige Aspekte bei der Auswahl von Datenkatalogen. (Im  kommenden Beitrag werden wir uns mit der Frage genauer auseinandersetzen, auf welche Kriterien Sie bei der Auswahl eines Datenkatalog achten sollten und wie Sie den für Sie passenden Datenkatalogs finden). Die richtige Auswahl zu treffen macht das Projekt aber noch nicht zu einem Erfolg. Leider ist in Unternehmen manchmal der Irrglaube verbreitet ein Datenkatalog einzurichten würde reichen, um alle Probleme der Datenhaltung zu lösen. Dem ist leider nicht so, denn wie oben bereits erwähnt, nützt der beste Datenkatalog nichts, wenn er nicht genutzt wird.  

Statt der tollsten technischen Lösung kommt es auf Pragmatismus und tatsächliche Nutzung an. Für den Einstieg darf es auch eine kuratierte Excel-Tabelle mit den verfügbaren Datensätzen und deren Definitionen sein. Ergibt sich daraus für die Mitarbeiter ein tatsächlicher Mehrwert, ist der Einstieg ohne großen Aufwand geschafft. Reicht diese einfache Lösung irgendwann nicht mehr aus, sind bereits erste Erfahrungen mit einem Datenkatalog vorhanden und die Suche nach einem Nachfolger kann informiert erfolgen. 

Der neue Datenkatalog kann sein volles Potential nur entfalten, wenn er umfassend genutzt wird. Mit der technischen Weiterentwicklung muss sich also auch eine kulturelle Weiterentwicklung vollziehen. Abteilungen verstehen sich als Datenproduzenten, die ihr Datenprodukt im Datenkatalog anderen zur Verfügung stellen und im Gegenzug Daten bereitgestellt bekommen. Die Ziele sind dabei ein System der föderalen Governance und Datendemokratie – ein freier, föderaler Umgang mit Daten innerhalb eines festgelegten, gemeinsamen Regelsystem. 

Um dieses Ziel zu erreichen ist eine sozio-technischeDatenstrategie notwendig, die die Mitarbeiter mitnimmt. Eine rein technische Lösung reicht nicht aus, sondern die Datenkultur muss sich mitentwickeln. Welche Fallstricke dabei auftreten können haben wir bereits in einem vorherigen Blog "Sechs Gründe, warum Datenstrategien scheitern" betrachtet. 

 Five1 Datendemokratie

Wie ist der Umgang mit Daten in ihren Unternehmen? Verlieren Ihre Mitarbeiter auch manchmal den Überblick über die Datenlandschaft? Vielleicht ist ein Datenkatalog ein Teil der Lösung des Problems. Melden Sie sich bei uns für einen unverbindlichen Austausch. 

 

Veröffentlich am 20.5.2022

Thema: Datenstrategie, Data Mesh, Datenplattform, Datenkatalog