Wenn man die unterschiedlichen Daten, die in einem Unternehmen anfallen grob kategorisiert, dann gibt es zum Einen geschäftskritische Daten, die offenkundig für den Betrieb bzw. den Erfolg des Unternehmens wichtig sind. Diese Daten sind häufig intensiv bearbeitet und unterliegen bereits sehr vielen Zugriffen durch die Anwender. Die Daten fallen hauptsächlich in ERP- und CRM-Systemen an und werden in Data Warehouse-Systemen transformiert, harmonisiert und analysiert.
Zum Anderen existieren aber auch die sogenannten ROT-Daten auf. "ROT" steht dabei für Redundant, Obsolet und Trivial. Diese Daten nehmen eine nicht unerhebliche Menge Speicherplatz in Anspruch, stellen aber keinen Geschäftswert dar.
Was aber ist jetzt Dark Data?
Bei Dark Data handelt es sich um Daten in Unternehmen, die zwar durch IT-Systeme erfasst und gespeichert, bisher aber nicht genutzt werden. Auf diese ungenutzten Daten gibt es aber keine Zugriffe und die Beschreibung ist undokumentiert, so dass eine Verwendung sehr aufwendig ist. Sehr häufig werden als Dark Data auch viele unstrukturierte Daten bezeichnet, für die die vorgenannte Beschreibung ebenfalls gilt. Auf jeden Fall ist bei Dark Data der Wert der Daten für das Unternehmen noch nicht identifiziert. Es kann sich somit sowohl um geschäftskritische Daten, als auch um ROT-Daten handeln. Im schlimmsten Fall wissen Unternehmen gar nicht, dass diese existieren oder wo und wie sie sie finden, aufbereiten, analysieren und nutzen können.
Als Beispiele für Dark Data kann man die folgenden anführen:
-
Ungenutzte Datenbanken
-
Daten aus dem Markt oder aus Umfragen
-
Log-Files von Servern
-
Daten aus Maschinen in der Produktion
-
Excel-Sheets
-
Personal- und biometrische Daten
-
E-Mails und Anhänge, die gespeichert, aber nicht verarbeitet werden
Das sind nur einige Beispiele, die auch Sie sicherlich aus Ihrem Unternehmen kennen. Die Daten sind vorhanden, aber nicht aufbereitet und damit auch nicht verwertbar.
Eine Studie des Datenauswerters Splunk von 2019 kommt zu dem Ergebnis, dass 55 Prozent der Daten eines Unternehmens so genanntes "Dark Data" ist.
Daraus ergeben sich verschiedene Probleme: Zum einen ein ungenutztes Potential, das sich in diesen Daten verbergen kann. Zum anderen können diese Daten auch rechtliche Schwierigkeiten mit sich bringen (bspw. DSGVO) und als Sicherheitsrisiko gelten. Aber wem gehören diese Daten, wer ist verantwortlich und traut sich eventuell sogar, diese zu löschen?
Das Speichern der immensen Mengen ist aber auch ein Kostenfaktor und sie verursachen riesige Mengen an CO₂. Nach einer Studie des Software-Unternehmens Veritas führen dunkle Daten im Jahr 2020 zu einem Ausstoß von 6,4 Millionen Tonnen CO₂, weil Unmengen an Datenmüll und sinnlos archivierten Daten auf Rechenzentren abgeladen werden.
Was sollten Sie mit "Ihrer" Dark Data tun?
Die eine richtige Vorgehensweise im Umgang mit Dark Data gibt es leider nicht. Aber es gibt verschiedene Hilfsmittel und Vorgehensweisen die Ihnen das Leben leichter machen. Gehen Sie dazu über Daten nur noch dort zu speichern wo sie auch durchsuchbar und damit wieder gefunden werden können. In vielen dieser Daten schlummert aber auch enormes Potential. Integrieren Sie diese in Ihren (Meta-) Daten-Katalog. Dadurch machen Sie die Daten nutzbar und gewinnen zusätzliche Erkenntnisse, die Ihnen neue Geschäftsmodelle ermöglichen oder zu einem enormen Wettbewerbsvorteil verhelfen könnten. Geeignete Housekeeping-Mechanismen die nach bestimmten Regeln für die Löschung sorgen sind sicher auch ein gutes Mittel. Erarbeiten Sie Data Governance Richtlinien für den Umgang mit ihren Daten und sorgen Sie für klare Verantwortlichkeiten.
Gehen Sie strategisch vor! Wir können Sie dabei unterstützen Ihre individuelle Datenstrategie. zu erarbeiten. In Bezug auf ihr Dark Data kann eine Mischung aus der Umsetzung einzelner Business Cases, also der Top-Down-Datenbeschaffung und der Bottom-Up-Bereitstellung sinnvoll sein. So schaffen Sie sukzessive aus einem Datensumpf ein Datenmarktplatz für Ihre Datenanalysten oder Data Scientisten und damit immer bessere Voraussetzung zur Umsetzung neuer Business Cases auf Basis der wachsenden Datenvielfalt.
Gerne unterstützen wir Sie bei der Identifikation und Aufbereitung der geschäftskritischen Daten aus Ihrer Dark Data — sprechen Sie uns einfach an.
Tags
- Datenstrategie & Data Driven Enterprise (30)
- Data Science & Advanced Analytics (29)
- Cloud Architecture & Infrastructure (24)
- SAP Technologie (14)
- Branchenlösungen & Geschäftsprozesse (6)
- Cloud Technologie (4)
- Planung & Forecasting (4)
- New Work (3)
- Business Intelligence & Visualization (1)
- Five1 Software Solutions (1)
Ähnliche Beiträge:
Erfahren Sie mehr über die 6 häufigsten Irrtümer beim Aufbau eines Data Lakes. Unser Artikel beleuchtet die Organisation unstrukturierter Daten, die Bedeutung von Metadaten und die kontinuierliche Entwicklung der Datenplattform. Entdecken Sie klare Standards, Automatisierung und Teamkommunikation für einen erfolgreichen Data Lake. Erfahren Sie mehr in unserem E-Book 'Lakehouse Automation'.