In unserer Blogreihe zu Konzepten und Fragen der modernen Datenhaltung beschäftigen wir uns heute mit einer drängenden Frage zum Thema Zukunftsfähigkeit. In vielen Unternehmen steht die Weiterentwicklung der Dateninfrastruktur an oder ist bereits im Gange. Um für die Zukunft gerüstet zu sein sind moderne Ansätze nötig, aber die bestehenden Legacy-Systemen können nur schrittweise aktualisiert werden und müssen in der Dateninfrastruktur als zentrales Element mitberücksichtigt werden. 

Die Lösung für solche Fälle ist häufig Datenvirtualisierung. Dabei werden unterschiedlichste Datenquellen in einer Zwischenschicht zusammengefasst (abstrahiert), gemeinsam verwaltet und abgerufen. Die Daten selbst sind damit nur virtuell eingebunden und werden nicht in die Zwischenschicht repliziert, stattdessen werden Zugriffe an die jeweilige Quelle durchgereicht. 

Aufgrund der zusätzlichen Komplexität einer Datenvirtualisierungsschicht stellt sich die Frage: 

Ist Datenvirtualisierung nur ein notwendiges Übel um den Übergang von Legacy-Systemen zu modernen Dateninfrastrukturen zu handhaben? 

Tatsächlich existieren Virtualisierung und Abstraktion in Datenbanken nahezu seit es elektronische Datenbanksysteme gibt. Das Konzept ist also keinesfalls neu, sondern hat sich seit rund 70 Jahren bewährt. Daher bietet, mit wenigen Ausnahmen, jede Datenbank VIEWS zum virtuellen Datenzugriff. Aktuelle Konzepte der Datenvirtualisierung, wie beispielsweise von Denodo angeboten, erweitern dieses klassische Prinzip lediglich. 

 

Datenvirtualisierung erleichtert technische Übergänge 

Weiterentwicklung und Übergänge zu neuen Systemen wird es immer geben. Was heute als hochmodernes System bezeichnet wird, dürfte in 10 Jahren Standard sein und in 20 Jahren als Legacy gelten. Die Entwicklung geht stets weiter. Neue, unerwartete Erfindungen machen es sehr schwierig bis unmöglich den technischen Fortschritt genau vorherzusagen. Ein für die Zukunft gerüstetes System zeichnet sich daher durch Erweiterbarkeit aus und ermöglicht es neue, ganz unterschiedliche Konzepte anzubinden. Diese Anforderung kann Virtualisierung erfüllen. Ist Virtualisierung daher sogar ein „dauerhaftes Übel“? 

 

Datenvirtualisierung bringt Daten zusammen 

Keinesfalls! Denn Datenvirtualisierung bietet noch einige weitere Vorteile als nur alt und neu zu integrieren. Verschiedene Probleme erfordern verschiedene technische Ansätze und Lösungen. Diese wieder unter ein Dach zu bringen, erfordert zwangsläufig eine Zwischenschicht, den sogenannten vereinigten semantischen Layer. Dieser verknüpft die verschiedenen Datenquellen und stellt sie für Business-Nutzer aufbereitet zur Verfügung. Das klassische Data Warehouse oder ein Data Lake kann eine solche Aufgabe übernehmen. Für die heute anfallenden vielfältigen Daten in großen Mengen sind beide nicht ideal, wie wir in einem vorherigen Blog vorgestellt haben. Eine virtuelle Datenschicht umgeht diese Probleme und spart noch Kosten, da sie selbst keine Daten speichert oder verarbeitet. Sie verwaltet lediglich Daten. So kann für jede Aufgabe die ideale technische Basis gewählt werden und zusätzlich profitiert das Unternehmen als Ganzes von der verbesserten Zusammenarbeit in einer gemeinsamen Plattform. Die Trennung von Daten sinkt, wodurch die Time-to-Insight oder Time-to-Solution sinkt und es leichter wird das volle Potential der Daten zu heben. 

 

Datenvirtualisierung als Basis für eine verbesserte Datenkultur 

Eine zentrale Plattform mit virtualisiertem Datenzugriff bietet außerdem eine starke technische Basis für eine weiterentwickelte Datenkultur und moderne Datenstrategien im Unternehmen. So sind in einem Data Mesh Produktion und Konsum von Daten dezentral organisiert, aber es gibt eine gemeinsame Anlaufstelle für das Verteilen, Auffinden und Verwalten von Datenprodukten. Diese Aufgabe eines Datenkatalogs mit föderierter Governance decken virtualisierte Datenplattformen mit wenig Overhead ab. Auf die Anforderungen von Datenkatalogen und wie Virtualisierung dafür hilfreich ist gehen wir in einem zukünftigen Blog noch genauer ein. 

Zusammenfassend ist Datenvirtualisierung also keinesfalls ein notwendiges Übel, sondern eine pragmatische Lösung für heutige Probleme und dabei noch gerüstet für zukünftige Entwicklungen. 

Sie haben noch weitere Fragen zur Virtualisierung von Daten, Datenstrategie oder Datenkultur? Lassen Sie uns darüber reden, wie wir Ihnen helfen können Ihren Umgang mit Daten zu verbessern. 

Veröffentlich am 10.8.2022

Thema: Datenstrategie, Data Mesh, Datenplattform