Data Vault Automatisierung zur möglichst optimierten Verwaltung von Big Data

München, Starnberg, 17. Dez. 2019 - Die Digitale Transformation zwingt Unternehmen sich mit Big Data auseinanderzusetzen; Data Vault Automatisierung gewinnt an Bedeutung...

Zum Hintergrund: IT-Teams sehen sich hinsichtlich Datenverwaltung, -schutz und -verarbeitung vor diverse Herausforderungen gestellt, denn immer mehr Daten wollen gespeichert und bearbeitet werden; dies betrifft gerade die Wirtschaftlichkeit der Datenspeicherung. Die Nutzung eines Data Vaults mit automatisiertem Datenmanagement kann Unternehmen helfen, diese Herausforderungen auch mit kleinen IT-Teams zu bewältigen. Daniel Linstedt (1) entwickelte dazu das Data Vault 2.0 Modelling System für Business Intelligence und weist in seinem folgenden Beitrag auf die Bedeutung von Automatisierung zur besseren Verwaltung von Big Data hin:

Big Data war bisher eine Teildisziplin der IT, mit der sich tendenziell eher nur Großunternehmen beschäftigen mussten. Für kleinere Unternehmen war die Datenverwaltung trotz wachsender Datenmenge meist noch überschaubar. Doch die Digitale Transformation macht auch vor Unternehmen nicht halt, die das komplizierte Feld Big Data bisher anderen überlassen haben. IoT-Anwendungen lassen die Datenmengen schnell exponentiell anschwellen. Und während IT-Teams die Herausforderung der Speicherung großer Datenmengen meist noch irgendwie in den Griff bekommen, hakt es vielerorts, wenn es darum geht, aus all den Daten Wert zu schöpfen.

Auch das Knowhow für die Anforderungen neuer Gesetzgebung, wie der DSGVO, ist bei kleineren Unternehmen oft nicht auf dem neuesten Stand. Was viele IT-Teams zu Beginn ihrer Reise in die Welt von Big Data unterschätzen, ist zum einen die schiere Größe und zum anderen die Komplexität der Datensätze. Auch der benötigte Aufwand, um berechtigten Zugriff auf Daten sicherzustellen, wird oft unterschätzt.

Data Vaults helfen, Daten besser zu organisieren

"Eine der Möglichkeiten, wie Unternehmen Daten besser organisieren können, ist eine Data-Vault-Umgebung. Ein Data Vault ist eine Methodik aus dem Data-Warehouse, die entwickelt wurde, um Informationen aus mehreren verschiedenen Teams und Systemen in einem zentralen Ort zusammenzuführen. Ein Data Vault bietet eine Grundlage für Informationen, die Teams zur Entscheidungsfindung nutzen können. Er umfasst alle Unternehmensdaten und stellt sicher, dass keine Informationen übersehen werden.

Obwohl ein Data-Vault-Design generell ein Zeichen für eine moderne Speicherarchitektur ist, ist es doch nur ein Fundament, auf dem das „Big-Data-Haus“ aufgebaut wird. Auf diesem Fundament können Entwickler die Struktur des Data-Vaults später manuell weiterentwickeln. Dieser manuelle Aufbau einer Data Vault-Umgebung, die alle Datenschutzbestimmungen erfüllt, kann aufgrund der hohen Komplexität jedoch sehr aufwendig und fehleranfällig sein. Hier setzt die Automatisierung von Data Vaults an, die sich automatisch um einen Großteil der Dateninfrastruktur eines Unternehmens kümmern kann.


Abb. 1: Data Vault 2.0 Modelling (Bildquelle: Dan Linstedt / WhereScape).

Anmerkung: Die Methode des 'Data Vault 2.0 Modelling' ist ein hybrider Ansatz, der laut Entwickler die besten Aspekte des Designs von Third Normal Form (3NF) und Sternschema kombiniert. Obwohl fertige Datenspeicher viele Vorteile bieten, erfordert das Entwerfen und Entwickeln von Hand viel Zeit, Aufwand und damit Geld. Die Automatisierung von Datentresoren hilft, schnell und risikoarm in die Produktion zu gelangen. Das IT-Team kann neue Lösungen liefern und bestehende so schnell ändern, wie das Unternehmen sie benötigt.


Automatisierung von Data Vaults

Damit die Automatisierung des Data Vaults einen hohen Prozentsatz der Dateninfrastruktur eines Unternehmens abdecken kann, werden heutzutage die standardisierten Vorlagen und die hohen Anforderungen der Data-Vault-2.0-Methodik genutzt. Diese Methodik stellt den Kern eines Data Vaults dar, der zuverlässige und konsistente Metadaten verwendet, um sicherzustellen, dass alle Informationen, einschließlich personenbezogener Daten jederzeit überwacht werden können. Über diesen Kern hinaus können interne Entwicklerteams ihr Augenmerk auf die 5 bis 10 Prozent der Teile der Data-Warehouse-Umgebung legen, die einen maßgeschneiderten Ansatz erfordern.

Die Ergebnisse der Automatisierung eines Data Vault sprechen für sich: Mit diesem Konzept kann ein global agierender Konzern seine Datenarchitektur in einer Woche aufbauen, was früher oft ein halbes Jahr dauerte. Im Zeitalter von Big Data, in der sich die Datenströme häufig ändern, bietet der Ansatz der Automatisierung des Data Vaults einen hohen Grad an Flexibilität. Darüber hinaus stellt die Automatisierung sicher, dass der Schutz personenbezogener Daten dank Verfolgung von Metadaten in den Prozess der Datenerfassung integriert ist.

Fazit

Risiken zu minimieren und Organisationen flexibler zu machen sind offensichtliche Ziele für jedes Unternehmen. Aber was bedeutet das im Detail für das IT-Team? In Bezug auf Unternehmensdaten bedeutet es, dass man möglichst schnell einen möglichst hohen Wert aus diesen schaffen muss. Die Nutzer, die mit Daten arbeiten, müssen sich darauf verlassen können, dass das IT-Team eine verlässliche Ressource für die Bereitstellung von Ergebnissen ist, die auf Daten basieren, die allen modernen Anforderungen entsprechen.

Unternehmen, die der Aufgabe gegenüberstehen, immer mehr Daten verantwortungsvoll zu speichern und zu bearbeiten, wählen heute oft einen Data Vault, um all die Daten in einem zentralen Ort zu konsolidieren. Um das Datenmanagement in einer solchen Umgebung effizient zu gewährleisten, sollten sich diese Unternehmen mit den Möglichkeiten der Automatisierung des Data Vaults auseinandersetzen."

(1) Foto: Dan Linstedt.


Querverweise: