Unstrukturierte Daten on-premise oder doch besser in der Cloud verwalten?

München, Starnberg, 27. April 2021 - Sie sind von der starken Zunahme unstrukturierter Daten betroffen? Die Cloud hilft, aber ohne geht’s auch. Ein Beitrag von Qumulo...

Zum Hintergrund: Mit dem raschen Anwachsen von unstrukturierten Datensätzen im Multi-Petabyte-Bereich stößt das klassische NAS-Array-Modell seit geraumer Zeit sowohl an technische als auch wirtschaftliche Grenzen: dies betrifft neben den Kosten beim skalierbaren Kapazitätsausbau in Verbindung mit der erforderlichen Verfügbarkeit (n-Site-Umgebungen, Datenreplikation, Rebuild-Zeiten mit RAID 6, begrenzte Scale-out-Fähigkeiten, Lizenzkosten, Management-Overhead etc.) auch die Performance. Ingmar Löke, Director Sales DACH & Eastern Europe bei Qumulo - Anbieter einer massiv skaliebaren File Data Management Plattform für unstrukturierte Daten - weist in seinem folgenden Beitrag auf die Notwendigkeit hin, Softwareentwicklern, DevOps, IT- und Line-of-Business-Teams die Freiheit zu geben, Filedaten auf eine Weise zu nutzen, die für moderne Unternehmen und Anforderungen jeweils am sinnvollsten ist; on-premise, in der Cloud oder als hybride Implementierung.

Zum Beitrag: „Unternehmen sitzen heute auf einer wahren Goldmine von Daten: unstrukturierte digitale Assets, die den Schlüssel zu Innovationen darstellen und eine direkte Schneise zur raschen Steigerung des Geschäftswerts schlagen. Global erzeugen, nutzen und verbrauchen wir mehr Daten als je zuvor. Laut IDC soll es in den nächsten Jahren zu einer Datenexplosion in der Größenordnung hunderter Zettabytes kommen (zum Vergleich: 1 Zettabyte = 1.024 Exabyte = ~1021 Byte) kommen, wobei 80 Prozent dieses Wachstums allein auf unstrukturierte Daten zurückzuführen sind. Es tut sich also vorrangig etwas im Bereich von „unstructured Data“, der gewaltig wächst. Neue Apps und Dienste tauchen beständig auf der Bildfläche auf. Darüber hinaus finden sich Unternehmenskunden selbst immer mehr in der Erzeugerrolle umfangreicher digitaler Inhalte. Daten sind das entscheidende Bindeglied für die Umsetzung der digitalen Geschäftsstrategie sowie die Fähigkeit zur Iteration in der Art und Weise, wie Unternehmen ihre Kunden bedienen.

Unstrukturierte Daten haben Herausforderungen im Huckepack

Unternehmen werden nicht danach bewertet, wie sie jeweilige" Apps" bereitstellen. Vielmehr sind Daten die Währung. Dieser Wert kann nur freigesetzt werden, wenn Teams uneingeschränkt auf ihre jeweiligen Daten zugreifen, sie verarbeiten und sicher nutzen können. Genauso signifikant ist das nahtlose Teilen von Daten mit anderen Teammitgliedern sowie Partnern. Daten müssen mit den wesentlichen Anwendungsdiensten nutzbar sein, die in der Regel nur in der Cloud existieren. Veraltete, isolierte Systeme, die auf Hardware-First-Modellen beruhen, schaffen Barrieren und insgesamt Performance-Probleme, die Wachstumsoptionen von Unternehmen massiv einschränken. Ein nahtloser Zugriff auf die Ressourcen einer Organisation ist zwingend erforderlich, um digitale Erlebnisse maßzuschneidern sowie schnell zu innovieren. Langsamkeit ist nicht die Antwort in unserer Zeit!

Was also sind unstrukturierte Daten und wer profitiert von ihrer Nutzung?

  • Diese Art von Daten wirkt sich typischerweise auf eine Vielzahl vertikaler Branchen aus. Unstrukturierte Daten umfassen groß angelegte digitale Inhalte, etwa mit Blick auf Filme, Animationen sowie Spiele, dann auch Bilder mit hoher Auflösung, die eine Analyse und Erkennung erfordern, ferner Social-Media-Streams, Geodaten zur Analyse von Ressourcen, Protokolldateien von Geschäftssystemen, CAD-Dateien, Genomforschung – um nur einige Felder zu nennen. Unstrukturierte Daten sind beispielsweise auch der Schlüssel zur Entdeckung von Fehlern in Fertigungsprozessen: Bildanalysen liefern in in Millisekunden Ergebnisse, die sich auf den Patientenservice sowie insgesamt die Diagnosefähigkeiten im Gesundheitswesen auswirken.

  • Wenn hochqualifiziertes, geschäftskritisches Personal, das auf den Mehrwert unstrukturierter Daten angewiesen ist (etwa Forscher, Ingenieure oder auch Kreativschaffende) auf Schwierigkeiten stößt bei der Suche und Nutzung vonDaten mit Apps, sind Frustration und Projektverlangsamung vorprogrammiert. Das gewünschte Ergebnis kann dann nicht ohne massive Unterstützung durch einen Systemexperten erzielt werden. Unternehmen, die auf Ebenen jenseits der IT innovieren wollen, ist das ein erheblicher Hemmschuh. Experten, die sich in ihrem Bereich ausgebremst sehen, sind das letzte, was ein modernes Unternehmen verantworten möchte.

Viele Organisationen stehen heute vor scheinbar unlösbaren Herausforderungen

  • Die Speicherung und Verarbeitung unstrukturierter Daten muss oft in Echtzeit, und grundsätzlich immer schnell erfolgen. Unstrukturierte Daten befinden sich aber allzu oft noch in sogenannten Silos, die wiederum in Altsystemen liegen. Viele Teams befürchten, dass ihre jeweilige Infrastruktur den Anforderungen eines neuen Projekts erst gar nicht gewachsen ist. Ferner verbringen IT-Teams vielfach immer noch immens viel Zeit mit geringwertiger Datenverwaltung, anstatt ihre Geschäftsbereiche mit den benötigten Tools als Anwendungsdienste zu versorgen.

  • Selbst wenn Teams  den Flaschenhals korrekt benennen können und gerne die Vorteile breiterer Cloud-Services zur Problemlösung nutzen würden, stecken ihre Daten vielfach in On-Prem-Storage-Hardware sowie proprietären Systemen fest. Solche Teams wissen, daß Innovationen in der Cloud für bestimmte Arbeitsabläufe ihnen optimal helfen könnten, sind sich aber nicht sicher, wann - oder ob - sie jemals in der Lage sein werden, ihre Anwendungen, Daten und Workloads in die Cloud zu verlagern, ohne dass zugleich eine umfangreiche Neuarchitektur mit einer Laufzeit über Monate oder Jahre erforderlich sein wird.

Public Cloud – klassische Missverständnisse halten sich zäh

  • Klar ist, dass die Daten eines Unternehmens dorthin gehören, wo sie zu einem bestimmten Zeitpunkt für das Unternehmen und die Teams am sinnvollsten sind. Eine verbreitete Fehleinschätzung vieler Unternehmen ist heute, dass die Migration in die Public Cloud die Neuerfindung von On-Prem-Anwendungen mit Dateidaten erfordert. Aber das Neuschreiben und Ersetzen von On-Prem-Anwendungen ist nicht erforderlich, um das Unternehmen voranzubringen. Auch eine Neuentwicklung der Architektur ist nicht erforderlich.

  • Stattdessen muss neu überdacht werden, wie Dateidaten (im Sinne unstrukturierter Daten) innerhalb von Unternehmen genutzt werden, und welche Apps und Daten konkret über private oder öffentliche Clouds verschoben werden sollen. Es ist sogar möglich, Workflows und Apps in die Cloud zu bringen, selbst wenn sie nicht Cloud-nativ sind: Dateiprotokolle und APIs können genutzt werden, um Daten mit Apps zu verbinden. Dies kann durch den Einsatz einer Dateidatenplattform erreicht werden, die es ermöglicht, Daten mühelos zwischen On-Prem- und Cloud-Umgebungen und sogar zwischen öffentlichen Clouds zu bewegen.


Die Vorteile der Nutzung von unstrukturierten Daten in der Cloud

Die Antwort zu erhöhter Wertschöpfung sowie Kontrolle über Unternehmensdaten liegt in der Nutzung einer Cloud-Dateidatenplattform, die unternehmensweite Innovationen fördert, indem sie es Teams ermöglicht, reibungslos zusammenzuarbeiten und sich von bestehenden Grenzen der Datenspeicherung zu lösen. Gleichzeitig sollte die richtige Plattform sicherstellen, dass DevOps-, Line-of-Business-, IT- und Teams der Informationssicherheit allesamt den sicheren Zugriff, die Kontrolle und die Skalierung haben, um das Unternehmen bei der Innovation ohne Reibungsverluste unterstützen zu können.

Abb. 1:  Qumulo File Data Platform, Übersicht (Bildquelle: Qumulo, Software Architecture Overview, March 2021)

Und ohne Cloud herrscht Chaos?

Die kurze Antwort: Nein. Noch ist in der Cloud beispielsweise nicht alles realisierbar, da zum Teil Apps fehlen oder auch Workflows nicht etabliert sind. Qumulos zukunftsweisendes File-System etwa wurde zwar für die Cloud entwickelt und bietet in hybriden Umgebungen und einem Cloud-only Ansatz vielfältige Möglichkeiten. Dennoch blickt Qumulo im deutschen Kundenstamm auf 95 Prozent On-Premises Anwender. Qumulos Ansatz: Software-defined und supportiv im Kontext von Standard Hardware. Das schafft Flexibilität und drückt Kosten. Qumulos On-Premises Anwender nutzen das System auf Apollo- oder Quanta-Systemen von HPE lokal vor Ort. Bei Software-Updates sind alle Aktualisierungen inbegriffen, die Vorraussetzung für die jeweilige Speicher-Hardware sind. Das Ergebnis; eine Plattform mit allen Vorteilen einer integrierten Appliance. Angst vor unstrukturierten Datenmengen muß vor diesem Hintergrund auch on-Premises niemand haben.


Die Fähigkeit, unstrukturierte Daten zu nutzen, eröffnet einen Markt der Möglichkeiten

  • Ein Blick in das, was möglich wird, wenn unstrukturierte Daten in der Cloud oder lokal vor Ort beherrschbar werden, ist imposant. Ein Genomforschungslabor etwa katalogisiert und verarbeitet Millionen von genomischen Sequenzen über einen Cloud-Service mit künstlicher Intelligenz (KI) und fügt seinem Dateidatensystem Petabytes an Informationen hinzu.

  • Ein Hypothekenverarbeiter nutzt Daten, um den digitalen Antrags- und Genehmigungsprozess für Hypotheken im Minutentakt statt in Monaten zu rationalisieren. Oder aber ein Automobilhersteller scannt jedes Bauteil auf Fehler, während es die Produktionslinie entlangläuft. Dabei werden hochauflösende Bilder für die Echtzeitanalyse durch einen öffentlichen Cloud-Dienst erfasst und das Ergebnis in Millisekunden zurückgegeben. Auch schön: ein Einzelhändler sammelt sekundengenaue Daten von Einkäufen im Laden um die begehrtesten Produkte nach Region in nahezu Echtzeit zu bewerben. Die Liste ließe sich endlos fortsetzen.

Analysieren von Daten in der Cloud

  • Die einfache Bereitstellung von Daten in der Cloud erschließt Unternehmen ihre Daten ganz neu und ermöglicht das Vorantreiben innovativer Geschäftsmodelle sowie das Entwickeln zusätzlicher Einnahmequellen. Teams können die Vorteile der Flexibilität, Skalierbarkeit und des ortsunabhängigen Zugriffs nutzen, die die Cloud ermöglicht, um sich ohne Ablenkung auf grenzüberschreitende Aufgaben zu konzentrieren. Wenn sich unstrukturierte Daten in der Cloud befinden, ist es einfacher, Cloud-native Funktionen wie KI und maschinelles Lernen (ML) von Cloud-Anbietern oder anderen unabhängigen Softwareanbietern zu nutzen. Selbst mit jahrzehntelangen Daten und IP, die in älteren Systemen siloartig gespeichert sind, können Unternehmen durch die richtige Nutzung ihrer Daten alte Vermögenswerte wiederbeleben sowie völlig neue Möglichkeiten für das Unternehmen in Betracht ziehen, wie z. B. IoT-Edge-Anwendungsfälle.

  • Mit einer Dateidatenplattform, die Dateisoftware verwendet, die in der Lage ist, das gleiche Unternehmensdateisystem in der Cloud und vor Ort auszuführen, können Daten nativ und nahtlos zwischen Standorten oder über Regionen hinweg repliziert werden. Teams können mit Daten vor dem Hintergrund höchster Kapazität und Performance arbeiten und sind so in der Lage, riesige Mengen an Informationen im Handumdrehen freizugeben - mit unbegrenztem Speicher und Rechenleistung in der Cloud, ganz ohne Kompromisse bei der Verwaltbarkeit.

Fazit: Schneckentempo war gestern – Unternehmen sind gezwungen umzudenken

All dies unterstreicht: ob on-Premises oder mit Cloud-Fokus, es ist an der Zeit, sich von veralteten Lösungen zu verabschieden, an die sich Unternehmen immer noch allzu oft alternativlos binden. Softwareentwicklern, DevOps, IT- und Line-of-Business-Teams muss aber die Freiheit geben werden, ihre Dateidaten endlich auf eine Weise zu nutzen, die für moderne Unternehmen und Anforderungen am sinnvollsten ist.“


Querverweis: