DSGVO-konforme Data Lake Lösung von MapR und Talend angekündigt

San Jose/Redwood City (CA), Starnberg, 28. Juli 2017 - Das Jahr der Metadaten! Wie sich wesentliche Anforderungen der EU-Datenschutzverordnung erfüllen lassen...

Zum Hintergrund: MapR Technologies, Inc. und Talend haben eine gemeinsam entwickelte Data Lake - Lösung vorgestellt. Sie unterstützt Anwender, die Anforderungen der im Mai 2018 in Kraft tretenden Datenschutz-Grundverordnung (DSGVO) der EU zu erfüllen. Mit der neuen Lösung können Unternehmen einen sog. Governed Data Lake aufbauen, der die Anforderungen der DSGVO an Datenspeicher, Inventar, Datenschutz, Aufbewahrung, Portabilität und Sicherheit erfüllt (1). Data Lakes ermöglichen die Zentralisierung der Unternehmensdaten und hierzu gehören personenbezogene Daten, die beispielsweise unterschiedlichen Quellen wie Banken, sozialen Medien, Anbieter von Gesundheitsdienstleistungen entstammen können. Unter Verwendung der Lösung von MapR und Talend lassen sich Governed Data Lakes aufbauen, die Konformitätsprobleme im Zusammenhang mit den folgenden Aspekten lösen:

  • Datenklassifizierung und Datenherkunft
  • Datenerfassung und -integration
  • Datenanonymisierung
  • Selfservice-Kuratierung und -Zertifizierung
  • Portabilität und Zugänglichkeit von Daten

Die MapR Converged Data Platform kombiniert Analytics und betriebliche Vorgänge; die Lösung für große Unternehmen verbindet dazu Big-Data- und Open-Source-Technologien mitnativem Zugang zu globalem Event-Streaming, Echtzeitfunktionen für Datenbanken und Storage im Cloudmaßstab. Die Plattform bietet verschiedene Funktionen zur Erfüllung der DSGVO-Vorgaben wie MapR Volumes, das personenbezogene Daten logisch gruppiert und nachfolgend sofort Richtlinien und Berechnungen darauf anwendet. Dazu kommen leistungsfähiges Auditing zur Protokollierung des Datenzugriffs  sowie Spiegelung und Replikation, um die Spuren „portabler“ Daten einfacher nachvollziehen zu können.

Die Talend Data Fabric Datenintegrationsplattform unterstützt MapR Streams nativ. MapR Streams hilft Anwendern, die Eventverarbeitung datenbankübergreifend und kontinuierlich zu synchronisieren, sobald Daten aktualisiert werden. So entstehen korrekte und aussagekräftige Informationen in Echtzeit. Talend kombiniert zudem Datenqualität, Metadatenmanagement, Data Stewardship, Datenherkunft und Big Data Integration, um das Erfassen, Standardisieren, Zusammenführen, Zertifizieren, Schützen und Verbreiten personenbezogener Daten zu erreichen.

Abb. 1: Data Integration Platform (Bildquelle: Talend)


Link > Talend Blogpost zur DSGVO

(1) Quellenangabe

Gemäß DSGVO müssen multinationale Unternehmen belegen können, dass die Erfassung, gemeinsame Verwendung sowie Verwaltung aller personenbezogenen Daten auf kontrollierte und rechtmäßige Weise erfolgt. Link > https://en.wikipedia.org/wiki/General_Data_Protection_Regulation

Nach Meinung von Industrieanalysten wie Gartner werden bis Ende 2018 mehr als 50 Prozent der Unternehmen, die von der DSGVO betroffen sind, die Vorgaben der Verordnung noch nicht erfüllt haben (Quelle: Bart Willemsen, „Gartner Insight: Focus on Five High-Priority Changes to Tackle the EU GDPR“. Publiziert im September 2016: G00311301).