Talend Quickstart für Cloud Data Lakes auf AWS verfügbar

Redwood City (US), Starnberg, 23. Nov. 2017 - Lösung unterstützt bei der schnelleren Inbetriebnahme und dem Füllen von Cloud-basierten Data Lakes...

Zum Hintergrund: Organisationen, die Geschäftsprozesse mithilfe relevanter Business-Daten optimieren wollen, erwägen häufiger den Einsatz von Data Lakes für die Erfassung und Analyse auch größter Mengen strukturierter, teilstrukturierter und unstrukturierter Daten. Big Data Anbieter Talend liefert hierzu ab sofort eine neue Quickstart-Lösung, um Cloud Data Lakes auf AWS-Plattformen (Amazon Web Services) zu betreiben. Die sofort einsatzbereite Lösung wurde laut Anbieter für Unternehmen geschaffen, die Data Lakes innerhalb kürzester Zeit bereitstellen müssen und sich dabei auch die Vorteile der Cloud hinsichtlich Geschwindigkeit, Skalierbarkeit und Leistung zunutze machen möchten. Die per Download verfügbare Lösung automatisiert über die Quickstart-Funktion den Aufbau von Data Lakes durch den Einsatz von Talend Big Data Integrationskomponenten sowie AWS-Dienste wie Amazon EMR, Amazon Redshift, Amazon Simple Storage Service (S3) und Amazon Relational Database Service (Amazon RDS).

Durch die Erfassung und Speicherung aller verfügbaren Informationen aus Quellen wie Website-Aktivitäten und Kommentare in sozialen Medien bis hin zum Internet der Dinge mit schier unzähligen Datenquellen helfen Cloud Data Lakes bei der Überwindung vieler komplexer und zeitraubender Probleme, die mit unter typisch sind für die Nutzung herkömmlicher Unternehmensanwendungen. Mit der sofort einsatzbereiten Komplettlösung sollen danach in wenigen Wochen oder Monaten aussagekräftige Informationen durch die Nutzung von leistungsfähigen AWS-Analyseservices wie Amazon QuickSight oder Amazon Machine Learning (Amazon ML) erhalten werden können (auf der Veranstaltung Amazon Re:Invent in Las Vegas zeigt Talend die Lösung in der Zeit vom 27. Nov. bis 1. Dez. 2017 auf dem Stand 607). Die neue Data Lake-Lösung bietet folgende Leistungsmerkmale:

  1. Referenzarchitektur, die mithilfe eines AWS CloudFormation-Templates automatisiert wurde und AWS-Services wie Amazon Simple Storage Service (Amazon S3), Amazon Elastic Compute Cloud (Amazon EC2) und Amazon Redshift integriert.

  2. Big Data-Integrationsplattform von Talend, die Konnektoren und Komponenten zur Anbindung von über tausend Datenquellen und Anwendungen bietet, einschließlich SaaS-Apps wie Salesforce, Bestandsanwendungen und Datenbanken, SOAP- und REST-Webservices und Streaming-Protokolle wie Kafka. Die Talend-Plattform reduziert den manuellen Programmieraufwand und kann Spark oder MapReduce nativ auf Amazon EMR ausführen.

  3. Quickstart CloudFormation-Template von Talend für Entwicklungs-, Test- und Produktionsumgebungen.

Anwenderbeispiel: Das (US) Fitness-Unternehmen Beachbody, Entwickler der P90X und INSANITY Trainings, realisierte nach vorliegenden Angaben eine Self-Service-Analytics Data Lake-Architektur in weniger als sechs Monaten unter Verwendung von Amazon S3 und Talend Realtime Big Data. Dadurch gelang es dem IT-Team von Beachbody, dass das Unternehmen den Mitarbeitern Daten in nahezu Echtzeit für schnellere Geschäftsentscheidungen zur Verfügung stellen kann, anstatt wie bislang nur einmal wöchentlich. Mitarbeiter haben nun Zugriff auf eine deutlich größere Auswahl an Daten, inklusive Website-Aktivitäten, Log-Dateien der Training-Videostreams, Call Center-Daten, externe Kundenneugewinnung, Ausgaben und Vertriebsinformationen sowie finanzielle Transaktionsdaten.

Abb. 1:  Cloud Data Lakes auf AWS (Bildquelle: Talend)


Link > Details zu Talend Cloud Data Lakes auf AWS

Link > Talend-Blog