Schwalbach, Starnberg, 26. Okt. 2012 - EMC veröffentlicht seine Greenplum Chorus Software als Open-Source-Code und kooperiert mit Kaggle…
Zum Hintergrund: Chorus ist eine (SW-)Plattform, die es Datenexperten erleichtern soll, gemeinsam an Datenanalysen zu arbeiten. Im Rahmen der Zusammenarbeit integriert EMC den Zugang zur Kaggle-Community in Greenplum Chorus. Die Kaggle-Community besteht derzeit aus ca. 55.000 Datenexperten, die sich auf Wettbewerbsbasis an der Ableitung von Vorhersagen aus einem Datenbestand beteiligen; die jeweils beste Lösung wird vom Auftraggeber des Wettbewerbs honoriert, dieser erhält im Gegenzug die Rechte an der Auswertungsmethode. Der Quellcode von Greenplum Chorus steht ab sofort über das OpenChorus-Projekt zur Verfügung. Die Integration von Chorus und Kaggle wird laut EMC voraussichtlich im November 2012 nutzbar sein.
Der Hersteller adressiert mit der Zusammenarbeit mit Kaggle nach eigenen Informationen eines der drängendsten Probleme der Branche – den Mangel an qualifizierten Datenexperten (laut der Studie „Big Data: Die nächste Herausforderung für Innovation, Wettbewerb und Produktivität“ des McKinsey Global Institute, 2011 gibt es einen Mangel an Fachkräften, der verhindert, dass Unternehmen das Potential von Big Data voll ausschöpfen können). Die Integration von Kaggle und Chorus soll es laut EMC für Unternehmen nun erleichtern, die Vorteile von Big-Data-Analysen zu nutzen. Datenexperten wiederum können ihre Erfahrung in Projekte einbringen und ihre Referenzen erweitern.
Zum Procedere: Chorus-Nutzer können über die Benutzeroberfläche in der Kaggle-Community nach Experten suchen, die sich entschieden haben, Aufträge über Chorus anzunehmen. Entsprechende Profile helfen bei der Suche nach passenden Experten. Über die Schnittstellen zwischen Chorus und Kaggle wird eine sichere Kommunikation gewährleistet, sodass Chorus Workspaces geschützt zugänglich gemacht und Nachrichten sicher ausgetauscht werden können. Die Kaggle-Experten erhalten Informationen zum geplanten Projekt und können direkt dem Chorus-Nutzer antworten, um mehr Details zu erfragen und einen Auftrag anzunehmen.
Die Chorus-Plattform stellt EMC im Rahmen des „OpenChorus“-Projekts unter Open-Source-Lizenz zur Verfügung. Das Ziel ist, die Entwicklung von Big-Data-Anwendungen zu fördern und Unternehmen die nötige Flexibilität zu geben, ihre Strategien umzusetzen. Neben Kaggle unterstützen eine Reihe von EMC Greenplum Partnern das OpenChorus-Projekt und haben angekündigt, ihre Lösungen mit Chorus zu integrieren. Dazu zählen Actuate, ADVIZOR Solutions, Alpine Data Labs, Gnip, Informatica, Pentaho, Pervasive, SAS, Syncsort und Tableau.
Zitat Anthony Goldbloom, CEO, Kaggle: „Die Partnerschaft mit EMC Greenplum eröffnet neue und spannende Möglichkeiten für die Kaggle-Community. Und es behebt den Mangel an Datenexperten, der Unternehmen daran hindert, das Potential von Big Data zu erschließen.“ Mehr dazu unter folgendem Link: