Thore

Vice President EMC Isilon EMEA

Wann brauchen Unternehmen einen Data Lake?

Big-Data-Analytik ist keine Zukunftsvision mehr, sondern bereits heute Realität. Vor allem Data Lakes bieten viel Potenzial für eine datengetriebene Business-Transformation. Bei diesem Konzept werden große Datenmengen ohne vorherige Bearbeitung im ursprünglichen Format gespeichert und stehen ohne Verzögerung für Analysen bereit. Die Ergebnisse der Datenanalysen liefern Ansatzpunkte für die Verbesserung und Erneuerung von Produkten und Dienstleistungen, geben Anstöße für einen besseren Kundenservice und für Maßnahmen, die zu einer höheren geschäftlichen Produktivität führen. Kurz: Sie helfen Unternehmen dabei, wettbewerbsfähig zu bleiben und die Anforderungen der Information Generation zu erfüllen

Doch viele CEOs sind sich nicht sicher, wie sie am sinnvollsten mit der Analyse ihrer Daten beginnen sollen. Fast jeder zweite ist davon überzeugt, dass sein Unternehmen aus Informationen und Daten wertvolle Erkentnisse gewinnen kann, weiß aber nicht, auf welchem Weg. Ein Hauptgrund dafür ist der fehlende gesamtheitliche Ansatz im Unternehmen, wenn es um die Anwendungsfälle und Geschäftsziele von Big-Data-Projekten geht. Einige Unternehmen experimentieren bereits mit einer grundlegenden Datenanalyse; doch die meisten sind noch nicht in der Lage, diese in Echtzeit und unternehmensweit durchzuführen.

Wann sollten Unternehmen also aufrüsten und in einen Data Lake investieren?

Data-Downpour

Meiner Erfahrung nach gibt es dafür vier Anzeichen:

  • Betriebskomplexität: Unternehmen möchten ihre Infrastruktur skalieren, verfügen aber nicht über genügend Personal für den Vollzeit-Support durch ihr IT-Team. Denn herkömmliche Tier-1-Datenressourcen sind nicht immer virtuell geplant – das begrenzt die zu betreuende Speichermenge pro Führungskraft.
  • Betriebskosten: Die Betriebskosten sollen sinken, aber gleichzeitig nehmen die Geschäftsanforderungen an die IT kontinuierlich zu. Die betrieblichen Gemeinkosten, die ein Aufstocken der Mitarbeiterzahl verhindern, sorgen also für wachsende Betriebskosten für das Management von IT-Ressourcen. Zur Bewältigung der Anforderungen benötigen die Abteilungen entweder mehr Personal oder sie müssen in externen Support für Überwachung, Management, Bereitstellung und Optimierung ihrer Systeme investieren.
  • Produktionssysteme: Die vorhandenen Analyseanwendungen belasten die Produktionssysteme, denn Echtzeitanalysen können extrem ressourcenintensiv sein. Egal ob es um die Auswertung von dutzenden HD-Video-Streams oder von umfangreichen Inhalten aus sozialen Medien geht – die Analysen benötigen dedizierte Ressourcen, damit sie die Leistung der Produktionssysteme nicht beeinträchtigen. Data Lakes stellen dies sicher.
  • Multiprotokoll-Analysen: Die Data-Scientists lassen Anwendungen auf verschiedenen Hadoop-Distributionen laufen, und Unternehmen müssen ihre Daten mit diesen verknüpfen. Anwender werden zukünftig Multiprotokoll-Support benötigen, denn rund um die Analytik wird weiterhin experimentiert. Diesen Faktor sollten Unternehmen in ihre Data-Lake-Strategie einbeziehen.

Data-Lake-to-the-Rescue

Natürlich unterscheiden sich die Herausforderungen von Finanzdienstleistern, Einzelhändlern, Fertigungsbetrieben und Medienunternehmen – doch wenn man von ein paar Besonderheiten absieht, gelten die oben genannten Punkte für Unternehmen in allen Branchen. Denn sie alle verweisen darauf, wie sehr IT die Geschäftswelt verändert und wie groß das Potenzial von Big Data ist.

Auch wenn nicht alle Unternehmen schon heute bereit sind für komplexe Datenanalysen, müssen sich die meisten doch darauf vorbereiten, um mittel- und langfristig wettbewerbsfähig zu bleiben. Um sie auf diesem Weg zu unterstützen, haben wir kürzlich die Data Lake Foundation als Grundlage für die Einrichtung eines Data Lake vorgestellt. Mit ihr lassen sich unstrukturierte Daten konsolidieren und Speichersilos beseitigen. Das ist wichtig, denn mit den durch Konsolidierung der Speicherinfrastruktur erzielten Einsparungen können die Unternehmen dann wieder in eine Analytik-Infrastruktur investieren, die ihnen dabei hilft, neue Produkte und Services zu entwickeln.

BAE Systems Applied Intelligence, ein britischer Anbieter von Cybersecurity-Lösungen, nutzt Big-Data-Analytik bereits. Es ist nur eine Frage der Zeit, bis auch andere Unternehmen sich für einen Data Lake entscheiden.