Thore

Vice President EMC Isilon EMEA

Mit Data Lakes die IT-Silos an dezentralen Standorten aufbrechen

Die Anforderungen an die IT in Niederlassungen und weltweiten Zweigstellen eines Unternehmens unterscheiden sich nicht von denen an die IT in der Zentrale. Doch auch wenn die Erwartungen gleich sind – die Voraussetzungen sind es nicht. Denn in Niederlassungen und Zweigstellen steht in der Regel nicht die gleiche Anzahl an IT-Mitarbeitern zur Verfügung wie in der Zentrale. Deshalb können Nutzeranfragen und -bedürfnisse oft nicht schnell genug erledigt werden. Zudem ist die IT selbst häufig von der Zentrale isoliert. In der datengetriebenen Welt von heute ist eine solche Isolation ein echtes Problem. Denn nur durch Konsolidierung und Integration lassen sich Kosten senken, Komplexität reduzieren, Compliance-Risiken kontrollieren und nahtlose Kundenerlebnisse bereitstellen.

Eine Möglichkeit, solche IT-Silos zu beseitigen, ist die Übernahme von Inhalten aus Niederlassungen und Zweigstellen in die Big-Data-Analyseprogramme des Gesamtunternehmens. Der so genannte Data Lake ist dabei der Schlüssel zum Erfolg, denn dieser bietet einen Weg, alle in einem Unternehmen erstellten Informationen zusammenzuführen. Dazu gehören auch Inhalte aus Quellen von Drittanbietern sowie Services. Wer meine bisherigen Blogposts gelesen hat, kennt sicher meine Überzeugung, dass Big-Data-Analytik für das Erkennen und Beseitigen von bisher nicht lösbaren Problemen und das Nutzen von neuen Trends unerlässlich ist.

silo-s_59103250

Neue Technologien machen es nun möglich, Daten aus Niederlassungen effektiv und kosteneffizient zum zentralen (Big-) Data Lake eines Unternehmens hinzuzufügen – ohne Unterbrechungen für die Nutzer und mit der Flexibilität, entsprechend der Bedürfnisse der einzelnen Anwender ein Rollback durchzuführen. Die Vorteile sind offensichtlich. Doch beim Einsatz entsprechender Lösungen für die Integration von Niederlassungen in die Data-Lake-Architektur Ihres Unternehmens sollten Sie die folgenden vier Erfolgsfaktoren berücksichtigen:

  1. Eine einheitliche Architektur erleichtert das Management und senkt die Betriebskosten. Planen Sie deshalb die Konsolidierung möglichst auf den gleichen Scale-Out-Plattformen, die bereits in Ihrem Rechenzentrum existieren oder bald existieren werden. Dadurch profitieren Sie von einem wesentlich geringeren Aufwand für den IT-Betrieb, und das zentralisierte Management erfolgt deutlich effizienter.
  2. Definieren Sie spezifische Richtlinien, die zu Ihrer Risikobewertung und Ihren regulatorischen Vorgaben passen. Die Wiederherstellungsoptionen innerhalb eines Data Lake bieten Ihnen die maximale Flexibilität zur Anpassung an branchenspezifische Anforderungen – zum Beispiel wenn Sie Ihre wichtigsten Daten an verschiedenen Zeitpunkten im Laufe eines Arbeitstags aufbewahren müssen.
  3. Achten Sie auf Multiprotokoll-Support. Vielleicht werden Sie für die Datenanalyse unterschiedliche Protokolle wie NAS, http oder Object in Betracht ziehen. Auch analytische Protokollebenen wie Hadoop oder sonstige Distributionen (Pivotal, Hortenworks, Cloudera) sollten mit einer in Betracht kommenden Plattform angestimmt sein. Das kann nur funktionieren, wenn Ihre Dateninfrastruktur verschiedene Protokolle unterstützt. Dafür eine einzige Plattform zu nutzen, ist möglich und mehr als hilfreich.
  4. Ziehen Sie den maximalen Nutzen aus Ihrer Software. Die erforderliche Hardware wird in der Regel aus Standardprodukten zusammengesetzt sein. Den eigentlichen Mehrwert liefern die Software und deren Updates. Achten Sie bei der Auswahl der Software darauf, dass sie passende Funktionen, Skalierbarkeit und Kontrollmöglichkeiten bietet. Erarbeiten Sie zudem eine Lizenzvereinbarung, die die gesamte Lebensdauer Ihres Projekts abdeckt.

Natürlich gibt es weitere Faktoren, die Sie in Betracht ziehen sollten. Was ist für Ihr Unternehmen besonders wichtig? Ich freue mich auf Ihre Beiträge dazu in den Kommentaren oder auf Twitter unter @thorerabe!