Erste Schritte mit der Data Warehouse-Modernisierung
Simon Spring, Account Director EMEA, bei WoScape skizziert, wie wir unsere Reise zur Modernisierung unserer Data Warehouses beginnen sollten.
In den letzten Jahren hat die Datenautomatisierungstechnologie wirklich den Abgrund zum Mainstream überschritten. Führende Unternehmen sehen die Automatisierung nicht mehr als netten Luxus, sondern als Notwendigkeit, um in einem zunehmend datenzentrischen Markt zu konkurrieren. Ein Bericht von IDC prognostiziert, dass die Datenerstellung bis 2025 auf enorme 163 Zettabyte (ZB) anwachsen wird, das Zehnfache der im Jahr 2017 produzierten Datenmenge.
In Erwartung des Anstiegs der Datenmenge, die Verbraucher und Unternehmen erstellen, steht die Entwicklung von Data Warehouses unter Modernisierungsdruck. Wir werden sehen, dass Automatisierung und Machine-to-Machine-Technologien den Großteil der Datenerstellung weg von traditionellen Quellen verlagern werden. Folglich sollten Unternehmen damit beginnen, eine Neuausrichtung der aktuellen Geschäftsziele, die Bereitstellung von Daten für bestehende und zukünftige Geschäftsfälle und die Nutzung neuer Plattformen und datengesteuerter Tools in Betracht zu ziehen.
Daten werden allmählich ganzheitlich mit einer unternehmensweiten Strategie betrachtet, und in den meisten Fällen ist die Automatisierung der Schlüssel.
Eine „Automation First“-Philosophie
Die Automatisierung wird zu einem zentralen Bestandteil dieses Prozesses, da sie die modernen Tools bereitstellt, die für das Design, die Entwicklung und die Verwaltung von Data Warehouses erforderlich sind. Mit einer „Automation First“-Philosophie, die die Data-Warehouse-Entwicklung leitet, können Entwickler veraltete Entwicklungsmethodik und -praktiken korrigieren. Dadurch wird es möglich, die Mängel traditioneller Ansätze zu beheben, bei denen Produktivität, Flexibilität, Wiederverwendung und Einhaltung von Standards begrenzt sind.
Dabei geht es nicht nur darum, wie viele Daten gespeichert und verarbeitet oder wie schnell daraus eine Aussagekraft abgeleitet werden kann. Das Hinzufügen von Data-Warehouse-Automatisierungssoftware zum Mix kann noch mehr Effizienz und Wert in einem viel schnelleren Zeitrahmen liefern als die manuelle Codierung oder die Verwendung nativer Tools ohne Automatisierung – tatsächlich vereinfacht es die Entwicklung, um sowohl den Aufwand als auch das Risiko bei Datenintegrations- und Infrastrukturprojekten zu minimieren. Auf diese Weise können Unternehmen ihre Bemühungen und Ressourcen darauf konzentrieren, den Unternehmen einen analytischen Mehrwert zu bieten.
Der wichtigste Wegbereiter für die Infrastruktur ist jedoch die Einführung von Cloud Data Warehousing als Lösung zur Bewältigung wachsender Datenmengen. Ein Cloud Data Warehouse ist ein Datenbankdienst, der online von einem öffentlichen Cloud-Anbieter gehostet wird. Sie verfügt über die Funktionalität einer lokalen Datenbank, wird jedoch von einem Drittanbieter verwaltet, kann aus der Ferne aufgerufen werden und ihr Arbeitsspeicher und ihre Rechenleistung können sofort reduziert oder erhöht werden.
Ganz im Gegensatz zu herkömmlichen Ansätzen haben diese Cloud-basierten Dienste Organisationen in die Lage versetzt, nur für die Ressourcen zu bezahlen, die sie benötigen. Daher bieten Data Warehouses, die auf einer Cloud-Infrastruktur aufbauen, eine Grundlage für die Modernisierung in Unternehmen, die sich der datengesteuerten Exzellenz verschrieben haben.
Cloud Data Warehousing bringt zusätzliche Vorteile für analytische Dateninfrastrukturen, von Agilität und Kosteneffizienz bis hin zu Skalierbarkeit und Leistung. Und insbesondere der Aufbau eines Cloud-basierten Data Warehouse mit den Vorteilen der Automatisierung ermöglicht es Endbenutzern, neue Analysekomponenten zu entwerfen oder zu prototypisieren, ohne große Geldsummen für die Infrastruktur ausgeben zu müssen. Dies beschleunigt neue Infrastrukturprojekte und erhöht die Entwicklungs- und Betriebskapazitäten.
Was bei der Auswahl eines Cloud Data Warehouse zu beachten ist
Die Wahl einer Cloud-Data-Warehouse-Lösung sollte mit einer Kostenanalyse beginnen, um abzuschätzen, wie viel Geld das Unternehmen dadurch einsparen könnte. Verschiedene Cloud-Anbieter haben unterschiedliche Preisstrukturen, mit etablierteren Namen wie Amazon und Microsoft, das Vermieten von Knoten und Clustern, sodass jeder Benutzer einen definierten Bereich des Servers hat. Dies macht die Preisgestaltung vorhersehbar und konstant, kann jedoch ein Nachteil sein, da gemeinsam genutzte Server manchmal gewartet werden müssen.
Andere moderne Cloud-basierte Data-Warehouse-Plattformen wie Snowflake bieten elastische Rechenfunktionen, mit denen Unternehmen sicherstellen können, dass sie einfach anpassen können, wo und wie die Ressourcen, z. B. Kosten, verwendet werden. Das ultimative Ziel ist es, das Design, die Entwicklung, die Bereitstellung und den Betrieb von Data Warehouses schneller und kostengünstiger zu gestalten, damit Teams Projekte in Stunden und Tagen liefern können.
Jeder Cloud-Anbieter verfügt über seine eigene Suite von unterstützenden Tools für Funktionen wie Datenmanagement, Visualisierung und Predictive Analytics, daher sollten diese Anforderungen bei der Entscheidung für einen Anbieter berücksichtigt werden.
Durch das Verständnis der Vorteile und Optionen, die bei der Modernisierung des Data Warehouse verfügbar sind, können Unternehmen effektive Strategien entwickeln, die nicht nur die Auswahl von Tools und Datenmigrationsprozessen optimieren, sondern auch eine effektive Koordination zwischen Teams und Stakeholdern aufbauen. Die Modernisierung des Data Warehouse und der Blick auf die Cloud können einen transformativen Effekt haben; Unterstützung von Unternehmen beim Zustrom von Big Data, Automatisierung manueller Prozesse und Maximierung der Rentabilität von Cloud-Investitionen.