Für eine Bank begleite ich architekturell den Aufbau eines zentralen Data Lakes auf Basis einer Cloud-Platform.
Ziel des Projekts ist der Aufbau eines zentralen, föderierten und unternehmensweiten Data Lakes. Auf Basis dieses Data Lakes sollen verschiedene sog. Data Driven Products zu Analyse- und Auswertungszwecken konzipiert, provisioniert und für Data Scientists bereitsgestellt werden.
Meine Aufgaben im Projekt umfassen dabei:
- Analyse der Anforderungen (insbes. Data Ingest, Data Analytics, Data Governance)
- Erarbeitung einer Entscheidungsgrundlage für die Auswahl eines geeigneten Hyperscalers
- Grobarchitektur/-konzeption für die Cloud-Plattform
- Verprobung der Architektur auf der Cloud-Plattform
- Initialer Aufbau der Cloud-Plattform für die End-to-End-Strecke: Data Ingest bis zu Data Analytics