Mobile logo

26.08.2021

Techtalk: Lakehouse – die moderne EAP

Podcast mit Daniel Yu & Andy Langner

Dieser Abschnitt enthält Inhalte von Drittanbietern, die Cookies verwenden. Bitte akzeptiere alle Cookies in den Cookie-Einstellungen, um den Inhalt anzeigen zu können.

In der dritten Episode unserer Reihe "Ein Gespräch unter IT-Experten" geht es um das Thema Enterprise Analytics Plattform (EAP) gestern und heute. Unsere zwei Experten Daniel Yu und Andy Langner sprechen darüber, wie aus DWH und Data Lake das Lakehouse wird und was die Do's und Dont's sind, wenn eine Analytics Plattform eingeführt werden soll.

Hör rein!

Dieser Abschnitt enthält Inhalte von Drittanbietern, die Cookies verwenden. Bitte akzeptiere alle Cookies in den Cookie-Einstellungen, um den Inhalt anzeigen zu können.

Das Gespräch von Daniel und Andy | Key Take Aways

Unsere beiden Experten haben sich über drei Fragen unterhalten und Erfahrungen aus ihren Projekten ausgetauscht. Die Zusammenfassung davon finden Sie nachfolgend:

Am Anfang war das DWH, dann kam der Data Lake und die Analytics Plattform. Und jetzt?

DWH und Data Lake haben unterschiedliche Stärken und Schwächen. Sie decken verschiedene Anforderungen ab und daher existiert in vielen Architekturen beides nebeneinander.

Die aktuelle Entwicklung ist: Beides enger miteinander zu verzahnen bzw. eine integrierte Lösung anzubieten. So kam teilweise der Begriff Lakehouse (aus Data Lake und Data Warehouse) auf, welcher von verschiedenen Anbieter für unterschiedliche Produkte benutzt wird. Zudem zeichnet sich ab, dass die Bottom Line DWH und Data Lake immer mehr zusammenwachsen.

Was wäre die Empfehlung an einen Auftraggeber, welcher Bedenken äussert, dass er den Überblick über die Nutzung seiner Daten verliert?

Data Governance ist ein wichtiges Thema und sollte bereits zu Beginn bzw. beim Aufbau der Plattform berücksichtigt werden. Ein nachgelagerter Aufbau ist immer aufwändiger und teurer. Mit einem Data-Governance-Konzept werden u.a. folgende Themen adressiert:

  • Data Sharing unter den Teams
  • Data Lineage
  • Data Security etc.

Um den Überblick über die Daten im Data Lake zu behalten, hilft zudem auch ein Data Catalog. Darin werden die Daten klassifiziert, Daten können damit gesucht und Zugriffe verwaltet werden.

Was sind die wichtigsten Do’s und Don’ts wenn ein Unternehmen eine Analytics Plattform einführen will?

  • Do: Bei der Einführung der Data Lake Technologie sollten mixed Teams eingesetzt werden. D.h. es sollten technische und fachliche Mitarbeitende zusammengebracht werden um eine erfolgreiche Lösung zu erarbeiten.
  • Don’t: Der Data Lake darf definitiv nicht als Ersatz des DWH gesehen werden.

Hast du auch einen spannenden Use Case? Let's talk!