Data Science Deep Dive

Wir machen Data Science. Und in unserem Podcast Data Science Deep Dive reden wir darüber. Du bist ebenfalls Data Scientist oder interessierst dich für Daten, ML und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten. Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in über 10 Jahren als Data Scientists im B2B Bereich gesammelt haben. Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt. Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.

Listen on:

  • Apple Podcasts
  • Podbean App
  • Spotify
  • Amazon Music

Episodes

#14: Kubernetes

Thursday Dec 22, 2022

Thursday Dec 22, 2022

Kubernetes ist ein Open-Source-System, das für die Verwaltung und Bereitstellung von containerisierten Anwendungen verwendet wird. In dieser Episode besprechen wir, wie Data Scientists Kubernetes nutzen können, um ihre Arbeitsabläufe zu optimieren, ihre Projekte skalierbar & zuverlässig zu machen und wie Kubernetes speziell unseren Arbeitsalltag verändert hat.
Links:
Die Welt der Container: Einführung in Docker

#13: Datenqualität

Thursday Dec 08, 2022

Thursday Dec 08, 2022

"Garbage In, Garbage Out" hat auch in der Data Science Praxis eine hohe Relevanz: ein Modell kann nur so gut sein, wie die Daten auf denen es basiert. In dieser Episode sprechen wir darüber, wie Probleme mit der Datenqualität aufgedeckt werden können und welche Strategien es gibt, um Datenqualität in Projekten konsequent sicherzustellen.
Links:
https://www.inwt-statistics.de/blog-artikel-lesen/Datenqualitaet.html

Thursday Nov 24, 2022

In dieser Episode berichten wir über ein aktuelles Projekt für die Senatsverwaltung für Umwelt, Mobilität, Verbraucher- und Klimaschutz (SenUMVK). Hierbei geht es um die Vorhersage der Luftschadstoffbelastung (NO2, PM2.5, PM10) in Berlin. Auf einem 50 x 50m Raster über Berlin erstellen wir für jede Zelle stündliche Prognosen für jeden der 3 Schadstoffe. Wir erzählen euch etwas über die zugrunde liegenden Daten und den Modellierungsansatz und berichten über Lessons Learned in diesem Projekt.
Artikel auf der Seite des übergeordneten eUVM-Projektes:
https://testfeldstadtverkehr.berlin/prognose-von-luftschadstoffen-in-berlin/

#11: Real Time Analytics

Thursday Nov 10, 2022

Thursday Nov 10, 2022

Bei vielen Unternehmen fallen Daten bereits in Echtzeit in der Datenbank an, aber Real Time Analytics ist noch die Ausnahme. Was genau bedeutet Real Time Analytics und was für Implikationen hat es auf die Architektur? Lohnt es sich Real Time Analytics zu implementieren?
Links:
Emerging Architectures for Real-Time Analytics in Applications: https://softwareengineeringdaily.com/2021/06/15/emerging-architectures-for-real-time-analytics-in-applications/
How Uber scaled its Real Time Infrastructure to Trillion events per day: https://www.youtube.com/watch?v=K-fI2BeTLkk

#10: Signifikanz

Thursday Oct 27, 2022

Thursday Oct 27, 2022

Das Thema der Signifikanz ist ein - wenn nicht der - Grundbaustein der Statistik. In dieser Episode widmen wir uns dem Konzept dieses statistischen Standard-Werkzeugs und klären vor allem welche Rolle Signifikanz im Bereich Data Science und Machine Learning spielt.
Links:
Silver, N. (2012). The Signal and the Noise: Why So Many Predictions Fail-but Some Don't. USA: Penguin Publishing Group.

Thursday Sep 15, 2022

Wie managt man ein Data Science Projekt richtig? Natürlich braucht es auch in einem Data Science Projekt Führung und Koordination. Wir erklären das Konzept von Project Ownership und wie unser nicht ganz so einfacher Weg dorthin aussah. Besonders beschäftigt hat uns hier die Frage, wer eigentlich gut als Project Owner geeignet ist. Sollte es ein Data Scientist sein oder eine reine Führungskraft? Und was sind die Aufgaben und Herausforderungen eines Project Owners?

Thursday Sep 01, 2022

Der Customer Lifetime Value (CLV) ist eine bekannte Kennzahl im Bereich Online Marketing. Wir schauen hinter die Kulissen und zeigen wie wir ein CLV-Projekt umsetzen und was das eigentlich mit Data Science zu tun hat. Was genau misst der CLV, wie wird er berechnet und was ist zu beachten?
White Paper zum Thema Customer Lifetime Value (CLV):
Download: Der Kundenlebenswert als zentrale Kennzahl für die unternehmensseitige Aussteuerung der Kundenbeziehung

#7: Data Culture

Thursday Aug 18, 2022

Thursday Aug 18, 2022

Die Kultur in einem Unternehmen ist ein latentes, organisch gewachsenes Gebilde. Und so schwer sie zu greifen oder zu beeinflussen ist, so wichtig ist sie für den Erfolg von Data Science Projekten. Doch warum spielt sie eine solch enorme Rolle und was macht denn eigentlich eine fruchtbare Data Culture aus? Wie kann man einen Kulturwandel anstoßen?

Wednesday Aug 03, 2022

Hat die Statistik so langsam ausgedient? Dass der Begriff der "Statistik" angestaubt ist, steht außer Frage. Und obwohl es durchaus Gemeinsamkeiten zwischen Statistik und Machine Learning gibt, so liegt der Teufel doch wie immer im Detail. Wir decken auf, welche Unterschiede es gibt und klären, ob Machine Learning die Statistik abgelöst hat.
Links:
Tyler Vigen - Spurious Correlations
Buch Download: An Introduction to Statistical Learning
In-depth introduction to machine learning in 15 hours of expert videos 
Baba Brinkman - Data Science Music Video 

Wednesday Jul 20, 2022

Es gibt viele spannende Technologien um Daten zu halten und zu bewegen. Wenn man noch keine Data Plattform oder Data Warehouse hat, welchen Ansatz sollte man dann verfolgen?
Wir sprechen über:
SQL-Datenbanken
BI Cubes
Data Warehouses
Data Lakes
Data Mesh
Links:
Amazon Web Services - Was ist ein Data Lake?
Data Mesh and Lakehouse - Matei Zaharia, Databricks

Data Science Deep Dive

Wir machen Data Science. Und in unserem Podcast Data Science Deep Dive reden wir darüber.

Du bist ebenfalls Data Scientist oder interessierst dich für Daten, ML und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.

Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in über 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.

Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.

Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.

Copyright 2024 All rights reserved.

Podcast Powered By Podbean

Version: 20241125