Thursday Mar 12, 2026

#89: ROC around the clock – Alles rund um Gütemaße für Klassifikationsmodelle

In dieser Episode des Data Science Deep Dive sprechen Mira und Amit über Modellgütemaße für binäre und kategoriale Zielvariablen. Sie erklären zentrale Kennzahlen wie Accuracy, Precision, Recall, F1-Score, AUC und Log Loss und zeigen, welche Vor- und Nachteile diese im praktischen Einsatz haben. Dabei geht es auch um typische Herausforderungen, etwa bei unbalancierten Daten oder der Wahl des richtigen Schwellenwerts. Anhand von Beispielen aus Betrugserkennung, Medizin und Spam-Filtering wird deutlich, warum die Wahl des passenden Gütemaßes immer vom konkreten Use Case abhängt. Ergänzend geben sie Tipps zur Interpretation von Modellergebnissen und zur Auswahl eines geeigneten Hauptgütemaßes.

**Zusammenfassung**

  • Überblick über Modellgütemaße für binäre und kategoriale Klassifikationsprobleme
  • Einordnung: Klassifikation basiert meist auf Scores bzw. Wahrscheinlichkeiten und einem gewählten Schwellenwert
  • Konfusionsmatrix als Grundlage zur Berechnung vieler Klassifikationsmetriken (TP, TN, FP, FN)
  • Accuracy als einfache Kennzahl – jedoch problematisch bei stark unbalancierten Datensätzen
  • Precision, Recall und Spezifität zur Bewertung verschiedener Fehlertypen und deren Kosten
  • F1-Score als harmonisches Mittel von Precision und Recall, häufiges Hauptmaß bei unbalancierten Daten
  • AUC als schwellenwertunabhängige Bewertung der Trennfähigkeit eines Modells
  • Log Loss zur Bewertung der vorhergesagten Wahrscheinlichkeiten und als häufige Loss-Funktion beim Modelltraining
  • Praktische Tipps: Wahl des Thresholds, Nutzung von Benchmarks, Analyse von Subgruppen und ggf. Rekalibrierung von Wahrscheinlichkeiten

**Links**

📬 Fragen, Feedback oder Themenwünsche?
Schreibt uns gern an: podcast@inwt-statistics.de

Comment (0)

No comments yet. Be the first to say something!

Copyright 2024 All rights reserved.

Podcast Powered By Podbean

Version: 20241125