Blog Background

Maschinelles Lernen im Einzelhandel: Was muss für eine effektive Prognose tatsächlich berücksichtigt werden

Alle wollen Umsatzprognosen erstellen. Aber nur wenige denken darüber nach, was das Modell tatsächlich sieht, wenn es die Daten betrachtet. Maschinelles Lernen ist für den Einzelhandel zu einem Muss geworden: Nachfragemodelle und personalisierte Aktionen – das klingt alles sehr vielversprechend.

Trotz der hohen Erwartungen bringen die meisten Modelle jedoch entweder keine spürbaren Ergebnisse oder funktionieren nur in einem begrenzten Umfeld. Dies bestätigt auch die systematische Studie „Why Big Data Projects Fail“, wonach mehr als 80 % der Initiativen im Zusammenhang mit Big Data und ML scheitern. Und das liegt nicht an schwachen Algorithmen oder inkompetenten Teams. Es ist einfach so, dass Modelle sehr oft auf Daten basieren, die den tatsächlichen Kontext nicht berücksichtigen.

In diesem Artikel werden wir untersuchen, warum selbst die fortschrittlichsten Zeitreihenmodelle in grundlegenden Dingen falsch liegen können. Und was muss berücksichtigt werden, damit Prognosen wirklich bei der Entscheidungsfindung helfen, anstatt sie nur zu imitieren?

Die Illusion der Daten: Warum Zahlen nicht alles sind

Stellen wir uns eine klassische Situation vor: Ein Analyst erhält eine Tabelle mit historischen Verkaufszahlen. Die Daten sind täglich, für jede SKU, mit der Anzahl der Einheiten. Formal gesehen ist dies eine ideale Zeitreihe für Prognosen: Alles sieht übersichtlich, logisch und strukturiert aus.

In dieser Phase beginnt meist die Entwicklung des Modells. Dabei ist es nicht so wichtig, welche Zeitreihenarchitektur dafür verwendet wird, denn viel wichtiger ist etwas ganz anderes: Was genau sieht das Modell?

Und normalerweise sieht es nur eine Seite der Ereignisse – das Ergebnis. Die Verkaufszahlen.

Dabei weiß es nicht, dass:

  • In einigen Geschäften gab es in diesen Tagen physisch keine Waren in den Regalen;
  • Für einige SKUs gab es eine zeitlich begrenzte Aktion „2 zum Preis von 1“, über die in der Datensammlung nichts gesagt wird;
  • Es gab keine Konkurrenzprodukte, was das Kaufverhalten stark veränderte;
  • Das Produkt wurde näher an die Kassen gerückt oder erhielt eine Bannerwerbung auf der Startseite der Website;
  • Der SKU-Code oder die Verpackung hat sich geändert, aber in den Daten wird dies als dasselbe Produkt angezeigt.

Aus Sicht des Algorithmus sind das alles nur Zahlen: Es gab einen Höhepunkt, es gab einen Rückgang. Die meisten ML-Modelle im Einzelhandel basieren auf Verkäufen, und das ist logisch: Denn Verkäufe sind das Endergebnis der Interaktion zwischen Produkt und Käufer. Aber genau hier liegt der grundlegende Fehler: Der Verkauf ist eine Folge, nicht die Ursache. Hinter den Umsatzschwankungen könnten Umstände stehen, die in keiner Weise mit der tatsächlichen Nachfrage nach dem Produkt zusammenhängen.

Das Modell beginnt, ein Verhalten vorherzusagen, das sich in der realen Welt niemals wiederholen wird. Denn es basiert auf Ausnahmen und nicht auf Gesetzmäßigkeiten.

Was für eine qualitativ hochwertige Prognose wichtig ist

1. Verfügbarkeit der Ware (stock availability)

Wenn die Ware nicht im Regal war, ist es logisch, dass es auch keine Verkäufe gab. Das bedeutet jedoch keineswegs, dass keine Nachfrage nach ihr bestand, sondern lediglich, dass der Käufer keine Möglichkeit hatte, einen Kauf zu tätigen. Und wenn das Modell in diesem Zeitraum „lernt”, interpretiert es das Ausbleiben von Verkäufen fälschlicherweise als mangelndes Interesse.

Daher muss das Modell unbedingt über einen vollständigen Bestand an Restbeständen verfügen. Andernfalls ist die Prognose falsch.

2. Werbeaktionen und Rabatte

Aktionen, Ausverkäufe, Gutscheine, 2+1, Push-Benachrichtigungen, Banner, neue Verpackungen – all dies hat einen entscheidenden Einfluss auf das Verbraucherverhalten. Diese Daten fehlen jedoch häufig oder werden getrennt vom Hauptdatensatz gespeichert.

Ohne Informationen über Werbeaktionen analysiert das Modell Anomalien (starke Zu- oder Abnahmen) als normale Trends. Und prognostiziert deren Wiederholung, wo dies nicht der Fall sein wird.

3. Kategorischer Kontext und Verhalten der Wettbewerber

Wenn Sie ein bestimmtes Produkt analysieren, reicht das nicht aus. Der Käufer trifft seine Wahl nicht isoliert. Er sieht mehrere Alternativen im Regal (oder auf der Katalogseite) und reagiert auf den gesamten Kontext.

Daher muss Folgendes berücksichtigt werden:

  • welche weiteren Produkte in diesem Zeitraum in dieser Kategorie angeboten wurden;
  • welche davon verfügbar waren;
  • ob es Sonderangebote oder Engpässe gab.

Wenn beispielsweise ein Konkurrent aus dem Regal verschwunden ist, könnte dies zu einem kurzfristigen Anstieg der Verkaufszahlen führen. Ein Modell, das dies nicht berücksichtigt, würde jedoch zu dem Schluss kommen, dass der Grund dafür in der Beliebtheit des Produkts liegt.

4. Geografie, Kanäle und Logistik

Ein und dasselbe Produkt kann je nach Stadt, Art des Geschäfts, Vertriebsmodell, Regaltiefe und Lieferung unterschiedlich verkauft werden. All dies ist wichtig.

Beispiel:

  • In Kiew wird die Ware täglich geliefert, in den Regionen einmal pro Woche.
  • In einem Geschäft befinden sich die Waren auf Augenhöhe, in einem anderen unten auf dem Regal.
  • In einem Netzwerk läuft eine Push-Kampagne, im anderen nicht.

5. Physische Veränderungen der Ware (SKU-Attribute)

Viele Modelle berücksichtigen nicht, dass SKU nur ein technischer Code ist. Die Ware, die im Regal steht, kann sich jedoch ändern, ohne dass sich der Code ändert.

Was kann Einfluss haben:

  • neues Verpackungsdesign;
  • Änderung der Größe oder des Volumens;
  • aktualisiertes Foto oder Name auf der Website;
  • Kennzeichnung als „Neuheit“ oder „Bestseller“.

Wie man erkennt, dass ein ML-Modell fehlerhaft ist: typische Symptome

Auch ohne eingehende Prüfung lässt sich feststellen, dass sich das Modell verdächtig verhält. Es funktioniert nicht unbedingt im eigentlichen Sinne nicht, aber seine Vorhersagen stimmen nicht mit der Realität überein oder widersprechen dem gesunden Menschenverstand.

Hier sind einige Anzeichen, die als Alarmsignale zu verstehen sind:

Plötzliche Spitzen oder Einbrüche ohne erkennbaren Grund
Das Modell prognostiziert einen bisher nicht dagewesenen Anstieg oder einen unerklärlichen Einbruch. Höchstwahrscheinlich lernt es aus zufälligen Übereinstimmungen.
Zu geglättete Trends
Das Modell scheut Risiken und geht von einem „Durchschnittswert” aus. Dies ist ein Zeichen dafür, dass es keine Ursache-Wirkungs-Zusammenhänge erkennt und zu vorsichtig arbeitet.
Geringe Erklärbarkeit
Wenn die Frage „Warum hat das Modell genau diese Prognose abgegeben?“ nicht beantwortet werden kann, ist das ein Problem. Geschäftsentscheidungen müssen logisch begründet sein.
Hohe Fehlerquote bei neuen SKUs
Wenn die Prognose für bekannte Produkte mehr oder weniger genau ist, für neue Positionen jedoch ständig falsch, bedeutet dies, dass das Modell nicht in der Lage ist, zu verallgemeinern.
Inkonsistente Reaktion auf offensichtliche Ereignisse
Beispielsweise ändert sich die Prognose beim Start einer großen Kampagne nicht. Oder umgekehrt reagiert das Modell auf jede Kleinigkeit wie auf einen Durchbruch oder eine Katastrophe.

Leere Regale – der größte Feind des maschinellen Lernens

Lassen Sie uns näher auf eine der typischsten Verzerrungen in Prognosemodellen eingehen: wenn das Modell das Ausbleiben von Verkäufen als fehlende Nachfrage interpretiert. Aus Sicht der Zahlen ist dies logisch, aus Sicht des realen Geschäfts jedoch völlig falsch. Null Verkäufe sind noch kein Todesurteil für ein Produkt. Oft ist dies ein Signal dafür, dass die Ware für den Käufer physisch nicht verfügbar war. Das Problem ist, dass ML-Modelle ohne Berücksichtigung der Restbestände dies nicht erkennen können. Um die richtigen Entscheidungen zu treffen, muss ein Unternehmen jedoch zwei Faktoren gleichzeitig berücksichtigen: Was gekauft wird (Nachfrage) und was physisch verfügbar ist (Restbestände).

Die Kombination dieser Daten ergibt:

  • Reduzierung von Out-of-Stock-Fällen: wenn ein Produkt nicht verfügbar ist, aber Nachfrage besteht;
  • Optimierung der Produktion: um keine Überschüsse zu produzieren und kein Geld in Restbeständen zu binden;
  • Korrekte Prognosen, da das Modell die Nichtverfügbarkeit eines Produkts nicht mit mangelndem Interesse daran verwechselt.
  • Senkung der Kosten für Entsorgung, Überschüsse, Verluste aus nicht realisierten Werbeaktionen.

Bei der Entwicklung eines Modells zur Produktionsprognose für das Unternehmen Novi Produkty stieß unser Team direkt auf eine Situation, in der das Modell einen Nachfragerückgang prognostizierte, obwohl die Ware an einigen Standorten einfach nicht in den Regalen verfügbar war. In solchen Fällen schafft die Analyse nur die Illusion von Kontrolle, anstatt eine echte Entscheidungsgrundlage zu bieten. Dieser Punkt wurde bei der Anpassung des Modells entscheidend: Wir haben Daten zu Lagerbeständen integriert, um echte Nachfrageschwankungen klar von Situationen zu unterscheiden, in denen es einfach nichts zu verkaufen gab. Wir haben vollständige Daten zu den Lagerbeständen nach SKU hinzugefügt, Situationen unterschieden, in denen Nachfrage bestand, aber keine Ware verfügbar war, und konnten so die Genauigkeit der Prognose verbessern. Dies trug dazu bei, Überproduktion zu vermeiden, Verluste zu reduzieren und fundierte Entscheidungen auf der Grundlage realer Daten zu treffen.

Ein paar Worte zum Schluss

Schwache Modelle liefern schwache Prognosen. Noch schlimmer ist es jedoch, wenn ein starkes Modell auf unvollständigen Daten basiert und dort Sicherheit suggeriert, wo keine vorhanden ist.

Maschinelles Lernen im Einzelhandel funktioniert nur, wenn das Modell das Gesamtbild sieht. Keine Architektur kann das fehlende Verständnis dafür kompensieren, was genau hinter den Zahlen steckt. Denn eine qualitativ hochwertige Prognose basiert nicht nur auf den Daten selbst, sondern auch auf dem Kontext, aus dem diese Daten stammen.

Genau so gehen wir bei IWIS vor: Unsere Modelle sind nicht nur in der Theorie, sondern auch in der Praxis effektiv. Wenn Sie wissen möchten, wie das bei Ihnen funktionieren kann, sind wir nur eine Nachricht entfernt.

Nächster Beitrag