Ein langfristiges Ziel eines familiengeführten Bielefelder Handelsunternehmens ist es, den Vertriebsprozess mit Hilfe von intelligenter Datennutzung zu optimieren. Ein erster Schritt auf dem Weg dorthin ist die Analyse der Datenqualität der vorhandenen Vertriebsdaten. In Zukunft wird im Rahmen der Digitalisierung der Unternehmensprozesse die Datenmenge weiter zunehmen. Um einen Mehrwert aus Daten generieren zu können, müssen Daten eine hohe Qualität besitzen und daraus abgeleitete Informationen verlässlich sein. Nur dann können bessere und faktenbasierte Entscheidungen getroffen werden. Zusätzlich sind die Potentiale in den Vertriebsdaten zu identifizieren. Data Science soll helfen, Annahmen und Zusammenhänge im Vertrieb anhand von Daten zu überprüfen und auf harte Fakten zu stellen.

Im Projekt Conversion Booster wurde eine erste Analyse und Exploration der Vertriebsdaten unternommen. In einem Workshop wurde zunächst der Prozess in SAP und die daraus resultierenden Daten vorgestellt. Der Fachbereich erklärte aus seiner Sicht, welche Daten vorhanden sind und wie diese entstehen. Es wurden Annahmen zu den Einflussfaktoren auf dem Vertriebsprozess gesammelt. Darauf aufbauend wurden weitere notwendige Datenquellen identifiziert, mit denen die ursprünglichen Vertriebsdaten anzureichern sind, um die gemachten Annahmen überprüfen zu können.

Nach Anreicherung des Datenbestands mit Informationen aus weiteren Datenquellen wurden die Daten hinsichtlich ihrer Qualität analysiert. Zu Beginn lag der Fokus nicht auf Prognosefragen, sondern es ging um grundlegende Dimensionen:

  • Vollständigkeit: besitzt jede Beobachtung (hier ist jede Beobachtung ein Vertriebsbeleg) alle Angaben, sind z.B. alle Pflichtfelder gefüllt
  • Logische Konsistenz: sind Integritätsbedingungen erfüllt, beispielsweise ob der Status „verbucht“ einer Beobachtung auch die Bedingung erfüllt, dass eine weitere Verarbeitung des Vertriebsbelegs stattgefunden hat
  • Konformität: sind alle Angaben der Beobachtungen in einheitlichen Formaten angegeben, z.B. sind Ortsangaben in einem einheitlichen Format mit PLZ Angaben und Länderschlüssel gemacht
  • Korrektheit: gemeinsam mit dem Wissen aus den Fachbereichen wird überprüft, ob Angaben in den Daten korrekt sind oder entdeckte Abweichungen und Ausreißer als fehlerhaft zu bewerten sind (siehe als Beispiel die rote Markierung in der Abbildung: Abweichungen vom Muster in den Daten)

Datenabweichungen

Die erste Datenqualitätsüberprüfung hat zu einer starken Reduktion der verwendbaren Daten geführt. Auf Grundlage des reduzierten Datenbestands wurde eine Exploration der Zusammenhänge durchgeführt und anschließend wurden mehrere Modelle zur Erklärung des Zusammenhangs in den Daten geschätzt.

Es konnte gezeigt werden, dass insbesondere regionale Effekte und Eigenschaften der Kunden einen großen Einfluss haben. Um die Ähnlichkeiten der Kunden besser zu verstehen, wurden zusätzlich Warengruppen, die häufig gemeinsam von bestimmten Kundengruppen gekauft werden, identifiziert. Diese Informationen werden in Zukunft für eine verbesserte Bündelung von Produkten und eine gezielte Ansprache der Kunden genutzt werden.

Zusätzlich wurde Handlungsbedarf zur Erhöhung der Datenqualität aufgezeigt und es konnten konkrete Handlungsempfehlungen gegeben werden. Aufbauend auf den Ergebnissen wird angedacht, in Zukunft ein Monitoring des Vertriebsprozesses realisieren zu können. Es konnte insgesamt ein Verständnis für die Anwendung von Datenanalyse und Data Science entwickelt werden und es gab neue Denkanstöße in Richtung Datenauswertung über mehrere Unternehmen der gesamten Unternehmensgruppe hinweg.

Aus Gründen der Vertraulichkeit werden keine detaillierten Informationen zu dem Auftraggeber des Projekts genannt. Auf Anfrage stelle ich gerne den direkten Kontakt zum Referenzgeber her.