print logo

Die Datenfalle für Onlineshops

Diese überraschenden Fallstricke, die bei der Datenauswertung von Onlineshop-Kunden drohen, sollten Sie kennen.
Andreas Landgraf | 20.07.2015
Die zunehmende Digitalisierung im Marketing liefert gewaltige Datenmengen über die Reaktionen der Kunden auf online ausgesteuerte Werbung. Damit wächst die Komplexität des Reportings: Der Marketer muss zunehmend sowohl die fachlichen Aspekte als auch die technisch begründeten Artefakte (unechte Ergebnisse oder Folgen einer Systemschwäche) verstehen und in seine persönlichen Schlussfolgerungen einbeziehen.

Überraschende Fallstricke, die bei der Datenauswertung von Onlineshop-Kunden drohen, veranschaulichen diese drei Beispiele aus der Praxis:

Beispiel 1: Stammkunden versus Neukunden


Bei Einkäufen in einem Onlineshop werden die IP-Adressen der Käufer erfasst. Ein gängiger Standardreport klassifiziert die Käufer in Stammkunden und Neukunden. Aufbereitet als Tortendiagramm, ist die Auswertung zunächst scheinbar völlig selbsterklärend und unmissverständlich. Leider sind die ausgewiesenen Zahlen in Wahrheit absolut wertlos, denn sie basieren auf dem wiederholten Auftreten derselben IP-Adresse in einem Zeitraum von sechs Wochen.

Alle Mitarbeiter eines Großkonzerns, deren Internetverkehr über eine zentrale Firewall läuft, werden beim Besuch des Onlineshops unzulässigerweise als ein einziger Stammkunde zusammengefasst. Der private Kunde dagegen, der bei seiner DSL-Leitung jede Nacht eine neue dynamische IP-Adresse bekommt, wird jedes Mal, wenn er die Website besucht, als Neukunde eingestuft. Korrekt erfasst wird lediglich die verschwindend geringe Minderheit der Surfer, die als Einzelperson eine feste IP-Adresse haben. Ein solcher Report ist grob fahrlässig und irreführend, aber seine Einfachheit und die Geläufigkeit von Begriffen wie Stammkunde und Neukunde machen ihn brandgefährlich für Marketing und Vertrieb.

Beispiel 2: Was heißt Conversion Rate?

Es ist branchenüblich, die Konversionsrate von E-Mail-Newslettern als „Anzahl Käufe“ geteilt durch „Anzahl versendete Newsletter“ zu berechnen. Das ist eigentlich unlogisch, denn nur die geöffneten Newsletter (im groben Durchschnitt vierzig Prozent der tatsächlich versendeten) hatten überhaupt die Chance, das beworbene Produkt zu zeigen. Also wäre es doch naheliegend, die Conversion Rate als „Anzahl Käufe“ geteilt durch „Anzahl geöffnete Newsletter“ zu berechnen. Diese Werte liegen schließlich auch vor. Dann aber ist es vorbei mit dem Branchenvergleich, denn mit 2,5-fach überhöhten Werten hält man sich schnell, aber leider grundlos, für den Besten.

Beispiel 3: Echos im Web


In größeren Unternehmen werden gerne Sicherheitssysteme für das Netzwerk eingesetzt, die unter anderem schädliche Websites blockieren sollen. Nun kann ein solches System nicht das ganze Internet „auf Vorrat“ scannen und zu jeder Webadresse schon wissen, ob sie bedrohlich ist oder nicht. Daher wird der erste Zugriff auf eine noch unbekannte URL zwar durchgelassen, aber kurze Zeit später ruft ein Bot des Sicherheitssystems die Adresse ebenfalls auf, um den von dort gelieferten Inhalt zu analysieren. War die betroffene URL ein Zählpixel, dann wird so unbemerkt doppelt gezählt. Wenn das passiert, dann tut es das nicht in seltenen Einzelfällen, sondern systematisch. Zählpixel zum Sammeln von Nutzerdaten machen nämlich nur Sinn, wenn sie individuelle Identifikationsmerkmale wie zum Beispiel eine Kunden- und/oder Kampagnen-ID transportieren. Damit ist per definitionem jeder Aufruf eine neue URL, die von der Sicherheitssoftware untersucht werden muss.

Während bei diesen Fehlinterpretationen die Ursache noch präzise eingegrenzt werden konnte, gibt es auch mysteriöse Mechanismen im Web, die gängige Auswertungsverfahren völlig aus dem Tritt bringen können: Ein Onlineshop mit einem Monatsumsatz von circa 1,5 Millionen Euro übermittelt seine Umsatzdaten zur Auswertung mit einem erweiterten Zählpixel an einen entfernten Server. Dabei trat immer mal wieder das Phänomen auf, dass der Aufruf eines Pixels hundertfach im Abstand von wenigen Sekunden wiederholt wurde. Durch das Ausfiltern dieser „Echos“ wurde die Umsatzmessung um durchschnittlich zwanzig Prozent nach unten korrigiert.

Fazit: Bei der Datenauswertung genau hinsehen

Begrifflichkeiten im Reporting, die vertraut und selbsterklärend klingen, sollte man anfänglich misstrauen und nachprüfen, was tatsächlich dahinter steckt. Bei Vergleichen mit anderen Systemen muss man sicher sein, dass die gleichen Definitionen zugrunde gelegt werden. Und eine intensive Qualitätskontrolle der Übertragungswege und Verarbeitungsschritte ist immer eine gute Investition.