Ultra-persistente IDs sind eine Gefahr

Warum der Fall Cambridge Analytica kein Skandal wie jeder andere ist. „Nicht sensible“ Daten ermöglichten sozio-politische Profile zu erstellen.

Tradelab | 21.06.2018

Seit der Gründung von Facebook sind Warnungen im Umgang mit der Privatsphäre von Usern zahlreich. Das soziale Netzwerk hat sich offensichtlich trotz allem durchgesetzt. User akzeptieren den inoffiziellen Vertrag Internet-Content gratis zu konsumieren und im Gegenzug Werbung ausgesetzt zu werden.

Der von Cambridge Analytica ausgelöste Skandal ist allerdings von einer ganz anderen Heftigkeit als die vorherigen Warnungen, da zum ersten Mal die berechnende und antidemokratische Informationsnutzung ans Licht kam. Informationen, die eigentlich zu Werbezwecken genutzt werden sollten. Die Facebook-Teams haben sich bis jetzt einfach immer darauf verlassen, dass kein Datenleck vorkommen wird und so versucht, ihre Meinungsmanipulationen für politische Zwecke zu verschleiern.

Nur weil einige personenbezogene Daten „nicht sensibel“ sind, heißt das nicht, dass keinerlei Missbrauchsrisiko besteht

Bleiben wir einen kurzen Moment bei der Art von Daten, die von Cambridge Analytica verarbeitet wurden. Wir können sie aus Sicht der neuen europäischen Datenschutzgrundverordnung (DSGVO) Klassifizierung untersuchen. Erstmals haben wir „sensible“ Daten, die Gegenstand nur sehr beschränkter Zwecke sein dürfen und drakonischen Schutzmaßnahmen unterliegen. Darunter finden wir Signale wieder, die beispielsweise Gesundheit, Religion, sexuelle Orientierung oder Gewerkschaftszugehörigkeit entsprechen. Alle anderen personenbezogenen Daten, wie gelesene Presseartikel, Onlinekäufe, Internetrecherchen oder eben Interessensgebiete gehören zur „nicht sensiblen“ personenbezogenen Datenkategorie. Die Daten, die Facebook sammelt und vor der Datenschutzrichtlinien-Verstärkung weitergab, gehörten laut ihnen zu dieser zweiten Kategorie. Tatsächlich repräsentieren diese unabhängig voneinander gesammelten Daten keine unmittelbare Gefahr: Die neue Tomb Raider Page zu liken, bedeutet nicht, dass Sie ein junger und unentschlossener Wähler sind, der sich von Rechtsextremismus überzeugen lassen könnte. Sich den 120 BPM Trailer anzusehen bedeutet nicht gleich ein Gewerkschaftsaktivist zu sein.

Allerdings sind es genau diese „nicht sensiblen“ Daten, die Cambridge Analytica erlaubten spezifische, sozio-politische Profile zu erstellen und sie für öffentliche Meinungsmanipulation zu verwenden. In diesem Sinne könnte man sich also die Frage stellen, ob man nicht mehr Granularität in unsere Auffassung des Intimitätsniveaus der personenbezogenen Daten stecken sollte.

Die Persistenz der Identifikation bestimmt die Privatsphäre der Daten

Im Moment hat jeder Verantwortliche für Datenverarbeitung sich die folgende Frage zu stellen: Könnten die Daten, die ich sammle, die Privatsphäre und Überzeugungen einer Person ohne ihr Wissen enthüllen? Im Fall von Cambridge Analytica wurde zum Beispiel die sexuelle Orientierung mit Hilfe von sozialen Verhaltensinformationen vorhergesagt, auch wenn diese keinen direkten Bezug zur LGBT-Community zeigten.

Wenn es Data Scientists geschafft haben, solche Rückschlüsse zu ziehen, ist dies vor allem dank der außerordentlichen User-Daten-Historie über die Facebook verfügt. Das nächste Beispiel illustriert die Wichtigkeit der Datensammlungs-Zeitspanne: Wenn ein Verbraucher einmal ein Bioprodukt kauft, kann ich davon ausgehen, dass er oder sie an einem gesunden Lebensstil interessiert ist. Wenn er oder sie zwei Jahre lang regelmäßig Bioprodukte kauft und noch dazu Rockkonzerte besucht, jeden Monat in orientalischen Restaurants isst, in angesagte Clubs geht und einen Master in Marketing hat, ist die Wahrscheinlichkeit, dass er bei den Bundestagswahlen eine mitte-links oder linke Partei gewählt hat hoch.

Mehr noch als die Art der gesammelten Daten, ist es das lange Fortbestehen der Informationen, ermöglicht durch die Nutzung von personenbezogenen Benutzernamen (Nachname, Vorname, Email), die das Risiko zu berechnenden Verwendungen signifikant erhöhen. Dies schränkt unsere Privatsphäre und unseren freien Willen bedeutend ein. Um sich dem zu stellen, sollten soziale Netzwerke ihren Usern erlauben die Datenhistorie, die sie zur Verarbeitung freigeben wollen, zu definieren. Ein User sollte zum Beispiel eine generelle Datenlöschung nach sechs Monaten oder einem Jahr verlangen können. So eine Maßnahme würde die Allwissenheit von Facebook und die Risiken, dass dieses Wissen zu bösartigen Zwecken benutzt wird, einschränken - ohne der User-Erfahrung zu schaden.

Segmentierung auf Session Cookies basieren, um die Privatsphäre zu schützen

Das Inkrafttreten der DSGVO im Mai 2018 und die baldige Publizierung der ePrivacy Verordnung kündigen eine drastische Limitierung von Cookie-Nutzung an, was letztendlich zu einer Stärkung von GAFAs Dominanz auf dem Datenmarkt führt. Denn im Gegensatz zu klassischen Werbeakteuren, die Cookies nutzen, um ihre Kampagnen zu targeten, können die großen amerikanischen Firmen mit ihren registrierten Plattformen User dazu zwingen ihre personenbezogenen Daten zu teilen indem sie im Gegenzug Zugriff zu ihren Services erlauben.

Sich nur auf Session Cookies zu basieren, um Kampagnen zu targeten ist ein guter Weg die User-Privatsphäre zu schützen, denn diese sind nicht persistent. Man stellt fest, dass 30 Prozent von ihnen eine Lebensdauer von weniger als einem Monat haben. Es existiert außerdem eine gewisse „Silotisierung“ der von Cookies stammenden Werbe-IDs, da diese mit einem Browser und einem spezifischen Device verbunden sind und nicht mit einem Unique User, auch wenn das „User-Centric“ Targeting ein gerechtfertigtes Marketing-Anliegen bleibt. Werbeakteure, die nicht von solcher Art von fortbestehenden personenbezogenen Logins (Nachname, Vorname, Email) profitieren, sind zwar fähig die Kaufintentionen oder Interessensgebiete zu identifizieren, jedoch nicht die dauerhaften oder sozial differenzierenden Verhaltenscharakteristiken. Der kurzlebige Charakter ihrer Segmentierung würde sie daran hindern, sich langfristig am Zeitplan der Bundestagswahlen zu orientieren.

Es scheint also an der Zeit zu sein, die aktuelle Diskussion rund um personenbezogenen Datenschutz umzulenken. Wenn man die Privatsphäre wirklich schützen möchte, sollte man besser nicht-persistente also Session-IDs aufwerten, die Werbe-Targeting möglich machen und Geschäftsleistungen von Werbetreibenden nutzen. Gleichzeitig sollte die Möglichkeit, dass Daten konsolidiert werden, um private Charakteristiken vorherzusagen, eingeschränkt werden. In anderen Worten sollte die Nutzung von Cookies reguliert werden ohne sie zu behindern. Auf der anderen Seite sollten Akteure wie GAFA, die personenbezogene Logins nutzen, dazu aufgefordert werden, die Datenhistorie, die sie speichern, regelmäßig zu löschen.