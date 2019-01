Software::Distributionen::Fedora

Fedora: Benutzerzähler ohne Datenschutzprobleme

Wie viele andere Linux-Distributionen versucht auch Fedora, anhand der Zugriffe auf seine Update-Repositorien abzuschätzen, wieviele Installationen es gibt. Diese Abschätzung soll verbessert werden, allerdings ohne Daten zu erheben, die die Nachverfolgung der Benutzer ermöglichen.

Die Erhebung von Benutzerdaten ist bei Linux-Nutzern weitgehend verpönt. So wird auch das Zählen von Benutzern als kritisch angesehen, wenn es auch nur den Anschein erweckt, dass die erhobenen Daten die Identifikation von Benutzern ermöglichen. Diesem Problem will sich nun Fedora stellen. Die Distribution ist wie viele andere daran interessiert, zu erfahren, wieviele Benutzer es gibt und welche Varianten der Distribution sie einsetzen. Außerdem würde man gern wissen, wieviele der Installationen nur Testzwecken dienen.

Eine grobe Zahl der Nutzer kann man erhalten, indem man die Zahl der individuellen IP-Adressen ermittelt, die in bestimmten Zeiträumen auf die Update-Repositorien zugreifen. Das Resultat wird jedoch durch einige Faktoren verfälscht, so werden Benutzer, die von verschiedenen Orten oder mit wechselnden IP-Adressen zugreifen, als mehrere gezählt, während größere Zahlen von Systemen hinter NAT-Firewalls nur als ein System erscheinen. Ein Vorschlag zur Verbesserung der Genauigkeit für Fedora 30 wurde daher auf der Mailingliste intensiv diskutiert.

Der Vorschlag sah anfänglich vor, eine neue UUID für jedes System zu erzeugen. Anhand dieser UUID wäre jedes System eindeutig zu identifizieren, und das über seine ganze Lebensdauer hinweg. Diese ID sollte explizit nicht für die Nachverfolgung (Tracking), sondern nur für Statistiken genutzt werden. Etliche Entwickler wandten sofort ein, dass der gute Wille, keine Nachverfolgung zu betreiben, nicht ausreiche. Fedora wäre dann in der Verantwortung, sicherzustellen, dass die Daten tatsächlich geschützt bleiben, wie auch von der Europäischen Datenschutzverordnung (GDPR) gefordert.

Es wurde dann über alternative Methoden diskutiert, darunter eine wechselnde UUID oder die Messung der Zugriffe auf NTP-Server. Ersteres würde nicht viel verbessern und zweiteres den Aufbau einer entsprechenden Infrastruktur erfordern, die Fedora nicht betreiben will. Lennart Poettering brachte dann eine Idee ins Spiel, die eine Zählung der Systeme ohne das Sammeln von zusätzlichen Daten ermöglicht. Jedes System sollte demnach einmal in der Woche beim Zugriff auf die Repositorien ein »Zähle mich«-Flag setzen und wird nur dann gezählt. Da jedes System somit nur einmal pro Woche gezählt wird, ist die Summe über eine Woche ein gutes Maß der installierten Systeme. Nach Ansicht Poetterings wäre diese Methode datenschutzrechtlich nicht relevant, so dass man sie nicht einmal abschaltbar machen müsste. Wie andere Entwickler ist auch Poettering gegen eine Datensammlung mit UUIDs, denn diese Daten könnten missbraucht oder gestohlen werden. Roberto Ragusa merkte noch an, dass sich jede Woche nur ein Bruchteil der installierten Systeme mit dem Zählflag melden müsste. Daraus ließe sich immer noch die reale Zahl hochrechnen. Projektleiter Matthew Miller zeigte sich begeistert von der Idee. Er brachte eine Erweiterung ins Spiel, bei der statt einem Zählflag das Alter des Systems (in Wochen) gesendet wird. Diese Zahl würde auf etwa 60 begrenzt, um auszuschließen, dass Systeme eindeutig identifizierbar werden.

Der Vorschlag für Fedora 30 wurde inzwischen entsprechend abgewandelt. Er sieht nun vor, dass neben dem Zählflag (ob es inkrementiert wird, ist noch offen) eine ID für die eingesetzte Fedora-Variante (Workstation, Server, Cloud Base usw.), Architektur und Fedora-Version. Auch nach Umsetzung dieser Maßnahmen wird die Zählung der Systeme keinesfalls perfekt sein, doch wird sie bessere Daten liefern, die zu besseren Entscheidungen in der Zukunft beitragen könnten. Ob diese Daten wirklich nötig sind, wird aber weiter von einigen angezweifelt.