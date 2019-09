Software::Security

Google stellt Bibliothek für Differential Privacy vor

Googe hat eine intern schon länger genutzte Bibliothek für Differential Privacy unter der freien Apache-Lizenz 2.0 veröffentlicht. Sie ermöglicht es, aus Datensätzen Statistiken zu erstellen, die keine Rückschlüsse auf bestimmte Personen erlauben.

Mirko Lindner

Statistische Daten sind für viele Anwender wichtig, um sinnvolle Entscheidungen zu treffen. Nicht nur Unternehmen stehen ständig vor Entscheidungen, sondern auch die Verwaltung, beispielsweise bei der Stadtplanung. Auch Software-Entwickler lassen ihre Anwendungen zum Teil Daten sammeln, die mit entscheiden können, in welche Richtung die Entwicklung geht. Wichtig ist bei solchen Daten der Datenschutz, der heute allgemein gefordert wird. Eine Statistik soll keine Rückschlüsse auf bestimmte Personen erlauben.

Algorithmen, die dieses Ziel verwirklichen, nennt man Differential Privacy-Algorithmen. Google verwendet nach eigenen Angaben seit längerer Zeit eine Bibliothek, die intern entwickelt wurde. Jetzt hat Google diese Bibliothek unter einer freien Lizenz veröffentlicht.

Die Bibliothek »differential-privacy« ist in C++ geschrieben und enthält eine Teilmenge von Differential Privacy-Algorithmen, die sogenannten ε-Differential Privacy-Algorithmen. Sie enthält die üblichen statistischen Funktionen wie Anzahl, Summe, Mittelwerte, Varianz, Standardabweichung, Median und Perzentile. Die Bibliothek wurde laut Google gründlich getestet und enthält eine eigene Testsuite, die erweiterbare »Stochastic Differential Privacy Model Checker Library«, die speziell prüft, dass die Privatsphäre tatsächlich gewahrt bleibt. »differential-privacy« ist modular und kann leicht um zusätzliche Mechanismen, Aggregierungsfunktionen und Privatsphärenbewertungen erweitert werden.

»differential-privacy« benötigt Daten zur Verarbeitung und wäre ohne Mechanismen, diese Daten zu erhalten, nutzlos. Die freier Version der Bibliothek bringt daher eine Erweiterung mit, die die Daten aus PostgreSQL-Datenbanken abfragen kann. Der Quellcode der Bibliothek, der unter der Apache-Lizenz 2.0 steht, ist auf GitHub zu finden. Weitere Informationen zur Bibliothek findet man in einem gerade veröffentlichten wissenschaftlichen Aufsatz.

Nach eigenen Angaben arbeitet Google mindestens seit 2014 an diversen Technologien zur Verbesserung der Privatsphäre, die in Produkte wie Chrome, Google Maps und Google Fi eingeflossen sind. Einige dieser Technologien wurden bereits als freie Software veröffentlicht, zuletzt Tensorflow Privacy, Tensorflow Federated und Private Join and Compute.