Verunschärfung von Geopositionen

Eine “Security”- bzw. “Privacy”-Frage: Sollten wir eigentlich hier irgendwo darauf achten, dass die exakten Geolokalisationen unserer Bienenstände nicht-öffentlich bleiben, damit wir es den Bienendieben nicht zu einfach machen?

1 Like

Kodierung als Geohash

Hi @mois,

vielen Dank. Absolut, wir haben das bereits diskutiert und wollen das definitiv so implementieren. Die genaue Geoposition darf nur dem Imker selbst zur Verfügung stehen, bei der Veröffentlichung sollen die Positionsdaten verunschärft werden.

Die Kodierung der Positionsdaten als Geohash kann uns dabei helfen:

Geohashes offer properties like arbitrary precision and the possibility of gradually removing characters from the end of the code to reduce its size (and gradually lose precision).

Beispiel

Die Geohash Position der DWD Wetterstation Berlin-Dahlem ist “u336qefcy”, siehe http://geohash.org/?q=52.4477,13.2975&format=url&redirect=0.

Während wir die genaue Position “u336qefcy” ja nicht veröffentlichen wollen, wäre die verunschärfte Position “u336q durchaus in Ordnung. Durch die verminderte Präzision eines Geohashs mit der Länge 5 ergibt sich eine Verunschärfung von ±2.4 km.

Wenn wir “geohash:u336q” zurückrechnen, bekommen wir die Position “latlng:52.4487,13.2935”, siehe http://geohash.co/. Das liegt in städtischen Räumen nach meiner Einschätzung hinreichend weit weg von der originalen Position, vielleicht müssen wir für ländliche Räume noch eine Stufe weiter verunschärfen.

Einverstanden?

Herzliche Grüße,
Andreas.


image
http://geohash.co

The coordinates from the GSM (!) network is not exact. This are not GPS data. Don’t know how the GSM location is computed, the coordinates of the Telco antenna or a triangulation of the “visible” gateways. But it is an estimation not an exact position. So it is already “blurred”.

My intention was not to publish this kind of data but to use it for locating weather stations or other beekeepers nearby.

1 Like

Danke! Wir wollten dieses Thema zur Verunschärfung von Geopositionen hier nur generell in die Wunschliste mit aufnehmen. Manche Knoten können ja mit ihrer Position vorprovisioniert werden, um sie beim Meßvorgang zusätzlich zu übermitteln.

Hallo,
diesen Hinweis finde ich absolut zwingend!

Es dürfen keinerlei GEO Daten öffentlich zugänglich sein die mit den Nutzdaten verknüpft sind.
Eine Authentifizierung am webfrontend wäre da schon einmal das ERSTE was implementiert werden müßte.
Und ob die Daten veröffentlich werden oder nicht ist nicht die Frage. Ich habe zumindest einen MQTT mitschnitt der Datentransfers, die ja JSON Klartext und unverschlüsselt übermittelt werden.

Zudem muss zwingend bei der Datenerhebung und Datenpersistierung ein Datenschutzkonzept her, dass EUDSGVO konform aufgesetzt wird.

Hallo Ingo,

huch, das ging ja schnell. Nochmals herzlich willkommen nach Köln. Vielen Dank für Deine Impulse – ich hoffe Du hast nicht noch eine weitere Nebentätigkeit in der Juristerei?

Vielen Dank für Deine Rückmeldungen zu den datenschutzrelevanten Aspekten einer kollektiven Datenerhebung. Wir haben einige der von Dir angesprochenen Punkte auf der Agenda und diskutieren, wie man es in Zukunft am besten gestalten könnte.

Irgendeine DSGVO-Konformität müssen wir wohl irgendwann einmal erarbeiten, gerade haben wir aber alle Hände voll mit der Technik zu tun. Kennst Du Dich in diesem Bereich aus und könntest mit anpacken? Ich vermute es ist keine Rocket Science und man muss es sich einmalig erschließen und dann läuft der Hase.

Da die GDPR und die davon abgeleitete DSGVO primär die Implementierung des zum fraglichen Zeitpunkt längst überfälligen Lex Facebook zum erweiterten Schutz von Menschenrechten und vor allem Kindern im Sinn hat, hat sie entgegen der landläufigen Meinung für die allermeisten digitalen Anwendungen keine riesige Relevanz – außer dass man natürlich jederzeit konform sein will [1].

Da immer mehr digitale Anwendungen auch personenbezogene Daten erheben und verarbeiten, bekommt das Thema natürlich gesamtgesellschaftlich eine immer größer werdende Relevanz. Ich bin froh, dass hier die Gesetzesschmiede auf EU-Ebene ganz gut funktioniert hat und da beispielhaft vorangegangen wird.

Die aktuell durchgeführte Datenerhebung und -haltung erfolgt vollständig anonym und das System hat derzeit noch gar kein Webfrontend, in das man persönliche Daten (ich vermute diejenigen sind vor allem gemeint) eintragen könnte. Das heißt, man müsste erst einmal eine solche Möglichkeit zur Datenerhebung implementieren. Sobald das getan wird, muss man sich vermutlich auch um die Aspekte zur Datensensibilität kümmern.

Ein entsprechender erweiterter Disclaimer beim Onboarding aufgehängt wäre vermutlich auch für den aktuellen Stand im hybriden Entwicklungs-/Produktionsbetrieb bereits sinnvoll, daher danke vielmals für Deinen Impuls, wir arbeiten das ein!

Neben Aspekten wie Du sie ansprichst, die zum Datenschutz relevant sind, diskutieren wir auch die Lizenzfrage, wie die Daten möglichst gut im Sinne eines Open Data Paradigmas wiederverwendbar gemacht werden können. Kennst Du Dich in den entsprechenden Bereichen ebenfalls aus und könntest vielleicht mit anpacken?

Grundsätzlich halten wir es an dieser Stelle sehr stark mit einem der Grundsätze aus der Hackerethik – Öffentliche Daten nützen – private Daten schützen – besser kann man es kaum differenzieren und gleichzeitig auf den Punkt bringen.

An der Schnittstelle zu den imkerlichen Daten kann es auch um personenbezogene Daten von Menschen gehen – wir versuchen hier einen guten Weg einzuschlagen, der allen Aspekten optimal Rechnung trägt.

Gerade frisch gibt es zum Thema Open Data++ bei Open Science: Wie freies Wissen wirkt auch einen passenden Beitrag dazu, wie ich finde. Vielleicht können wir Dich für diese Themen ebenfalls begeistern?

Herzliche Grüße,
Andreas.


  1. Disclaimer: Das System zur Datenakquise von imkerlichen Daten erhebt keinerlei persönliche oder personenbezogene Daten von Menschen bzw. sieht keinerlei Pflichtfelder vor, die diesen Kriterien entsprechen. ↩︎

Neben Aspekten wie Du sie ansprichst, die zum Datenschutz relevant sind, diskutieren wir auch die Lizenzfrage, wie die Daten möglichst gut im Sinne eines Open Data Paradigmas wiederverwendbar gemacht werden können. Kennst Du Dich in den entsprechenden Bereichen ebenfalls aus und könntest vielleicht mit anpacken?<

Ich denke bei der Widerverwendbarkeit im Sinne von Datenschutz kommt man um eine ETL Schicht nicht umher.
Man muss dann die Daten auf irgendeine Art und Weise verdichten.
Gibt es denn Bestrebungen hin in Richtung Dimensionsbildung o.ä. ?