Umgang mit Standortdaten im Bee Observer Projekt

Die Analyse der Daten schreitet voran, und wir möchten die Standortdaten mehr in die Auswertung einbeziehen.

Wir haben uns vorgenommen: :
"Falls geografische Daten übergeben werden werden wir den Standort der Bienen verunschärft auf 5 bis 10 km weitergeben."

Zur Verunschärfung von Geodaten gibt es schon folgenden Post: Verunschärfung von Geopositionen
Haltet ihr das für ein gutes Vorgehen, auch für die BOB-Daten?

Wir überlegen, Metadaten (wie Sonnenscheindauer, Wetterdaten der nächsten Wetterstation, evtl. genaue Uhrzeit Sonnenaufgang/ Sonnenuntergang, phenologische Daten, …) auf den genauen Standortdaten zu berechnen. Auch hier ist die Frage: Wie viele Metadaten würden ausreichen, um den genauen Standort “reverse” auszurechnen? Die Möglichkeit sollte natürlich ausgeschlossen werden.

Habt ihr sonst noch Meinungen, Überlegungen, Ideen zu dem Datenschutzthema?

Unter Geohash - Wikipedia gibt es im Abschnitt Digits and precision in km eine Liste mit der der Verunschärfung je Stufe. Für uns kommen vermutlich die Stufen 4 bis 6 in Frage:

geohash length lat bits lng bits lat error lng error km error
[…]
4 10 10 ±0.087 ±0.18 ±20
5 12 13 ±0.022 ±0.022 ±2.4
6 15 15 ±0.0027 ±0.0055 ±0.61

Stufe 4 ist mit ±20 km sicher unproblematisch, auch für die Korrelation mit Wetterdaten sollte das noch nicht zu grob sein. Etwas genauer ist Stufe 5 mit ±2,4 km sollte für viele Ansprüche auch noch möglich sein. Nur bei komplett offenen Terrain ist die Rückverfolgung vor Ort ggf. möglich. Stufe 6 mit 600 m macht nur im städtischen Bereich als “Verunschärfung” Sinn.