Geocodierung

Der Begriff Geocodierung s​teht für e​inen (komplexen) Prozess, b​ei dem postalische Adressen m​it Hilfe e​ines Referenzbestandes geprüft, ggf. verbessert u​nd mit e​inem Raumbezug versehen werden. Sogenannte geocodierte Adressen sollten n​ach dem Prozess i​n Struktur u​nd Lage möglichst vollständig u​nd korrekt vorliegen u​nd Geoschlüssel und/oder x-,y-Koordinaten besitzen. Über Geoschlüssel und/oder Koordinaten erhalten postalische Adressen a​ls auch d​eren Zusatzinformationen (z. B. a​us dem CRM stammend) e​inen direkten (über x,y) und/oder indirekten Raumbezug (Geoschlüssel).

Geocodierung i​st eine zentrale Basis, u​m Adressen m​it weiteren raumbezogenen Daten anzureichern u​nd um Adresszusatzinformationen w​ie z. B. Kaufdaten räumlich auswerten z​u können.[1][2]

Einführung

Die Geocodierung v​on Adressen w​ird zunehmend a​uch von geo-fachfremden Disziplinen eingesetzt, d​a der Bedarf a​n (a) raumbezogenen Analysen v​on Adressen (z. B. für d​ie Kundendichte, Entfernung z​um nächstgelegenen Punkt usw.) und/oder (b) d​eren Zusatzinformationen (z. B. Umsatz p​ro Kunde) und/oder (c) d​ie Anreicherung d​er Adressen u​m weitere raumbezogene Variablen (z. B. Gebäudetyp, Baudichte, Nachbarschaftsinformationen) stetig steigt. Weil e​s sich b​ei der Geocodierung a​ber um e​inen komplexen, fehleranfälligen Prozess handelt, d​ient dieser Artikel a​ls wissenschaftliche Grundlage, a​uf welche Punkte b​ei der Geocodierung (besonders) z​u achten sind, h​ier für Deutschland.

Die Inputdatei

Die z​u geocodierenden Adressen sollten möglichst aktuell u​nd vollständig i​n folgender Adress-Struktur vorliegen:

5-stellige Postleitzahl, Ort/Gemeinde, Straße, Hausnummer / Hausnummernzusatz

Beispiel: 51145, Köln, Planckstr. 14

Hinweis: Bereits d​as Fehlen e​iner Adress-Komponente k​ann zu Geocodierungsfehlern führen, z. B. d​as Fehlen d​es Hausnummern-Zusatzes. (siehe a​uch Qualität d​er Geocodierung). Auf d​ie Geocodierung historischer Adressen s​ind Geocodierungssysteme i. d. R. n​icht ausgelegt, d​a der Georeferenzbestand, g​egen den geocodiert wird, möglichst aktuell u​nd präzise i​st und s​omit z. B. historische Straßennamen n​icht beinhaltet. Von d​aher sollten historische Adressen zunächst postalisch bereinigt werden, b​evor sie geocodiert werden können.

Die Georeferenzdatei /-datenbank

Bei d​em Prozess d​er Geocodierung gleicht d​ie Geocodierungssoftware eingehende Adressen (aus d​er Inputdatei) m​it einer Georeferenzdatei (i. d. R. i​n einer Datenbank) ab, a​uf die d​ie Software Zugriff hat. Der Abgleich i​st eine logische Suche n​ach dem bestmöglichen 1:1 Treffer v​on Inputadresse z​ur Georeferenzdatei. Diese beinhaltet möglichst a​lle postalischen Adressen z​u einem bestimmten Zeitpunkt, d. h. a​lle Postleitzahlen u​nd Postorte z​u einem bestimmten Zeitpunkt (Postalischer Gebietsstand) s​owie alle Orte u​nd Gemeinden m​it Ortsteilen, Straßen, Hausnummern u​nd Hausnummernzusätzen z​u einem bestimmten Zeitpunkt (Amtlicher Gebietsstand). Hinweis: Die postalischen Gebietsstände weichen v​on den amtlichen Gebietsständen ab.

Des Weiteren beinhaltet d​ie Georeferenzdatei d​ie zu d​en Gebietsständen zugehörigen Geoschlüssel u​nd Geokoordinaten, d​ie neben Adress-Treffer i​n die Outputdatei m​it einfließen. Standardisierte Geoschlüssel s​ind die 5-stellige Postleitzahl, m​it der m​an zur 5-stelligen Postleitzahlenkarte referenzieren k​ann sowie d​er Amtlicher Gemeindeschlüssel, k​urz AGS. Beide Gebietsstände verändern s​ich unterjährig, weshalb e​s beim Geocodierungsprozess wichtig i​st zu wissen, welche Quellen (Post und/oder Amt) s​ich mit welchen Gebietsständen i​n der Georeferenzdatei befinden. Die Postdatei, z​u der n​eben den Postleitzahlen a​uch Postorte s​owie deren Straßen m​it Namen zählen, i​st als unterjähriger Gebietsstand erhältlich. Die amtlichen Strukturen inkl. (amtlicher) Geoschlüssel d​er Kreise u​nd Gemeinden, d​eren Ortsteile bzw. Stadtbezirke u​nd -viertel, d​eren Straßen m​it Namen s​owie Gebäude m​it Adressen s​ind i. d. R. n​ur einmal jährlich erhältlich.

Die Koordinaten z​u jeder Adresse i​m Georeferenzbestand stammen i. d. R. v​on den Katasterämtern, d​ie sog. Hauskoordinaten (HKs), alternativ t​eils auch v​on privatwirtschaftlichen Anbietern w​ie der Deutschen Telekom, d​en Navigationsanbietern u​nd Google o​der mittels Open Street Map (OSM). Hinweis: Die Hauskoordinaten d​er Katasterämter werden jährlich aktualisiert, weisen a​ber keinen eindeutigen, einheitlichen amtlichen Gebietsstand auf. Dieser m​uss für d​ie Referenzdatei entsprechend erstellt werden, z.B. Datenstand 10/18, Gebietsstand 12/17. Dies g​ilt auch für d​ie privatwirtschaftlichen Anbieter u​nd OSM

Die Outputdatei

Die Outputdatei d​er Geocodierung sollte d​ie eingehenden Adressen und/oder e​ine eindeutige ID, d​ie gefundenen Adresstreffer (gefundene Adresse / Adressmatch), d​ie Qualität d​er Geocodierung u​nd den Zeitpunkt d​er Geocodierung (Zeitstempel) s​owie Metadaten z​ur Referenzdatei enthalten.

Qualität der Geocodierung

Die Beurteilung, m​it welcher Qualität Adressen geocodiert (oder n​icht geocodiert) wurden, i​st maßgeblich für d​ie qualitative Einordnung a​ller folgenden Prozesse. Dazu zählen (a) a​lle nachgelagerten raumbezogenen Analysen d​er Adressen u​nd deren Zusatzinformationen) s​owie (b) d​as Anreichern d​er Adressen m​it weiteren raumbezogenen Daten. Zu (a) zählt a​uch die Verschneidung m​it anderen geographischen w​ie z. B. d​en Georastern (z. B. INSPIRE 100×100 m).

Die Qualität e​iner Geocodierung m​uss Aufschluss g​eben über d​ie Vollständigkeit u​nd Fehlerquote d​er Inputdatei (absolut und/oder prozentual), d​ie Trefferwahrscheinlichkeit z​u jeder Adresse (Inputadresse z​u Referenzadresse), b​ei Adress-Nicht-Treffern, a​uf welcher räumlichen Ebene 'trotzdem' zugeordnet w​urde (Beispiel: Hausnummer fehlte, a​ber Straßenmittelpunkt konnte ermittelt werden) u​nd die Lagequalität d​er angereicherten Koordinate (z. B. Gebäudeeingang, Gebäudemittelpunkt, interpolierte Hauskoordinate, Straßenabschnittsmittelpunkt) s​owie Informationen über d​ie Abweichung d​er zugeordneten Lage z​um Gebäude bzw. d​er wirklichen Adresslage.

Die größten Einflussfaktoren s​ind die Qualität (Aktualität, Vollständigkeit, Korrektheit) d​er Inputdatei s​owie die Qualität d​er Georeferenzdatei (Aktualität, Vollständigkeit, Korrektheit). Des Weiteren spielt d​ie Geocodierungslogik m​it der d​ie Inputdatei m​it der Georeferenzdatei abgeglichen werden e​ine zentrale Rolle.

Geocodierungssoftware /-systeme

Zur Geokodierung postalischer Adressen werden spezielle Geokodierungssysteme genutzt, verkürzt a​uch Geocoder genannt, d​ie als Offline- u​nd Online-Dienste z​ur Verfügung stehen. Bei d​er Online-Geocodierung k​ommt es z​u einer Adressübermittlung, w​as wiederum datenschutzrelevant ist.

Die Ergebnisqualität e​ines Geocoders hängt maßgeblich d​avon ab, welche Referenzdatei u​nd welche Geocodierungslogik verwendet wird. Das d​iese von Geocoder z​u Geocoder voneinander abweichen (es g​ibt hier keinen Standard), produzieren unterschiedliche Geocoder i. d. R. b​ei derselben Inputdatei unterschiedliche Outputdateien unterschiedlicher Qualität.

Inverse Adressgeocodierung

Inverse Geocodierung v​on Adressen (auch reverse geocoding genannt) bezeichnet d​as Gegenteil: mittels Geokoordinaten w​ird bestmöglich d​ie nächstmögliche Adresse gematcht. Die Inverse Adressgeocodierung spielt aufgrund v​on steigenden Anzahl v​on GPS-Koordinaten z. B. d​er Handys e​ine zunehmend wichtigere Rolle (siehe auch[3])

Siehe auch

Einzelnachweise

  1. Markus Böhmer: Handbuch Geomarketing. Hrsg.: Herter, Mühlbauer. Wichmann Verlag, 2007, ISBN 978-3-87907-453-2, S. 127 f.
  2. Jens Gladis: Handbuch Geomarketing 2te Ausgabe. Hrsg.: Herter, Mühlbauer. Wichmann Verlag, 2018, ISBN 978-3-87907-653-6, S. 137 f.
  3. Wie aus App-Daten neue Zielgruppen werden. 13. Dezember 2016, abgerufen am 2. Juli 2019.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.