Wikidata
Wikidata ist eine frei bearbeitbare Wissensdatenbank, die unter anderem das Ziel hat, Wikipedia zu unterstützen. Das Projekt wurde von Wikimedia Deutschland gestartet und stellt als gemeinsame Quelle bestimmte Datentypen für Wikimedia-Projekte bereit, zum Beispiel Geburtsdaten oder sonstige allgemeingültige Daten, die in allen Artikeln der Wikimedia-Projekte verwendet werden können.
Wikidata | |
---|---|
Die freie Wissensdatenbank, die jeder bearbeiten kann | |
Wikiprojekt zur Zentralisierung von Daten und Fakten | |
Sprachen | mehrsprachig |
Betreiber | Wikimedia Foundation |
Registrierung | optional |
Online | 29. Okt. 2012 |
www.wikidata.org |
Seit dem Start 2012 verzeichnet Wikidata ein vergleichsweise starkes Wachstum an Inhaltsseiten; mittlerweile sind rund 90 Millionen Datenobjekte vorhanden (Stand September 2020).[1]
Die Angaben in Wikidata stehen unter der Creative-Commons-Lizenz CC0 1.0 Universal (CC0 1.0) Public Domain Dedication. Dadurch können die Daten ohne Angabe eines Urhebers frei verwendet werden. Alle anderen Namensräume stehen unter der Creative-Commons-Attribution/Share-Alike-Lizenz (CC BY-SA 3.0).[2]
Aufbau
Der Hauptnamensraum der Wikidata ist eine Sammlung von Objekten (bezeichnet mit dem Präfix „Q“ und einer direkt darauf folgenden Zahl). Die Objekte wiederum bestehen aus beliebig vielen Aussagen und Behauptungen (bezeichnet mit dem Präfix „P“ für englisch property und einer Zahl). Diese Eigenschaften können mit Qualifikatoren (ebenfalls mit dem Präfix „P“ bezeichnet) weiter präzisiert werden. Durch Quellen belegte Behauptungen werden Aussagen genannt.[3] Im Zuge der Integration des Wikipedia-Schwesterprojekts Wiktionary, das ein mehrsprachiges Wörterbuch erarbeitet, wurde die Möglichkeit geschaffen, auch Lexeme direkt in Wikidata als Datenobjekte anzulegen.
Wikidata wird, wie alle Projekte der Wikimedia Foundation, auf der Basis von MediaWiki betrieben, das um Komponenten mit dem Namen Wikibase erweitert werden musste, um mit strukturierten Daten umgehen zu können. Wikibase besteht aus dem Wikibase Repository, in dem die Daten abgelegt und verwaltet werden, und dem dazugehörigen Wikibase Client, mit dem man auf das Repositorium zugreifen kann.[4]
Wikidata ermöglicht beispielsweise die Pflege von Normdaten an einem zentralen Ort, wie etwa den Library of Congress Authorities (LCAuth), die von Wikimedia-Projekten, insbesondere von Wikipedia, benutzt werden. Genauso können Daten zu Programm-Versionen einmalig in Wikidata statt auf vielen Projekten individuell bearbeitet werden, was vor allem für kleinere Projekte eine erhebliche Arbeitsentlastung bedeutet.
Geschichte
Wikidata war das erste neue Projekt der Wikimedia Foundation seit 2006.[5] Das Projekt Wikidata wurde erstmals im September 2004 von Erik Möller vorgeschlagen.[6] Magnus Manske implementierte kurz darauf einen ersten Prototyp, der die grundsätzliche Machbarkeit des Projekts demonstrierte. Die eigentliche Umsetzung begann schließlich im April 2012 und wurde durch Spenden von Paul Allens Allen Institute for Artificial Intelligence, der Gordon and Betty Moore Foundation und Google Inc. mit insgesamt 1,3 Millionen Euro finanziert.[7][8] Die Finanzierung durch Spenden lief offiziell bis zum Frühjahr 2013; für den Zeitraum danach plante Wikimedia Deutschland, eine Anschlussfinanzierung zu finden.[9]
Von großem Einfluss auf die Entwicklung von Wikidata war die Semantic MediaWiki von Markus Krötzsch und Denny Vrandečić, die beide an Wikidata mitarbeiten (Vrandečić war 2012 Projektleiter von Wikidata bei Wikimedia Deutschland).[10]
Am 15. Dezember 2012 wurde das einmillionste Datenobjekt eingetragen.
Der inzwischen abgeschlossene Projektplan sah drei Phasen vor:
- Phase 1 begann am 30. Oktober 2012 mit dem offiziellen Start von Wikidata und seiner Freigabe für die Bearbeitung. Zunächst wurden die in den einzelnen Wikipedias lokal im Wikitext gespeicherten Sprachlinks in Wikidata zu Datenobjekten (englisch Items) zentral zusammengeführt und mit Bezeichnungen und Beschreibungen versehen. Bei diesen Aufgaben wurden vor allem automatische Computerskripte (auch bekannt als Bots) eingesetzt. Anfangs konnten nur Sprachlinks eingefügt werden. Ab dem 14. Januar 2013 waren diese in der ungarischsprachigen Wikipedia verfügbar,[11] am 30. Januar 2013 wurden sie in der hebräischen und der italienischen[12] und am 13. Februar in der englischsprachigen Wikipedia freigeschaltet[13] und seit 6. März 2013 sind sie in allen Sprachversionen verfügbar.[14]
- Am 4. Februar 2013 ging die „Phase 2“ mit noch limitiertem Funktionsumfang in Betrieb. Hier wurden Aussagen zu Datenobjekten hinzugefügt (Beispiel Marie Curie: Geburtsort → Warschau). Diese Informationen wurden zum Teil automatisiert aus Wikipedia-Infoboxen und -Kategorien übertragen. Ziel ist es, Informationen auf Infoboxen in den Wikipedia-Sprachversionen zentral in Wikidata zu speichern und diese bei Bedarf in Wikipedia zu verwenden. Am 27. März 2013 wurde in den ersten elf Wikipedia-Sprachversionen die Unterstützung für Phase 2 aktiviert. Am 23. April zogen die restlichen Wikipedias nach, darunter auch die deutschsprachige Wikipedia.[15]
- Seit Phase 3 ist es möglich, automatisiert Listen mit Daten aus Wikidata zu erstellen. Zu den manuell erstellten und gewarteten Tabellen und Listen innerhalb der Wikipedia gibt es seither zahlreiche Möglichkeiten Listen automatisiert erstellen zu lassen.
Im Jahr 2013 spendete IBM das Preisgeld des Feigenbaum-Preises 2013 für das Watson-Projekt an die Wikimedia Foundation und namentlich Wikidata, weil die Wikipedia einen großen Beitrag zum Erfolg des Projektes geleistet habe und Wikidata es sich zum Ziel gesetzt habe, Menschen wie Maschinen leichteren Zugang zu Wissen zu verschaffen.[16]
Ende 2014 gab Google bekannt, die eigene Faktendatenbank Freebase im Jahr 2015 zugunsten des Wikidata-Projektes zu schließen. Um Daten einfacher nach Wikidata übernehmen zu können, wurde ein Importtool bereitgestellt.[17][18][19] Bis Mitte 2019 sind aber von etwa 10 Millionen Datensätzen nur etwa 528.000 bzw. weniger als fünf Prozent in Wikidata übernommen worden.[20][21]
Seit Oktober 2016 wird der offizielle Abfragedienst bereitgestellt, der die Ausführung von SPARQL-Abfragen ermöglicht.[22]
Verbreitung
Eine Umfrage, die der Bibliotheks-Dienstleister OCLC im Jahr 2018 durchgeführt hatte, ergab, dass Wikidata unter den Linked-Data-Projekten, aus denen Daten in eigene Angebote übernommen wurden, mit 41 % der Befragten den Platz fünf einnahm – vor WorldCat und ISNI, aber deutlich nach der Library of Congress und VIAF. Im Vergleich zu 2015 sei Wikidata vor allem für Bibliotheken, Museen und Archive bedeutsamer geworden.[23]
Im Mai 2019 wurde bekannt, dass die Library of Congress Daten aus Wikidata in ihre Normdaten integrieren werde.[24]
Kritik
Insbesondere in der Anfangszeit von Wikidata wurde kritisiert, dass eine Lizenz ohne Copyleft verwendet wird.[25][26] Auch die Qualität des Datenbestands von Wikidata stand wiederholt in der Kritik. Eine vergleichende Untersuchung der Datenqualität von DBpedia, Freebase, OpenCyc, Wikidata und YAGO kam im November 2017 zu dem Ergebnis, keine der genannten Knowledge Graphs eigne sich für alle denkbaren Zwecke.[27]
Sonstiges
Im Juli 2015 stellten Bachelorstudenten des Hasso-Plattner-Instituts der Universität Potsdam ein Projekt vor, das „Vollständigkeit und Korrektheit der Daten des rasant wachsenden Datenbestands sicherstellen“ soll. Zur Konsistenzprüfung hinzugezogen werden dazu unter anderem Daten der Deutschen Nationalbibliothek[28] und der Internet Movie Database.[29]
Das Logo stammt von Arun Ganesh und wurde im Rahmen eines Wettbewerbs ausgewählt. Der stilisierte Barcode bildet zugleich das Wort „Wiki“ in Morsezeichen und in den Farben der Wikimedia-Projekte ab.[30]
Literatur
- ARL Task Force on Wikimedia and Linked Open Data: ARL White Paper on Wikidata: Opportunities and Recommendations. Hrsg.: Association of Research Libraries. 18. April 2019 (englisch, arl.org).
- Christian Erlinger, Jens Bemme: Die Datenlaube der Gartenlaube. Mit Wikidata ‚Die Gartenlaube‘ in Wikisource strukturiert erschließen – ein Werkstattbericht. In: diedatenlaube.github.io. 18. November 2019 (github.io).
- Torsten Kleinz: Daten-Enzyklopädie. Das Wikidata-Projekt will die Inhalte der Wikipedia strukturieren. In: c't – Magazin für Computertechnik. Nr. 9, 2013, S. 76–79 (online, kostenpflichtig).
- Marçal Mora-Cantallops, Salvador Sánchez-Alonso, Elena García-Barriocanal: A systematic literature review on Wikidata. In: Data Technologies and Applications. Band 53, Nr. 3, 1. Juli 2019, ISSN 2514-9288, S. 250–268, doi:10.1108/DTA-12-2018-0110 (emerald.com [abgerufen am 14. August 2020]).
- Claudia Müller-Birn, Benjamin Karran, Janette Lehmann, Markus Luczak-Rösch: Peer-production system or collaborative ontology engineering effort: What is Wikidata?. In: Proceedings of the 11th International Symposium on Open Collaboration. ACM, 2015 (doi:10.1145/2788993.2789836).
- Joachim Neubert: Warum spenden wir Daten an Wikidata? In: ABI Technik. Band 40, Nr. 2, 1. Mai 2020, ISSN 2191-4664, S. 209–209, doi:10.1515/abitech-2020-2013 (degruyter.com [abgerufen am 4. Mai 2020]).
- Adrian Pohl: Was ist Wikidata und wie kann es die bibliothekarische Arbeit unterstützen? In: ABI Technik. Band 38, Nr. 2, 4. Juli 2018, ISSN 2191-4664, S. 208–208, doi:10.1515/abitech-2018-2013 (degruyter.com [abgerufen am 21. Juli 2018] Open Access im Blog d. Verf.).
- Houcemeddine Turki, Thomas Shafee, Mohamed Ali Hadj Taieb, Mohamed Ben Aouicha, Denny Vrandečić: Wikidata: A large-scale collaborative ontological medical database. In: Journal of Biomedical Informatics. 1. September 2019, S. 103292, doi:10.1016/j.jbi.2019.103292 (elsevier.com [abgerufen am 25. September 2019] auch verfügbar auf Zenodo für den privaten Gebrauch).
- Jakob Voß u. a.: Normdaten in Wikidata. 2014, ISBN 978-1-291-85658-3.
- Denny Vrandečić, Markus Krötzsch: Wikidata: A Free Collaborative Knowledge Base. In: Communications of the ACM. Band 57, Nr. 10, 2014, S. 78–85.
- Denny Vrandečić: Toward an Abstract Wikipedia. In: Proceedings of the 31st International Workshop on Description Logics co-located with 16th International Conference on Principles of Knowledge Representation and Reasoning (KR 2018). Vol. 2211-3. Tempe, Arizona, US, 2018.
- Wikidata: Die freie Wissensdatenbank, die jeder bearbeiten kann. Der Leitfaden für alle, die dabei helfen möchten, die Welt gemeinsam in offenen und strukturierten Daten zu beschreiben. Wikimedia Deutschland, 2019, abgerufen am 9. August 2019 (Redaktion: Nicolas Rück, Layout und Design: Valerie Schandl).
Weblinks
- Hauptseite von Wikidata
- Projektseite auf dem Meta-Wiki der Wikimedia Foundation
- Wikipedia:Wikidata – weitere Informationen in der Projektdokumentation der deutschsprachigen Wikipedia
- Pressestimmen zu Wikidata (auf Englisch)
- Reportcard Wikidata WMF / stats.wikimedia.org
- Videos: Vorträge der WikidataCon auf media.ccc.de
- Podcasts:
- CRE205 Wikidata – Tim Pritlove im Gespräch mit Jens Ohlig im Podcast CRE
- Between the Brackets – Yaron Koren im Gespräch mit Denny Vrandečić
- Wikidata Query Service Tutorial – zum Erlernen von SPARQL-Abfragen auf Wikidata (englisch)
Einzelnachweise
- Special:Statistics. In: Wikidata. Abgerufen am 12. September 2019.
- Wikidata:Datenbank-Download. In: wikidata.org. Abgerufen am 9. September 2016.
- Wikidata:Glossar. In: www.wikidata.org. Abgerufen am 9. September 2016.
- Wikibase — Home. Abgerufen am 3. Dezember 2018.
- Matthew Roth: The Wikipedia data revolution. In: Wikimedia Blog. 30. März 2012, abgerufen am 9. September 2016 (englisch).
- Erik Möller: Die heimliche Medienrevolution – Wie Weblogs, Wikis und freie Software die Welt verändern. 1. Auflage. Heise Zeitschriften Verlag, Hannover 2005, ISBN 3-936931-16-X, S. 189, 196 ff. (medienrevolution.dpunkt.de [PDF; 3,0 MB]).
- Boonsri Dickinson: Paul Allen Invests In A Massive Project To Make Wikipedia Better. In: Business Insider. 30. März 2012, abgerufen am 9. September 2016 (englisch).
- Sarah Perez: Wikipedia’s Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others. In: TechCrunch. 30. März 2012, abgerufen am 9. September 2016 (englisch).
- Torsten Kleinz: Wikidata: Daten-Fundus für Wikipedia eröffnet. In: heise online. 31. Oktober 2012, abgerufen am 9. September 2016.
- Lydia Pintscher, Das Wikidata-Team, Blog wikimedia.de, 4. April 2012
- Lydia Pintscher: Erste Schritte von Wikidata in der ungarischen Wikipedia. In: Wikimedia Deutschland Blog. 14. Januar 2013, abgerufen am 14. Januar 2013.
- Lydia Pintscher: Wikidata kommt in die nächsten zwei Wikipedien. In: Wikimedia Deutschland Blog. 30. Januar 2013, abgerufen am 31. Januar 2013.
- Lydia Pintscher: Wikidata auf der englischen Wikipedia. In: Wikimedia Deutschland Blog. 13. Februar 2013, abgerufen am 7. März 2013.
- Lydia Pintscher: Wikidata jetzt auf allen Wikipedien. In: Wikimedia Deutschland Blog. 6. März 2013, abgerufen am 7. März 2013.
- Lydia Pintscher: Wikidata auf der ganzen Welt. Wikimedia Deutschland, 24. April 2013, abgerufen am 28. April 2013.
- Matthew Roth: IBM Research donates AAAI Feigenbaum Prize for Watson to the Wikimedia Foundation. In: Wikimedia Foundation Blog. 16. Juli 2013, abgerufen am 9. September 2016 (englisch).
- The Knowledge Graph team at Google: When we publicly launched Freebase back in 2007, we thought of it as a… In: Google+. 16. Dezember 2014, abgerufen am 9. September 2016 (englisch).
- Wikidata:Primary sources tool. Abgerufen am 3. Februar 2017.
- Thomas Pellissier Tanon, Denny Vrandečić, Sebastian Schaffert, Thomas Steiner, Lydia Pintscher: From Freebase to Wikidata: The Great Migration. In: Proceedings of the 25th International Conference on World Wide Web - WWW '16. ACM Press, Montréal, Québec, Canada 2016, ISBN 978-1-4503-4143-1, S. 1419–1428, doi:10.1145/2872427.2874809 (acm.org [abgerufen am 27. September 2019] auch frei abrufbar.).
- Marco Fossati: (Wikidata) Google's stake in Wikidata and Wikipedia. In: Mailingliste Wikidata-l. 27. September 2019, abgerufen am 27. September 2019 (englisch).
- Sebastian Hellmann: (Wikidata) Google's stake in Wikidata and Wikipedia. In: Mailingliste Wikidata-l. 27. September 2019, abgerufen am 27. September 2019 (englisch).
- Wikidata Query Service. Abgerufen am 5. November 2018 (englisch).
- Karen Smith-Yoshimura: Analysis of 2018 International Linked Data Survey for Implementers. In: Code4Lib Journal. Band 42, 8. November 2018, ISSN 1940-5758 (code4lib.org).
- Meghan Ferriter, Matt Miller: Integrating Wikidata at the Library of Congress. In: The Signal. Library of Congress, 22. Mai 2019, abgerufen am 9. Juni 2019 (englisch).
- Alexrk2: Is CC the right license for data? In: meta.wikimedia.org. 1. April 2012, abgerufen am 9. September 2016 (englisch).
- Andreas Kolbe: Unsourced, unreliable, and in your face forever: Wikidata, the future of online nonsense, The Register, 8. Dezember 2015.
- Michael Färber, Frederic Bartscherer, Carsten Menne, Achim Rettinger: Linked data quality of DBpedia, Freebase, OpenCyc, Wikidata, and YAGO. In: Semantic Web. Band 9, Nr. 1, 30. November 2017, S. 77–129, doi:10.3233/SW-170275 (medra.org [abgerufen am 27. September 2019] es gibt eine frei zugängliche Fassung.).
- HPI-Studenten sorgen für Qualitätssicherung in Wikidata. Hasso-Plattner-Institut, 7. Dezember 2015, abgerufen am 9. September 2016.
- Felix Naumann, Anja Jentzsch: Wikidata Quality. Hasso-Plattner-Institut, 24. August 2016, abgerufen am 9. September 2016.
- https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/