CLARIN-D
CLARIN-D ist der deutsche Partner der 2012 gegründeten europäischen Infrastrukturmaßnahme für die Geistes- und Sozialwissenschaften CLARIN. Das Akronym steht für "Common Language Resources and Technology Infrastructure", deutsch Gemeinsame Sprachdaten und technologische Infrastruktur. Grundidee ist es, digitale Sprachdaten (Gedrucktes, Audioaufnahmen, Interviews etc.). sowie Werkzeuge zu ihrer Bearbeitung in ganz Europa bzw. weltweit zur Verfügung zu stellen.
Organisationsstruktur und Förderphasen
CLARIN-D ist, wie auch DARIAH-DE, in einem European Research Infrastructure Consortium (ERIC) organisiert und darin Bestandteil der Roadmap des Europäischen Strategieforums für Forschungsinfrastrukturen (ESFRI)[1][2].
CLARIN-D besteht derzeit aus neun zertifizierten Zentren, die jeweils auf bestimmte Datentypen/Inhalte spezialisiert sind[3]. Das Infrastrukturprojekt wird durch das Bundesministerium für Bildung und Forschung gefördert[4][5].
Die erste Phase (2012–2014) diente der Implementierung und dem Aufbau des Zentrenverbundes[6], die zweite (2014–2016) dem Auf- und Ausbau der technischen Infrastruktur und Textkorpora unter Einbindung der geisteswissenschaftlichen Communities[7]. Die derzeit laufende dritte Phase (2016–2020) befasst sich mit Dissemination und Verstetigung und beschäftigt sich z. B. mit Urheberrechtsfragen und (technischen) Herausforderungen von Mehrsprachigkeit in Europa und Social Media Daten[8].
Mit dem DARIAH-DE Projekt gibt es technische Zusammenarbeit[9][10] und institutionelle Verbindungen[11]. Im Jahr 2018 waren beide an der Ausrichtung von Workshops[12] zur Vorbereitung der vom Rat für Informationsinfrastrukturen angeregten "Nationalen Forschungsdateninfrastrukturen" (NFDI)[13] beteiligt. 2019–2021 schließen CLARIN-D und DARIAH-DE ihre Dienste in einer Betriebskooperation zu CLARIAH-DE zusammen.[14]
Ziele
- Vernetzte digitale Forschungsumgebung für Geistes- und Sozialwissenschaftler
- Förderung des interdisziplinären Austausches in den digitalen Geisteswissenschaften
- Förderung der Akzeptanz digitaler Methoden und des Wissens darüber
- Entwicklung von forschungsorientierten Datenbanken, Werkzeugen und Quellensammlungen
- Archivierung und Vorhaltung von Forschungsdaten/Quellensammlungen
Angebote
Die meisten Angebote von CLARIN-D lassen sich direkt über die Webpräsenz des Verbundes erreichen und online nutzen. Dazu gehören Services, die von allen europäischen CLARIN-Beteiligten zusammen bereitgestellt werden (wie die Suche nach und in internationalen Sprachressourcen VLO, FCS), sowie solche, die von CLARIN-D vor allem für ein deutschsprachiges Publikum angeboten werden (WebAnno, WebLicht, Legal Helpdesk). Zudem bieten die Zentren individuelle Beratung von Projekten / Wissenschaftlern an, die an einer Zusammenarbeit etwa bei der langfristigen Speicherung von Forschung(sdaten) interessiert sind.
Zu den Angeboten zählen:
- Werkzeuge[15]: z. B. WebLicht (webbasierte computerlinguistische Analyse), WebAnno (webbasierte Annotation), WebMaus (Alignierung von Transkription und Sprachsignal), DiaCollo (Diachrone Kollokationsanalyse).
- Datenbanken: Virtual Language Observatory (Suche nach Ressourcen)[16], Federated Content Search (Suche in Ressourcen)[17].
- Korpora/Quellensammlungen[18]: z. B. GermaNet, Deutsches Referenzkorpus, Deutsches Textarchiv, Deutscher Wortschatz[19], Digitales Wörterbuch der deutschen Sprache.
Liste der CLARIN-D-Zentren und ihrer Spezialgebiete innerhalb CLARIN-Ds
- Universität Tübingen – CLARIN Center Tübingen[20]: Annotierte Korpora (Baumbanken), lexikalische Daten, Experimentaldaten, linguistische Wissenskomponenten und Webservices
- Universität Leipzig – CLARIN-D Centre Leipzig (Repository)[21] und Projektarbeit[22]: Andere Sprachen (nicht Deutsch), Gegenwartssprache, lexikalische Daten, Webservices, spezielle Referenzkorpora, öffentliche Daten
- BBAW Berlin – CLARIN Servicezentrum[23]: Deutsche Sprache, Lexika, diachrone Korpora (vor 1900), digitale Editionen, Texterfassungsmethoden (OCR)
- Universität Stuttgart – CLARIN-D Centre Stuttgart[24]: Computerlinguistische Software, z. B. Korpora und Korpuswerkzeuge, parametrisierbare Tools u. Webservices, geschriebene Sprache
- IDS Mannheim – CLARIN-D am IDS[25]: Deutsche Sprache, große Korpora des Deutschen (nach 1900), Minderheitensprachen (Dialekte), gesprochene Sprache
- LMU München - CLARIN-D Zentrum am Bayerischen Archiv für Sprachsignale[26]: Deutsche Sprach- und multimodale Daten, phonetische Tools und Services, Sprachstatistiken, Aussprache-Lexika
- MPI Nijmegen – The Language Archive/CLARIN-D[27]: Minoritätensprachen, bedrohte Sprachen, Multimedia- und multimodale Daten, Experimentaldaten, Gebärdensprache
- Universität Hamburg – CLARIN-D am Zentrum für Sprachkorpora (HZSK)[28] und bei der Germanistik[29]: Mehrsprachige gesprochene Korpora, Transkriptionswerkzeuge, Gebärdensprache
- Universität des Saarlandes – CLARIN-D Zentrum (Repository)[30]: Multilinguale Korpora und Korpuswerkzeuge
Literatur
- Bundesministerium für Bildung und Forschung: Auf dem Weg zu europaweiten Forschungsinfrastrukturen: DARIAH und CLARIN, in: Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften, Februar 2013, S. 27–28. (PDF ).
- Leibniz-Gemeinschaft: Leibniz-Beteiligung an ESFRI-Projekten, in: Forschungsinfrastrukturen in der Leibniz-Gemeinschaft, 2014, S. 47. (PDF downloadbar ).
- Guido Koller: Geschichte digital. Historische Welten neu vermessen. Stuttgart 2016, S. 100–102. (PDF ), ISBN 978-3-17-028929-1
Weblinks
Einzelnachweise
- ESFRI Information der Europäischen Kommission
- Selbstbeschreibung CLARIN.eu
- Liste der CLARIN-D-Zentren
- Selbstbeschreibung CLARIN-D
- BMBF: Geförderte Informationsinfrastrukturen für die Geistes- und Sozialwissenschaften
- Informationen im Wiki Forschungsdaten.org
- Selbstbeschreibung und Projekte der CLARIN-D Facharbeitsgruppen
- Foliensatz von Franciska de Jong: CLARIN: a Research Infrastructure for a Multi-Lingual Europe, Juni 2016
- CLARIN-D Information über Zusammenarbeit mit DARIAH-DE
- DARIAH-DE Information über gemeinsame Gremien
- Liste der Partner im DARIAH-DE Forschungsverbund
- Dokumentation der Workshop-Reihe "Wissenschaftsgeleitete Forschungsinfrastrukturen für die Geistes- und Kulturwissenschaften in Deutschland"
- zu NFDI als einer der Themen des Rats für Informationsinfrastrukturen (Seite nicht mehr abrufbar, Suche in Webarchiven) Info: Der Link wurde automatisch als defekt markiert. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis.
- Startseite - DARIAH-DE - DARIAH. Abgerufen am 22. Januar 2020.
- Liste mit CLARIN-D Online Tools
- CLARINs Virtual Language Observatory
- CLARINs Federated Content Search
- Liste der Referenzressourcen in CLARIN-D
- Deutscher Wortschatz, Universität Leipzig
- Webseite CLARIN Center Tübingen
- Webseite CLARIN-D Centre Leipzig (Repository)
- Webseite CLARIN-D Projekt Universität Leipzig
- Webseite CLARIN Servicezentrum BBAW
- Webseite CLARIN-D Centre Stuttgart
- Webseite CLARIN-D am IDS Mannheim
- Webseite CLARIN-D Zentrum am Bayerischen Archiv für Sprachsignale
- Webseite The Language Archive/CLARIN-D am MPI für Psycholinguistik
- Webseite CLARIN-D am Hamburger Zentrum für Sprachkorpora
- Webseite CLARIN-D Germanistik Universität Hamburg
- Webseite CLARIN-D Zentrum (Repository) an der Universität des Saarlands