Apertium
Apertium ist eine Maschinenübersetzungs-Software, die früher einmal durch Finanzierung der spanischen Regierung und der autonomen Region Katalonien an der Universität Alicante entwickelt wurde. Jetzt wird Apertium durch freiwillige Spenden der Mitglieder finanziert. Es ist freie Software und wird unter den Bestimmungen der GNU GPL veröffentlicht.
Apertium | |
---|---|
Apertium-tolk Screenshot | |
Basisdaten | |
Aktuelle Version | 3.7.1[1] (21. Dezember 2020) |
Betriebssystem | POSIX-kompatible |
Programmiersprache | C++[2], Java |
Kategorie | Maschinelle Übersetzung |
Lizenz | GPL (Freie Software) |
deutschsprachig | ja |
www.apertium.org |
Apertium entstand als eines der Maschinenübersetzungsprogramme des Projektes OpenTrad und übersetzte zunächst zwischen nah verwandten Sprachen. Später wurde es so erweitert, dass es auch mit Sprachen arbeiten kann, die stärkere Unterschiede aufweisen. Um ein neues Maschinenübersetzungssystem zu entwickeln, müssen nur linguistische Daten (Wörterbücher und Regeln) in einem genau festgelegten XML-Format erstellt werden. Apertium benutzt Transduktoren für alle lexikalischen Umformungen. Für Part-of-speech-Tagging, was im Deutschen die Zuordnung aller möglichen Formen ist, wird das Hidden Markov Model verwendet. Andere maschinelle Übersetzungen, welche zur jetzigen Zeit verfügbar sind, benutzen meistens proprietäre Software. Weil bei diesen meistens verschiedene Technologien für die verschiedenen Sprachpaare verwendet werden, ist es sehr schwer, diese in ein einzelnes Content-Management-System zu integrieren.
Sprachdaten, die für die Software entwickelt wurden (in Zusammenarbeit mit der Universidade de Vigo, der Universitat Politècnica de Catalunya und der Universitat Pompeu Fabra) unterstützen die Sprachen (Stand 2015):
- Afrikaans
- Arabisch
- Aragonesisch
- Aranesisch
- Asturisch
- Baskisch
- Bretonisch
- Bulgarisch
- Dänisch
- Englisch
- Esperanto
- Französisch
- Galicisch
- Hindi
- Indonesisch
- Isländisch
- Italienisch
- Kasachisch
- Katalanisch
- Malaiisch
- Maltesisch
- Mazedonisch
- Niederländisch
- Nordsamisch
- Norwegisch Bokmål
- Norwegisch Nynorsk
- Okzitanisch
- Portugiesisch
- Rumänisch
- Schwedisch
- Serbokroatisch
- Slowenisch
- Spanisch
- Tatarisch
- Urdu
- Walisisch
Literatur
- In Englisch: Corbí-Bellot, M. et al. (2005) „An open-source shallow-transfer machine translation engine for the romance languages of Spain“ in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86 online
- In Englisch: Armentano-Oller, C. et al. (2006) „Open-source Portuguese-Spanish machine translation“ in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], pp. 50–59.
Weblinks
Einzelnachweise
- github.com. 21. Dezember 2020 (abgerufen am 29. Januar 2021).
- The apertium Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 18. Juli 2018).