Frequenzwörterbuch
Frequenzwörterbücher (auch: Häufigkeitswörterbücher) geben den Wortschatz einer Sprache, eines Autors, einer Textsorte etc. wieder, wobei die Häufigkeit, mit der die einzelnen Wörter in einem Text oder Textkorpus vorkommen, das wichtigste Ziel der Zusammenstellung ist. Wenn man nicht eine Gesamtauswertung der betreffenden Texte durchführen kann, ist es eine notwendige Voraussetzung für die Erstellung eines Frequenzwörterbuchs, dass man für den betreffenden Themenbereich ein hinreichend repräsentatives Textkorpus auswerten kann, damit die gewonnenen Häufigkeitslisten ein Bild von der Gesamtheit der Daten vermitteln.
Die bekanntesten Frequenzwörterbücher sind wohl diejenigen, die den Wortschatz einer Sprache insgesamt repräsentieren sollen. Sie ermöglichen es, Aufschluss darüber zu gewinnen, welcher Wortschatz am häufigsten gebraucht und daher zuerst gelernt werden muss, z. B. im muttersprachlichen Unterricht oder auch im Fremdsprachunterricht. Sie können damit ganz praktische Zwecke verfolgen. Aber auch weitere Anwendungen, über die Befriedigung reiner Neugier hinaus, sind möglich: So lassen sich einige elementare Kenntnisse über Sprache aufgrund der Frequenzwörterbücher gewinnen: Das bekannteste der Zipfschen Gesetze gehört dazu, das besagt, dass das Produkt aus Rang und Frequenz der Wörter eine annähernd konstante Größe ergibt. Weitere Implikationen: Je häufiger die Wörter sind, desto kürzer sind sie, desto älter aber sind sie auch. Frequenzwörterbücher haben also sowohl praktischen als auch theoretischen Nutzen und sind wichtige Arbeitsgrundlagen der Sprachstatistik und darüber hinaus der Quantitativen Linguistik.
Frequenzwörterbücher des Deutschen
Die einzelnen Wörterbücher können, auch wenn die Textfrequenz das oberste Kriterium ist, recht unterschiedlich angelegt sein. Bahnbrechend war Kaeding (1897/98), ein Unternehmen, in dem über 11 Millionen Wörter erfasst wurden und das ein Vorbild für entsprechende Unternehmungen in anderen Sprachen wurde. In diesem Wörterbuch sind die Wörter einerseits alphabetisch, andererseits nach Häufigkeit geordnet; man erhält Aufschluss über die Häufigkeit des Wortstamms und die Wortbildungsaktivität des Wortes. Wängler (1963) enthält den Wortschatz eines Korpus gesprochener Sprache und eines Zeitungskorpus sowohl je für sich getrennt als auch zusammen, ebenfalls alphabetisch und nach Häufigkeit sortiert, beschränkt sich aber auf die Wörter, die mindestens 10-mal vorkamen. Meier (1967) gibt eine alphabetisch geordnete Liste des Kaedingschen Wortschatzes wieder, beschränkt ebenfalls auf diejenigen, die mindestens 10-mal belegt sind. Rosengren (1972/77) führt den Wortschatz aus Süddeutsche Zeitung und Die Welt für die Zeit vom 1. November 1966 – 30. Oktober 1967 komplett alphabetisch, rückläufig und nach Häufigkeit geordnet an und gibt weitere Informationen zur Textdeckung der Wörter in den verschiedenen Zeitungssparten. Ruoff (1981) schließlich stellt 500.000 Wörter gesprochener deutscher Sprache zusammen, alphabetisch, rückläufig und nach Häufigkeit geordnet, aber immer getrennt nach Wortarten.
Diese kleine Übersicht zu Frequenzwörterbüchern zur deutschen Sprache insgesamt ist unvollständig und soll nur zeigen, dass die Organisation des Wortschatzes und die Auswertungen keineswegs immer gleich sind. Es ist klar, dass z. B. für Zwecke fachsprachlich orientierten Unterrichts wieder andere Wortschatzauswahlen getroffen werden müssen.[1][2] (Zu Typen, Herstellung und Anwendung von Frequenzwörterbüchern: Alexeev 1984, 2005.)
Literatur
- P. M. Alexeev: Statistische Lexikographie. Übersetzt v. Werner Lehfeldt. Brockmeyer, Bochum 1984. ISBN 3-88339-361-4
- Pavel M. Alexeev: Frequency dictionaries (Häufigkeitswörterbücher). In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, S. 312–324. ISBN 3-11-015578-8
- Friedrich Wilhelm Kaeding (Hrsg.): Häufigkeitswörterbuch der deutschen Sprache 1, 2. Selbstverlag, Berlin-Steglitz 1897/98. (Teilreprint in: Grundlagenstudien aus Kybernetik und Geisteswissenschaft 4/ 1963. Beiheft)
- Snježana Kordić: Wörter im Grenzbereich von Lexikon und Grammatik im Serbokroatischen (= Lincom Studies in Slavic Linguistics. Band 18). Lincom Europa, München 2001, ISBN 3-89586-954-6, S. 280. LCCN 2005-530314, OCLC 47905097, DNB 963264087
- Helmut Meier: Deutsche Sprachstatistik. 2., erweiterte und verbesserte Auflage. Olms, Hildesheim 1967.
- Inger Rosengren: Ein Frequenzwörterbuch der deutschen Zeitungssprache. Bd. 1, 2. Gleerup, Lund 1972/77. ISBN 91-40-04470-X
- Arne Ruoff: Häufigkeitswörterbuch gesprochener Sprache. Niemeyer, Tübingen 1981. 2. unveränderte Auflage 1990. ISBN 3-484-24008-3
- Hans-Heinrich Wängler: Rangwörterbuch hochdeutscher Umgangssprache. Elwert, Marburg 1963.
Einzelnachweise
- L. Hoffmann, R. G. Piotrowski: Beiträge zur Sprachstatistik. VEB Verlag Enzyklopädie, Leipzig 1979, S. 185–189.
- Lothar Hoffmann: Kommunikationsmittel Fachsprache. Eine Einführung. Zweite völlig neu bearbeitete Auflage. Narr, Tübingen 1985, S. 126ff. ISBN 3-87808-771-3.
Siehe auch
Weblinks
- wortschatz.informatik.uni-leipzig.de – Wortschatzlexikon der Universität Leipzig mit Angabe der Häufigkeit im Textkorpus sowohl nominal als auch nach der Häufigkeitsklasse
- DeReWo – Korpusbasierte Grund-/Wortformenlisten des Instituts für Deutsche Sprache mit Angabe der Häufigkeit (Häufigkeitsklasse)