Satzlänge
Satzlänge wird danach bestimmt, aus wie vielen kleineren Einheiten ein Satz besteht. So ist es möglich, die Satzlänge entsprechend der Zahl der Buchstaben oder auch anderer Schriftzeichen (etwa im Chinesischen), Laute, Phoneme, Morphe, Silben, Moren, Wörter, Satzglieder oder Teilsätze zu definieren. Bevor man jedoch die Satzlänge bearbeiten kann, muss bestimmt werden, was genau ein Satz sein soll, ein keineswegs triviales Problem. So muss zum Beispiel überlegt werden, ob auch die Ein-Wort-Äußerung, die Ellipse oder das Satzfragment als Satz gelten soll.
Kürzeste Sätze – längste Sätze
Eine Frage, die man sich stellen kann, ist die nach den kürzesten oder auch längsten Sätzen, sei es innerhalb einer bestimmten Sprache oder auch ganz allgemein. Die Frage nach den kürzesten Sätzen ist leicht zu beantworten, wenn man sich darauf verständigt, dass auch eine 1-Wort-Äußerung als Satz gelten soll. Dann sind Ausrufe wie „Feuer!“ oder Interjektionen wie „Ah!“ Einwortsätze. Am kürzesten wäre dann der lateinische Imperativ „I!“ (Befehlsform zum Verb „ire“, „gehen“). Ein Satz, der kürzer als ein Buchstabe oder Laut ist, ist nicht möglich.
Anders steht es um die Frage nach dem längsten Satz, zu der man einige Beobachtungen und Überlegungen beitragen, die man aber letztlich nicht beantworten kann. Der Grund: Man kann in sehr vielen Sätzen, wie lang sie auch sein mögen, immer noch ein Wort oder eine Wortgruppe einfügen, ohne dass der Satz grammatische Regeln verletzt. Daher kann eine Obergrenze für grammatisch korrekte Sätze nicht angegeben werden. Grenzen setzt dagegen der Sprachgebrauch: In der gesprochenen Sprache werden tendenziell kürzere Sätze verwendet als in der geschriebenen Sprache; aber auch in der geschriebenen Sprache sind Sätze gewöhnlich in ihrer Länge begrenzt. Am ehesten lässt sich die Frage nach auffällig langen Sätzen in irgendwelchen Texten beantworten. So verweist Lang auf einen Satz bei dem (alt-)griechischen Autor Solon, der 300 Zeilen lang sein soll und geschätzt 4500 bis 4800 Silben enthält.[1] Meier berichtet von einem Satz in H. Brochs „Der Tod des Vergil“, der 1077 Wörter enthalten soll.[2]
Durchschnittliche Satzlänge
Um die durchschnittliche Satzlänge von Texten oder Textgruppen zu bestimmen, muss zunächst festgelegt werden, wie die Satzlänge definiert werden soll. Man kann sie messen, indem man beliebige kleinere Einheiten wählt und auswertet, wie viele davon in den Sätzen enthalten sind. In der Regel wird die Satzlänge durch die Zahl der Wörter oder der Clauses/Teilsätze bestimmt.
Als Beispiel seien einige Durchschnittswerte für Satzlängen im Deutschen genannt, bestimmt nach der Zahl der Wörter im Satz; die Daten stammen aus Best (2002).[3] Die durchschnittliche Zahl der Wörter je Satz in deutschen Texten wurde wie folgt erarbeitet:
Textgruppe | untere Grenze der Satzlängen | obere Grenze der Satzlängen |
---|---|---|
Pressetexte | 9,62 | 22,91 |
Prosa für Kinder und Jugendliche | 6,21 | 12,66 |
Literarische Prosa | 7,08 | 19,62 |
Sprachwissenschaft | 25,67 | 28,73 |
Weitere Details zu den einzelnen Texten innerhalb einer Textgruppe sind in der angegebenen Arbeit aufgeführt. Natürlich sind die angegebenen Werte von der Auswahl der ausgewerteten Texte abhängig. Die Tabelle vermittelt einen Eindruck davon, wie sehr diese Durchschnittswerte auch innerhalb einer Textgruppe schwanken können. Mit einer solchen Streuung der Mittelwerte ist auch dann zu rechnen, wenn man Satzlänge anders als durch die Zahl der Wörter je Satz bestimmt.
Pieper (1979) gibt zum gleichen Thema die folgende Übersicht; es ist zu beachten, dass die Daten der beiden Tabellen nicht direkt vergleichbar sind, da Pieper nicht das arithmetische Mittel, sondern den Median als Mittelwert anführt:[4]
x | Textgruppe | Satzlänge (Median) |
---|---|---|
1 | Hörspiel | 6,64 |
2 | Drama | 6,49 |
3 | Roman-Dialog | 6,01 |
4 | Diskussion | 11,83 |
5 | Roman-Nichtdialog | 12,98 |
6 | Briefe | 13,63 |
7 | Wissenschaftliche Texte | 19,22 |
8 | Allgemeine Gesetzestexte | 23,04 |
9 | Zeitung: Agenturberichte | 23,23 |
10 | Zeitung: Eigene Berichte | 16,37 |
11 | Zeitung: Feuilleton | 16,89 |
12 | Zeitung: Sportberichte | 15,09 |
Satzlängenverteilung und Satzlänge im Zusammenspiel mit anderen sprachlichen Größen
Die Quantitative Linguistik hat sich immer wieder und auf verschiedene Weise mit den Gesetzmäßigkeiten der Satzlängen befasst.
- Gut erforscht ist das Gesetz der Verteilung von Satzlängen, das besagt, dass die Häufigkeit, mit der Sätze verschiedener Länge in Texten vorkommen, ganz bestimmten, theoretisch begründbaren Verteilungen folgen.[5] Dieses Gesetz ist in mehreren Untersuchungen zu verschiedenen Sprachen geprüft und gestützt worden.[6]
- Satzlängen stehen in Texten in Wechselbeziehungen mit anderen Sprachgrößen; diese Wechselbeziehungen lassen sich in ein komplexes Modell integrieren.[7]
- Eine bedeutsame Gesetzmäßigkeit besteht zwischen der Länge der Sätze und der Länge der Teilsätze/Clauses: Je länger ein Satz ist, das heißt, aus je mehr kleineren Einheiten (direkten Konstituenten) er besteht, desto kleiner sind diese Konstituenten selbst. Es handelt sich hierbei um ein Sprachgesetz, das unter dem Namen Menzerathsches Gesetz (auch: Menzerath-Altmann-Gesetz) bekannt ist. Eine Untersuchung zum Deutschen galt der Hypothese „Je länger der Satz, um so kürzer seine clauses“ und konnte aufgrund der Auswertung deutscher Texte zeigen, dass diese Gesetzeshypothese sich bewährt.[8]
- Setzt man die Satzlänge nicht in Beziehung zu den direkten Konstituenten des Satzes, den Teilsätzen/Clauses, sondern zu den indirekten Bestandteilen wie den Wörtern, so ändert sich die Beziehung: Je länger ein Satz, desto länger sind auch seine Wörter. Dieser Zusammenhang wurde mathematisch formuliert und überprüft[9] und zu Ehren von Hans Arens,[10] der ihn wohl als erster entdeckte, als Arenssches Gesetz bezeichnet.[11]
Lesbarkeit
Unter Lesbarkeit versteht man die sprachlichen (grammatischen und lexikalischen) Eigenschaften eines Textes; sie ist ein Bestandteil dessen, was die Textverständlichkeit ausmacht. Seit langem gelten die Bemühungen der Wissenschaft der Frage, ob man die Lesbarkeit eines Textes messbar machen kann. Dabei sind eine Fülle von Lesbarkeitsindizes entwickelt worden, bei denen außer der Wortlänge sehr oft auch die Satzlänge als ein wesentlicher Aspekt integriert ist.[12] In Best (2006)[13] wurde eine Begründung dafür entwickelt, warum so einfache Kriterien wie Wort- und Satzlänge triftige Eigenschaften von Texten sein können, um etwas über ihre Lesbarkeit auszusagen.
Textklassifikation
Die durchschnittliche Satzlänge prägt in einem hohen Maße den Stil eines Textes. Wilhelm Fucks, der sich für eine Quantitative Literaturwissenschaft einsetzt, betrachtet Wort- und Satzlängen als Stilcharakteristiken, das heißt als zahlenmäßig erfasste Stileigenschaften, die genutzt werden können, um den Stil von Autorengruppen zu unterscheiden.[14] Bei Werner Winters Kieler Projekt Quantitative Stilistik, aufgrund von statistischen Merkmalen der Texte Textgruppen zu unterscheiden, spielt auch das Kriterium der Satzlänge in mehrfacher Hinsicht eine Rolle; so wird die Zahl der Wörter pro Satz ebenso berücksichtigt wie die Zahl der Hauptsatz- und Nebensatzverben, wodurch auch die Zahl der Teilsätze in den Blick genommen wird.[15] Dass Satzlängen zu diesem Zweck ein wichtiges Kriterium und dabei keine isolierten Größen sind, betont auch Mistrík bei seinem Versuch einer Texttypologie.[16]
Entwicklung der Satzlängen
Ebenso wie Wortlängen sind auch die Satzlängen eine Größe, die sich im Verlauf der Zeit ändert. Bei einem Vergleich älterer Autoren aus der Zeit der deutschen Klassik mit modernen Autoren, der in dem Saarbrücker Projekt „Syntax der deutschen Gegenwartssprache“ von Hans Eggers durchgeführt wurde, deutete sich eine Tendenz zu kürzeren Sätzen an; der Vergleich litt unter dem Problem, dass die älteren Autoren Literaten und die neueren Sachbuchautoren waren.[17] Untersuchungen zur Entwicklung der Satzlängen in Fachzeitschriften zwischen 1800 und 1990 sowie in künstlerischen Texten zwischen 1650 und 1950 bestätigten jedoch diese generelle Tendenz, wobei einzelne Ausreißer auftraten. In wissenschaftlich-technischen Texten zwischen 1770 und 1960 gibt es dagegen nach Beobachtungen von Möslein eine Tendenz, bei der die Satzlängen zunächst zu- und von 1850 an wieder abnehmen, ein Trend, den auch die Längen der Teilsätze vollziehen. Für 1960 muss konstatiert werden, dass sich hier entweder ein „Ausreißer“ oder eine Trendumkehr zeigt; da weitere Daten fehlen, muss dies hier offenbleiben.[18] Diese Veränderungen im Sprachgebrauch folgen dem Piotrowski-Gesetz.[19]
t | Zeitpunkt | Wörter pro Satz (beobachtet) | Wörter pro Satz (berechnet) |
---|---|---|---|
1 | 1770 | 24,50 | 23,80 |
4 | 1800 | 25,54 | 27,36 |
9 | 1850 | 32,00 | 29,57 |
14 | 1900 | 23,58 | 25,57 |
16 | 1920 | 22,72 | 23,02 |
18 | 1940 | 19,60 | 20,40 |
20 | 1960 | 19,90 | 17,91 |
(Erläuterung: t ist der für die Berechnung nach Jahrzehnten durchnummerierte Zeitabschnitt. Passt man an die beobachteten Daten bis 1960 das Piotrowski-Gesetz in der Form für den reversiblen Sprachwandel[20] an, so ergeben sich die angegebenen berechneten Werte. Die Anpassung des Modells ergibt einen Determinationskoeffizienten von D = 0,82, wobei D als gut erachtet wird, wenn es größer/gleich 0,80 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)
Literatur
- Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarbeitete und ergänzte Aufl. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4. Das Buch enthält auf Seite 129 eine kurzgefasste Übersicht über die Zusammenhänge zwischen Satzlängen und anderen sprachlichen Größen.
- Karl-Heinz Best: Satzlänge. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, ISBN 3-11-015578-8, Seite 298–304.
- Reinhard Köhler: Quantitative Syntax Analysis. Dedicated to Gabriel Altmann on the occasion of his 80th birthday. De Gruyter Mouton, Berlin u. a. 2012. ISBN 978-3-11-027292-5.
Weblinks
Einzelnachweise
- Friedrich Gustav Lang: Schreiben nach Maß. In: Novum Testamentum XLI, 1999, S. 40–57, Angabe Seite 54.
- Helmut Meier: Deutsche Sprachstatistik. Olms, Hildesheim 1967, Seite 192.
- Karl-Heinz Best: Satzlängen im Deutschen: Verteilungen, Mittelwerte, Sprachwandel. In: Göttinger Beiträge zur Sprachwissenschaft 7, 2002, S. 7–31; es werden hier immer nur die beobachteten Werte der Satzlängen angegeben. Alle in der Tabelle zusammengestellten Daten beruhen auf Texten aus dem 20. Jahrhundert.
- Ursula Pieper: Über die Aussagekraft statistischer Methoden für die linguistische Stilanalyse. Narr, Tübingen 1979, Seite 50. ISBN 3-87808-355-6.
- Gabriel Altmann: Wiederholungen in Texten. Brockmeyer, Bochum 1988, Seite 63–67. ISBN 3-88339-663-X; Archivierte Kopie (Memento des Originals vom 13. April 2014 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. .
- Einen Überblick dazu gibt: Karl-Heinz Best: Satzlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, Seite 298–304. ISBN 978-3-11-015578-5.
- Best 2006, Seite 129.
- Gabriela Heups: Untersuchungen zum Verhältnis von Satzlänge zu Clauselänge am Beispiel deutscher Texte verschiedener Textklassen. In: Reinhard Köhler & Joachim Boy (Hrsg.): Glottometrika 5. Brockmeyer, Bochum 1983, Seite 113–133. ISBN 3-88339-307-X
- Gabriel Altmann: H. Arens' „verborgene Ordnung“ und das Menzerathsche Gesetz. In: Manfred Faust, Roland Harweg, Werner Lehfeldt, & Götz Wienold (Hrsg.): Allgemeine Sprachwissenschaft, Sprachtypologie und Textlinguistik. Festschrift für Peter Hartmann. Narr, Tübingen 1983, Seite 31–39. ISBN 3-87808-215-0.
- Karl-Heinz Best: Hans Arens (1911–2003). In: Glottometrics. 13, 2006, S. 75–79 (glottopedia.de und Volltext PDF).
- Gabriel Altmann, Michael Schwibbe: Das Menzerathsche Gesetz in informationsverarbeitenden Systemen. Olms, Hildesheim, Zürich, New York 1989, Seite 46–48. ISBN 3-487-09144-5.
- Norbert Groeben: Leserpsychologie: Textverständnis, Textverständlichkeit. Münster: Aschendorff Verlag, 2002, Seite 175–183. ISBN 3-402-04298-3.
- Karl-Heinz Best: Sind Wort- und Satzlänge brauchbare Kriterien der Lesbarkeit von Texten? In: Sigurd Wichter, Albert Busch, (Hrsg.), Wissenstransfer – Erfolgskontrolle und Rückmeldungen aus der Praxis. Lang, Frankfurt/ M. u. a. 2006, Seite 21–31. ISBN 3-631-53671-2.
- Wilhelm Fucks: Nach allen Regeln der Kunst. Deutsche Verlags-Anstalt, Stuttgart 1968, Seite 33.
- Ursula Pieper: Über die Aussagekraft statistischer Methoden für die linguistische Stilanalyse. Narr, Tübingen 1979, besonders Seite 45. ISBN 3-87808-355-6.
- Jozef Mistrík: Exakte Typologie von Texten. Verlag Otto Sagner in Kommission, München 1973, Seite 30ff.
- Heinz-Helmut Lüger: Pressesprache. 2., neu bearbeitete Auflage. Niemeyer, Tübingen 1995, Seite 23. ISBN 3-484-25128-X.
- Kurt Möslein: Einige Entwicklungstendenzen in der Syntax der wissenschaftlich-technischen Literatur seit dem Ende des 18. Jahrhunderts. In: Walther von Hahn (Herausgeber): Fachsprachen. Wissenschaftliche Buchgesellschaft, Darmstadt 1981, Seite 276–319, zur Länge von Sätzen Seite 303f. ISBN 3-534-07141-7. Erstveröffentlichung 1974.
- Karl-Heinz Best: Satzlängen im Deutschen: Verteilungen, Mittelwerte, Sprachwandel. In: Göttinger Beiträge zur Sprachwissenschaft 7, 2002, Seite 7–31, zur Entwicklung der Satzlängen Seite 22–27, Tabelle Seite 25, etwas korrigiert.
- Gabriel Altmann: Das Piotrowski-Gesetz und seine Verallgemeinerungen. In: Karl-Heinz Best, Jörg Kohlhase (Hrsg.): Exakte Sprachwandelforschung. Theoretische Beiträge, statistische Analysen und Arbeitsberichte (= Göttinger Schriften zur Sprach- und Literaturwissenschaft. Bd. 2). edition herodot, Göttingen 1983, ISBN 3-88694-024-1, Seite 54–90, zum reversiblen Sprachwandel: Seite 78ff.