Gesetz der Verteilung von Satzlängen
Das Gesetz der Verteilung von Satzlängen behandelt in der Linguistik die Frage, wie oft Sätze verschiedener Komplexität in Texten verwendet werden. Ein besonders einfaches Kriterium für Satzkomplexität ist ihre Länge, die verschieden definiert werden kann: als die Zahl der Buchstaben, Silben, Wörter, Teilsätze usw. je Satz. Untersucht man nun für Texte, wie häufig Sätze verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie von einem Sprachgesetz gesteuert sind. Es handelt sich im Prinzip um das gleiche Sprachgesetz, das auch die Häufigkeitsverteilung der Wortlängen betrifft (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u. a.[1]).
Anwendung verschiedener Definitionen für Satzkomplexität
Wilhelm Fucks hat die Satzlänge nach der Zahl der Silben pro Satz bestimmt, die Sätze in Klassen von 1–5, 6–10 Silben undsoweiter eingeteilt und die Polya-Verteilung als ein für den Stil etlicher Autoren geeignetes Modell benannt.[2] Bestimmt man die Satzlänge nach der Zahl der Teilsätze (clauses) je Satz, so kann bei rund 500 deutschen Texten die Hyperpoisson-Verteilung als gutes Modell angesehen werden.[3] Bei anderen Kriterien für die Satzlänge[4], in anderen Sprachen, bei anderen Textsorten etc. sind oft auch andere Modelle geeigneter. Wählt man zum Beispiel als Kriterium für die Satzlänge die Zahl der Wörter je Satz, kommt als Modell für deutsche Texte die negative Binomialverteilung in Frage.[5]
Bestimmt man dagegen die Länge syntaktischer Konstruktionen nach der Zahl ihrer Endknoten, so folgen diese ebenfalls Gesetzen.[6]
Man kann statt der Länge der Sätze auch die Satztiefe als Komplexitätsmaß wählen. Die Satztiefe lässt sich z. B. durch die Menge der Regeln definieren, die in einer generativen Syntax benötigt werden, um einen Satz zu erzeugen; äquivalent: Zahl der Knoten in einem Baumgraphen für einen solchen Satz. Auch in diesem Fall gelten entsprechende Verteilungsgesetze.[7]
Zusammenfassend lässt sich sagen: Die Untersuchungen zu Satzlängen unterstützen bisher die von der Quantitativen Linguistik vertretene Hypothese, dass Sprachsystem und -verwendung sich gemäß bestimmten, theoretisch begründbaren Sprachgesetzen verhalten.
Ein Beispiel
Die folgende Tabelle gibt ein Beispiel für eine Verteilung von Sätzen verschiedener Länge (gemessen als Zahl der clauses) in einem kurzen deutschen Prosatext.[8] Die Beobachtungsdaten sind der Untersuchung von Niehaus (1997) entnommen, die Anpassung der Hyperpoisson-Verteilung wurde neu berechnet.[9]
x | n(x) | NP(x) |
---|---|---|
1 | 73 | 68,40 |
2 | 30 | 36,44 |
3 | 21 | 19,14 |
4 | 9 | 9,92 |
5 | 6 | 5,07 |
6 | 3 | 2,56 |
7 | 1 | 1,27 |
8 | 1 | 1,20 |
(Dabei ist x: Zahl der clauses je Satz, beginnend mit x = 1; n(x) ist die in diesem Text beobachtete Zahl der Sätze mit x clauses; NP(x) ist die Zahl der clauses, die berechnet wird, wenn man die Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: Die Hyperpoisson-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0,84, wobei P als gut erachtet wird, wenn es größer oder gleich 0,05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)
Siehe auch
Literatur
- Gabriel Altmann: Verteilungen der Satzlängen. In: Klaus-Peter Schulz (ed.): Glottometrika 9. Brockmeyer, Bochum 1988, Seite 147–169. ISBN 3-88339-648-6.
- Gabriel Altmann: Wiederholungen in Texten. Brockmeyer, Bochum 1988. ISBN 3-88339-663-X.
- Karl-Heinz Best: Satzlängen im Deutschen: Verteilungen, Mittelwerte, Sprachwandel. In: Göttinger Beiträge zur Sprachwissenschaft 7, 2001, Seite 7–31.
- Karl-Heinz Best: Wie viele Wörter enthalten Sätze im Deutschen? Ein Beitrag zu den Sherman-Altmann-Gesetzen. In: Karl-Heinz Best (Herausgeber): Häufigkeitsverteilungen in Texten. Peust & Gutschmidt, Göttingen 2001, Seite 167–201. ISBN 3-933043-08-5.
- Karl-Heinz Best: Satzlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, Seite 298–304. ISBN 3-11-015578-8.
- Anja Kaßel, Eleanor Livesey: Untersuchungen zur Satzlängenhäufigkeit im Englischen: Am Beispiel von Texten aus Presse und Publizistik, Literatur (Belletristik). In: Glottometrics 1, 2001, Seite 27–51. (PDF Volltext)
- Emmerich Kelih: Untersuchungen zur Satzlänge in russischen und slowenischen Prosatexten. Band 1 & Band 2. Diplomarbeit, Graz 2002.
- Emmerich Kelih, Peter Grzybek: Satzlängen: Definitionen, Häufigkeiten, Modelle. In: A. Mehler (Ed.): Quantitative Methoden in Computerlinguistik und Sprachtechnologie. [= Special Issue of: LDV-Forum. Zeitschrift für Computerlinguistik und Sprachtechnologie // Journal for Computational Linguistics and Language Technology 2004.]
- Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modeling of Length in Language. RAM-Verlag, Lüdenscheid 2014. ISBN 978-3-942303-26-2. (Kapitel "Sentence length", Seite 94–107.)
- Martin Wittek: Zur Entwicklung der Satzlänge im gegenwärtigen Deutschen. In: Karl-Heinz Best (Herausgeber): Häufigkeitsverteilungen in Texten. Peust & Gutschmidt, Göttingen 2001, Seite 219–247. ISBN 3-933043-08-5.
Einzelnachweise
- Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Issues in General Linguistic Theory and the Theory of Word Length. Wissenschaftlicher Verlag Trier, Trier 1996, Seite 112–133, ISBN 3-88476-228-1; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98–106; Sentence and clause length (Memento vom 13. April 2014 im Internet Archive)
- Wilhelm Fucks: Nach allen Regeln der Kunst. Deutsche Verlags-Anstalt, Stuttgart 1968, Seite 84–88.
- Zur Eignung der Hyperpoisson-Verteilung im Vergleich zu anderen Verteilungen bei Anwendung dieses Kriteriums siehe Best 2005, Seite 301.
- Siehe dazu zum Beispiel: Emmerich Kelih, Peter Grzybek: Häufigkeiten von Satzlängen: Zum Faktor der Intervallgröße als Einflussvariable (am Beispiel slowenischer Texte). In: Glottometrics 8, 2005, Seite 23–41. (PDF Volltext.)
- Dazu: Best 2001, Wie viele Wörter..., 198f.
- Length of syntactic constructions (Memento vom 22. Januar 2016 im Internet Archive)
- Depth of syntactic constructions (Memento vom 21. Januar 2017 im Internet Archive)
- Es handelt sich um: Gert Prokop: Die Maus im Fenster. In: Gert Prokop: Die Maus im Fenster. Gute-Nacht-Geschichten. Benziger, Zürich/Köln 1982, Seite 7–18, ISBN 3-545-31111-2.
- Brigitta Niehaus: Untersuchung zur Satzlängenhäufigkeit im Deutschen. In: Karl-Heinz Best (Hrsg.): Glottometrika 16. The Distribution of Word and Sentence Length. Wissenschaftlicher Verlag Trier, Trier 1997, Seite 213–275, Daten Seite 240. ISBN 3-88476-276-1.