Glottochronologie
Glottochronologie (v. att.-griech. γλῶττα „Zunge, Sprache“ und χρόνος „Zeit“) ist das Teilgebiet der Lexikostatistik, das sich mit zeitlichen Beziehungen zwischen Sprachen befasst. Im Besonderen beanspruchen die Verfechter der Methode, zwischen als verwandt angesehenen Sprachen die Zeit seit der Trennung von der jeweiligen gemeinsamen Vorgängerin berechnen zu können. Dies beruht auf der Annahme, dass sich die Ersetzungen in einer universalen Testliste aller Sprachen in allen Zeiten konstant so verhalten hätten wie bei einigen für einen gewissen Zeitraum durch schriftliche Texte belegten Beispielen. Diese Annahme ist widerlegt.[1]
Ursprung und Entwicklung
„Die“ Glottochronologie gibt es nicht. Über die oben genannten Grundannahme hinaus unterscheiden wir zwei grundlegend unterschiedliche Annahmen über die Art des Zerfalls, sowie weiterer zusätzlicher Faktoren bei verschiedenen Autoren. Die Ergebnisse der verschiedenen Ansätze widersprechen sich weitgehend. Alle Berechnungen beruhen auf meist unsorgfältig oder aus überholten Werken zusammengeschriebenen Wortlisten.[2]
Methode der Gleichsetzung mit dem radioaktiven Zerfall: „Klassische Glottochronologie“
Diese Richtung geht von der Formel des radioaktiven Zerfalls aus. Immer wieder missverstanden, beinhaltet diese Formel, dass zu jedem Zeitpunkt alle verbliebenen radioaktiven Isotope dieselbe Zerfallswahrscheinlichkeit besitzen, und damit in gleichen Zeiträumen derselbe Prozentsatz der exponentiell abnehmenden Zahl dieser Isotope zerfällt. In den 1950er Jahren lernte man, diese Gesetze zur Altersbestimmung radioaktiven Materials heranzuziehen.
Dies regte den amerikanischen Sprachwissenschaftler Morris Swadesh an, die Methode auch zur Altersbestimmung von Sprachen anzuwenden. Er setzte die Eigenschaften von als ursprünglich vermuteten Wörtern seiner Testlisten denen radioaktiver Isotope gleich, weil beide ja mit der Zeit abnähmen. Auf Grund unscharfer Formulierung wird oft übersehen, dass unter diesem Gesetz die absolute Anzahl der in aufeinanderfolgenden Zeiträumen zerfallenden Originalelemente, und nur diese, damit exponentiell abnimmt. Um möglichst viele verschiedene Sprachen vergleichen zu können, entwarf Swadesh Wortlisten, die möglichst kulturunabhängig, also „universal“, sein sollten. Die Listen sollten darüber hinaus einen möglichst stabilen Wortschatz repräsentieren, um auch zwischen entfernter verwandten Sprachen noch ausreichende Gemeinsamkeiten zu erhalten. Er benannte diese Listen unterschiedlich, am treffendsten als universal test list, die Listen wurden jedoch bald Swadesh-Listen genannt. „Die“ Swadesh-Liste gibt es übrigens nicht, da Swadesh sie mehrfach umgearbeitet hat: beginnend mit 200, erweitert auf 215, letztlich reduziert auf 100 (wie 1972 post mortem veröffentlicht). Weiter gibt es über ein Dutzend Entwürfe von anderen Seiten.[3] Zunächst berechnete Lees (1953) die Zerfallsrate von 215 Testbegriffen in 13 Sprachen mit teilweise weit auseinander liegenden Textbelegen, z. B. alt-ägyptisch. 1955 überprüfte Swadesh sieben davon und verglich dabei gleichzeitig seine jetzt auf 100 Wörter verringerte Testliste.
Die Glottochronologie begegnete bald scharfer Kritik. Knut Bergsland und Hans Vogt wiesen schon 1962 nach, dass die Annahme konstanter Ersetzungsraten nicht haltbar ist.[4] Johann Tischler fand 1973, dass sich für die indogermanischen Sprachen irreale Trennungsdaten ergaben.[5]
Verfechter der Glottochronologie sehen den Hauptgrund dafür in nicht erkannten Entlehnungen, denen unterschiedlich begegnet wurde:
- Die Linguistin Sheila Embleton nutzte das Vorwissen über Entlehnungen in den germanischen Sprachen dazu, diese mit zusätzlichen Algorithmen quantitativ hochzurechnen, und gelangte so zu beeindruckenden Ergebnissen.[6] Diese Ergebnisse reichen jedoch nur wenig über die Zeit der ersten Belege zurück. Die Kompliziertheit ihrer Methodik und die Unsicherheiten in der Datenanalyse anderer Sprachfamilien verhindern jedoch bis heute weitere Tests.
- Der russische Sprachwissenschaftler Sergei Anatoljewitsch Starostin rechnete einfach nur mit den „wirklich wichtigen“ internen Neuerungen. Er hat u. a. einen Schwerpunkt auf die dene-kaukasische Hypothese gelegt, bei der zeitliche Bezugspunkte jedoch fragwürdig bleiben. Sein Anspruch, die Berechnungen von Bergsland und Vogt widerlegt zu haben, beruht auf fragwürdig unterschiedlichen etymologischen Wortdeutungen. Er und sein Sohn Georgij Starostin sehen ihr Verdienst darin, die ursprüngliche Gleichung an ihre Erkenntnisse angepasst zu haben ("modifizierte Glottochronologie"). Er gruppierte Albanisch zu Griechisch, aber Balto-Slawisch zu Indo-Iranisch. Starostin kam letztlich zu dem Schluss, statt von Bedeutungen von etymologischen „Wurzeln“ auszugehen, verstarb jedoch 2005, ohne diesen Ansatz weiter verfolgt zu haben. In derselben Tradition verwendet Václav Blažek (2007) erweiterte, nicht mehr so stark eingeschränkte Wortlisten.[7]
Einen Überblick über die Forschungsgeschichte geben Sheila Embleton (2000) und Hans J. Holm (2007). Obwohl sich die Veranstalter der Tagung Time Depth um Ausgewogenheit bemühten, fand sich kein ordentlicher Professor der Indogermanistik oder der vergleichenden Sprachwissenschaft als Befürworter der Glottochronologie.
Alle Varianten dieses traditionellen Ansatzes beruhen auf drei fehlerhaften Annahmen, nämlich, dass die Wörter der Listen wie Radionuklide (radioaktive Isotope)
- alle mit der gleichen Wahrscheinlichkeit „zerfallen“ (im Falle der Wörter „ersetzt“ werden);
- nur einmal zerfallen bzw. ersetzt werden können;
- dies in einer für alle etwa gleichen Geschwindigkeit geschieht.
Methode der Gleichsetzung mit evolutionsbiologischen Annahmen
Viele – durchaus nicht alle – Bioinformatiker nehmen eine feste Mutationsrate der Gene an, deren Zahl aber – im Gegensatz zu den radioaktiven Elementen – damit nicht abnimmt. Die unter diesen Annahmen entwickelten Algorithmen wurden in den letzten Jahren auch mechanistisch auf Swadesh- und andere Wort-Listen angewandt.
Am bekanntesten wurde eine Arbeit von Gray und Atkinson.[8] Das Team mit wechselnden Beteiligungen publiziert nahezu jährlich neue und unterschiedliche Stammbäume.[9][10][11] Trotz modernster Verfahren und trickreicher Modifikationen der Ersetzungsraten kann das Ergebnis weder zeitlich noch strukturell überzeugen: Zeitlich wies es extrem in die Vergangenheit; strukturell wurde Albanisch irrig zu Arisch gruppiert, Germanisch zu Italisch. Zudem täuscht die Darstellung darüber hinweg, dass sich zunächst nur ein ungerichtetes Grafenbündel (unrooted phylogeny) ergibt, und die Position des Hethitischen nachträglich eingeführt wurde (Holm 2007). Die Varianten dieses „biologischen“ Ansatzes beruhen – neben den bereits genannten fehlerbehafteten Daten – auf zwei fragwürdigen Annahmen, nämlich, dass die Wörter der Listen wie Gene und deren Allele (1) mit berechenbaren Wahrscheinlichkeiten „mutieren“ (im Falle der Wörter „ersetzt“ werden); (3) dies in einer für alle etwa gleichen Ersetzungsrate geschieht, wodurch sich für früh ausgestorbene Sprachen mit vielen Ersetzungen falsch-frühe Trennungen ergeben müssen. Die letzte große Arbeit des Teams um Russell D. Gray zur Indogermanistik erschien 2012 in Science mit dem Anspruch, die indogermanische Urheimat in Anatolien durch eine entsprechend frühe Aufgliederung zu beweisen.[12] Wegen übersehener erheblicher Zählfehler verschob sich das Ergebnis jedoch tatsächlich um etwa 2000 Jahre ins Jüngere, womit der angestrebte Beweis hinfällig wurde, und Science eine von vielen nicht bemerkte Korrektur abdrucken musste.[13]
Zu all diesen Unsicherheiten addiert sich, dass die Bayes'sche Methode (durch Primärwahrscheinlichkeiten) bedingte (Schluss)-wahrscheinlichkeiten berechnet, deren Streuungsergebnisse alle möglich, aber ungleich wahrscheinlich sind. Im Bewusstsein dieser einschränkenden Bedingungen sind die Ergebnisse jedoch nicht völlig wertlos und können versuchsweise angewandt werden. Dies hat Hans J. Holm (2019) unternommen, um die Möglichkeit einer Übereinstimmung der Fuhrwerkserfindung mit der möglichen Präsenz und dem Zerfall der indogermanischen Sprechergemeinschaft zu korrelieren.[14]
Grundlagen
Soziologische Aspekte
Sprachlicher Wandel basiert im Gegensatz zur Annahme der Glottochronologen nicht auf der Wirkung eines Perpetuum Mobile, sondern hat handfeste, meist nachvollziehbare psycho-soziale und sozio-historische Gründe, die unvorhersehbar und unberechenbar sind. Diese Feststellung bleibt wahr, auch wenn die Auswirkungen in den o. g. Swadesh-Listen geringer als im Rest auftreten (die sogenannte Zipf-Verteilung). Über die Feststellungen von Bergsland und Vogt hinaus lassen sich für den sprachhistorisch und völkerkundlich Bewanderten leicht weitere Gegenbeispiele mit sozio-historischen Gründen finden:
- So gibt es z. B. Sprachen, die lange Zeit wenig von außen beeinflusst wurden. Gründe hierfür sind etwa ihre isolierte Lage (sogenannte „konservative Saumlagen“, z. B. beim Isländischen) oder das die Sprache beeinflussende kulturelle Selbstbewusstsein, z. B. beim Griechischen gegen den Einfluss der Romania.
- Die Palette des Sprachwandels umfasst weiter eine große Zahl von Zwischenstufen und Sprachmischungen, sogenannte Pidgin- und Kreolsprachen, nicht nur heute als Folge von Kolonisation und Vertreibung.
- Viele Sprachen sind gar über längere oder kürzere Zeitspannen ausgestorben, z. B.: die hethitische Sprache nach 1200 v. Chr., die Sprache vieler sogenannter Pygmäenstämme wegen stärkerer Außenbindung und wirtschaftlicher Abhängigkeit von benachbarten Bantustämmen; die Sprache der Veddas (Wedda) in Sri Lanka, die das Singhalesische oder Tamilische übernommen haben; das Gallische nach der Unterwerfung durch Caesar im heutigen Frankreich und viele andere, alles völlig unabhängig von irgendeiner „Rate“.
Diese soziohistorische Abhängigkeit des Sprachwandels wurde und wird von allen führenden historisch-vergleichenden Sprachwissenschaftlern[15] weltweit immer wieder betont.
Historisch-archäologische Aspekte
Vor allem (s. o.) entzündet sich die Kritik an den zeitlichen Ergebnissen. Annehmbare Zeiten im groben Zeitraum der Erhebungen sind kein Beweis; die angestrebten prähistorischen Ergebnisse dagegen sind nicht verifizierbar.[16] Notfalls werden die Raten „angepasst“, z. B. hat Starostin die von Swadesh ermittelte Rate von 14 % für die indogermanischen Sprachen auf 5 % geändert.[17]
Die Problematik der Basiszeiten für die Ermittlung vermuteter Zerfallsraten kann gut im Abschnitt Skandinavische Sprachen ersehen werden. Die Trennung des Isländischen kann man z. B. mit der Besiedlung Islands im 9. Jahrhundert beginnen lassen, doch eine Wegentwicklung des Norwegischen beginnt erst Jahrhunderte später; vor allem sind die – je nach Autor – 4 bis 19 Entlehnungen in der Swadeshliste nicht „als Funktion von Zeit entstanden“, sondern im Wesentlichen in den rund 300 Jahren der dänischen Herrschaft von 1536 bis 1814 übernommen worden.
Linguistische Aspekte
Kritik allein gegen die Stabilität bestimmter semantischer Felder (vgl. Haarmann 1990) in den Swadesh-Listen trifft ins Leere, da ein gewisser Wandel überhaupt nicht bestritten wird. Auch die oft (zu Recht) bemängelten handwerklichen Schwächen der Testliste, wie Mehrdeutigkeiten wegen fehlender Beispielsätze, treffen nicht den Kern der Methode.
Schwerer wiegt dagegen die mangelhafte linguistische Qualität der meisten Swadesh-Listen, z. B. so auch der im Internet verfügbaren Dyen-list; bereits von Sh. Embleton 1995 beanstandete Fehler im englischen Teil wurden nie berichtigt;[18] weitere zwölf Prozent Fehler enthält der albanische Teil.[19]
In vielen, wenn nicht den meisten Fällen des von Glottochronologen angenommenen „Sprachwandels“ handelt es sich nicht um einen Wandel per Zeitraum, sondern um Substrate, Reste eines schon vorher dagewesenen Bestandes, die sich bei Übernahme einer neuen Standardsprache erhalten haben, aus verschiedensten Gründen. Bekannt ist z. B. das maritime Substrat der germanischen Sprachen (z. B. Mast, Kiel, Segel), also Lexeme aus Bereichen, in denen die Eingesessenen gegenüber den zugewanderten Trägern der (hier) indogermanischen Sprachen eine höhere Vor-Kompetenz besaßen. Gleiches gilt für die Technik des Webens. Beispiele aus der Swadesh-Liste bringt Aaron Dolgopolsky,[20] Lehrer des o. g. S. Starostin, mit der im Übrigen kenntnisreichsten Kritik aus geisteswissenschaftlicher Sicht.
Mathematisch-stochastische Aspekte
Unbestritten unterliegen die meisten Sprachen im Laufe ihrer Geschichte mehr oder weniger starken Einflüssen und Änderungen. Das bedeutet aber, von Mathematikern allzu oft übersehen, dass sich Sprachen zwar in der Zeit, jedoch nicht durch die Zeit wandeln. Statistisch können sich dabei oft grob übereinstimmende Summen ergeben, die ungenau als "Raten" interpretiert werden. Beim Vergleich vieler Arbeiten ergibt sich eine normalverteilte Gaußkurve, deren Dimensionen weiterer Studien bedarf.
Auf der Voraussetzung einer Rate baut die zweite grundlegende Annahme der Glottochronologen auf, nämlich dass Sprachen desto näher verwandt seien, je mehr gemeinsame Erbwörter sie aufweisen. Diese auf den ersten Blick einleuchtende Ad-hoc-Annahme übersieht deren Bedingtheit von drei weiteren bestimmenden Parametern (Proportionalitätsfehler).[21] Hier wird in allen glottochronologischen Arbeiten gegen die grundlegende mathematische Regel verstoßen, nämlich zunächst die stochastischen Verteilungen der benutzten Daten zu analysieren, in diesem Fall die hypergeometrische Verteilung und die abgebrochene Zipf- oder Pareto-Verteilung.
Siehe auch
Literatur
- Arne A. Ambros: Linguistische und statistische Bewertung von lexikalischen Koinzidenzphänomenen. In: Karl-Heinz Best, Jörg Kohlhase (Hrsg.): Exakte Sprachwandelforschung. Theoretische Beiträge, statistische Analysen und Arbeitsberichte. edition herodot, Göttingen 1983, ISBN 3-88694-024-1, S. 21–43.
- Knut Bergsland, Hans Vogt: On the Validity of Glottochronology. In: Current Anthropology. Bd. 3, Nr. 2, April 1962, S. 115–153.
- Lyle Campbell: Historical Linguistics; An Introduction. Edinburgh University Press, Edinburgh 1998, ISBN 0-7486-0775-7, Chapter 6.5. Glottochronology.
- Aharon Dolgopolsky: Sources of linguistic chronology. In: C. Renfrew, A. McMahon, Larry Trask (Hrsg.): Time depth in historical linguistics. Vol 2 [16], The McDonald Institute for Archaeological Research, Cambridge, UK 2000, ISBN 1-902937-14-7, S. 401–409. (Wohl der fundierteste Beitrag in dem Sammelband)
- Sheila Embleton: Lexicostatistics /Glottochronology: from Swadesh to Sankoff to Starostin to future horizons. In: C. Renfrew, A. McMahon, Larry Trask (Hrsg.): Time depth in historical linguistics. Vol 1 [7], The McDonald Institute for Archaeological Research, Cambridge, UK 2000, ISBN 1-902937-13-9, S. 143–167.
- Harald Haarmann: Basic vocabulary and language contacts; the disillusion of glottochronology. In: Indogermanische Forschungen. Nr. 95, 1990, S. 1–37.
- L. Hoffmann, R. G. Piotrowski: Beiträge zur Sprachstatistik. Verlag Enzyklopädie, Leipzig 1979, S. 162–174.
- Hans J. Holm: Genealogische Verwandtschaft. In: Quantitative Linguistik. (= Handbuch Sprach- und Kommunikationswissenschaften. Band 27). de Gruyter, Berlin 2005, Kap. 45.
- Hans J. Holm: The new Arboretum of Indo-European 'Trees'; Can new algorithms reveal the Phylogeny and even Prehistory of Indo-European? In: Journal of Quantitative Linguistics. Band 14, Nr. 2, 2007, S. 167–214.
- Hans J. Holm: Steppe homeland of Indo-Europeans favored by a Bayesian approach with revised data and processing. In: Glottometrics. Band 37, 2017, S. 54–81 (PDF , Volltext)
- David Sankoff: On the Rate of Replacement of Word-Meaning Relationships. In: Language. Band 46, 1970, S. 564–569.
- Morris Swadesh: Towards greater accuracy in lexicostatistic dating. In: International Journal of American Linguistics. Univ. of Chicago Press, Chicago 21.1955, S. 121–137. ISSN 0020-7071
- Morris Swadesh: What is glottochronology? In: M. Swadesh: The origin and diversification of language. Routledge & Kegan Paul, London 1972, ISBN 0-7100-7195-7, S. 271–284.
- Johann Tischler: Glottochronie und Lexikostatistik. (= Innsbrucker Beiträge zur Sprachwissenschaft. Band 11). Innsbruck 1973, S. 143–167.
Weblinks
- Lexikostatistik und Glottochronologie (christianlehmann.eu)
- Bernhard Ganter: Sprachvergleich – Qualitative Methoden. Technische Universität Dresden, Vorlesung im SS 2004 an der TU Dresden (math.tu-dresden.de)
Einzelnachweise
- Bergsland/Vogt 1962.
- Hans J. Holm: Albanische Basiswortlisten und die Stellung des Albanischen in den indogermanischen Sprachen. In: Zeitschrift für Balkanologie. Band 45, Nr. 2, 2009.
- Sheila M Embleton: Statistics in Historical Linguistics. (= Quantitative Linguistics. 30). Brockmeyer, Bochum 1986.
- Bergsland/Vogt 1962.
- Tischler 1973.
- Sheila M. Embleton: Statistics in Historical Linguistics. Brockmeyer, Bochum 1986, ISBN 3-88339-537-4.
- Václav Blažek: From August Schleicher to Sergej Starostin. On the development of tree-diagram models of the Indo-European languages. In: The Journal of Indo-European Studies. Vol. 35, Nr. 1, 2007, S. 82–109.
- R. D. Gray, Q. D. Atkinson: Language-tree divergence times support the Anatolian theory of Indo-European origin. In: Nature. 426/2003, S. 435–438.
- Gerhard Jäger: Wie die Bioinformatik hilft, Sprachgeschichte zu rekonstruieren. Tübingen, 24. November 2011. (sfs.uni-tuebingen.de)
- Gerhard Jäger: Computational historical linguistics. University of Tübingen, Institute of Linguistics (arxiv.org)
- Gerhard Jäger: Lexikostatistik 2.0. In: Albrecht Plewnia, Andreas Witt (Hrsg.): Sprachverfall? Dynamik – Wandel – Variation. (= Jahrbuch des Instituts für Deutsche Sprache 2013). de Gruyter, Berlin/ Boston 2014, ISBN 978-3-11-037474-2, S. 197–216. (ids-pub.bsz-bw.de)
- Bouckaert, R. / Lemey, Ph. / Dunn, M. et al. (2012): Mapping the origins and expansion of the Indo-European language family. Science 337, Aug. 24, 2012, p. 957ff. DOI: 10.1126/science.1219669.
- Bouckaert, R. / Lemey, Ph. / Dunn, M. et al. (2013): Mapping the origins and expansion of the Indo-European language family. Correction. Science 342-6165, S. 1446. DOI: 10.1126/science.342.6165.1446-a.
- Holm, Hans J. J. G. (2019): The Earliest Wheel Finds, their Archeology and Indo-European Terminology in Time and Space, and Early Migrations around the Caucasus. Series Minor 43. Budapest: Archaeolingua ALAPÍTVÁNY.
- Hans J. Holm: The new Arboretum of Indo-European „Trees“; Can new algorithms reveal the Phylogeny and even Prehistory of Indo-European? In: Journal of Quantitative Linguistics. Band 14, Nr. 2, 2007, S. 1–50.
- Sheila M. Embleton: Statistics in Historical Linguistics. Brockmeyer, Bochum 1986, ISBN 3-88339-537-4, S. 132 f.
- V. Blažek: From August Schleicher to Sergej Starostin. On the development of the tree-diagram models of the Indo-European languages. In: The Journal of Indo-European Studies. Band 35, Nr. 1–2, 2007, S. 85.
- Sheila M. Embleton: Review of Dyen/Kruskal/Black: A Lexicostatistical Experiment. In: Diachronica. Band 12, Nr. 2, 1995, S. 263–268.
- Hans J. Holm: Albanische Basiswortlisten und die Stellung des Albanischen in den indogermanischen Sprachen. In: Zeitschrift für Balkanologie. Band 45, Nr. 2, 2009.
- Aharon Dolgopolsky: Sources of linguistic chronology. 2000, S. 401 f.
- Hans J. Holm: The proportionality trap. Or: what is wrong with lexocostatistical subgrouping? In: Indogermanische Forschungen. Nr. 108, 2003, S. 38–46.