Elo-Zahl

Die Elo-Zahl (benannt nach Arpad Elo) ist eine Wertungszahl, die die Spielstärke von Schach- und Gospielern beschreibt. Inzwischen wurde das Konzept auch für verschiedene andere Sportarten adaptiert (s. u.).

Schach
Go

Ausgehend vom Bradley-Terry Modell (benannt nach R. A. Bradley und M. E. Terry,[1] die es im Jahr 1952 präsentierten[2]), das wiederum auf einer Arbeit von Ernst Zermelo aus den 1920er Jahren basiert,[3][4][5] entwickelte Arpad Elo 1960 ein objektives Wertungssystem für den US-amerikanischen Schachverband USCF. Es wurde 1970 auf dem Kongress in Siegen vom Weltschachverband FIDE übernommen. Der Weltschachverband nennt sein System FIDE rating system. Eine Wertungszahl heißt offiziell FIDE rating, wird umgangssprachlich aber zumeist einfach als „Elo-Zahl“ bezeichnet. Neben dem internationalen Wertungssystem der FIDE existieren auch nationale Wertungssysteme mit unterschiedlichen Namen. In Deutschland heißt das nationale Wertungssystem Deutsche Wertungszahl (DWZ), in Österreich werden (nationale) Elo-Zahlen berechnet, und in der Schweiz gibt es eine Führungsliste mit Führungszahlen. Diese Systeme werten wesentlich mehr lokale Turniere aus, berechnen die Wertungszahlen aber ebenso nach den Methoden von Arpad Elo mit meist nur geringen Modifikationen und abweichenden Faktoren.

Berechnung

Grundprinzip

Jedem Spieler ist eine Elo-Zahl (von englisch rating) zugeordnet. Je stärker der Spieler, desto höher die Zahl. Treten mehrere Spieler gegeneinander an, so lässt sich aus den Elo-Zahlen der Spieler die erwartete Punktezahl der jeweiligen Spieler bestimmen. Nach der Begegnung wird das Elo-Rating der Spieler ihren Ergebnissen angepasst. Je nach Differenz zwischen Erwartungswert und Ergebnis gewinnt ein Spieler Elo-Rating-Punkte hinzu oder verliert sie. Das System ist so konstruiert, dass Elo-Rating-Punkte unter den beteiligten Spielern umverteilt werden.

Wenn ein Spieler noch keine Elo-Zahl hat, zum Beispiel als Neuling, wird seine Elo-Zahl geschätzt.

Erwartungswert

Bei einer Begegnung zweier Spieler gibt es für einen Sieg einen, für ein Unentschieden einen halben und für eine Niederlage keinen Punkt. Die erwartete Punktezahl (von englisch expected score, Erwartungswert) ist somit die Wahrscheinlichkeit, dass der Spieler gewinnt, plus die halbe Wahrscheinlichkeit für ein Remis. Im Erwartungswert steckt somit eine gewisse Bandbreite an Spielausgängen. So bedeutet zum Beispiel zum einen eine Gewinnwahrscheinlichkeit von 50 %, eine Remiswahrscheinlichkeit von 0 % und eine Verlustwahrscheinlich von 50 %. Auf der anderen Seite bedeutet er aber auch eine Gewinnwahrscheinlichkeit von 0 %, eine Remiswahrscheinlichkeit von 100 % und eine Verlustwahrscheinlich von 0 % und natürlich alle Abstufungen dazwischen, etwa +10,=80,-10. Ein anderes Beispiel: kann sowohl bedeuten 75 % Sieg, 0 % Remis, 25 % Verlust als auch im anderen Extrem 50 % Sieg, 50 % Remis, 0 % Verlust.

Der Erwartungswert ergibt sich aus den beiden Ratings und wird wie folgt berechnet:

RA−RB EA EB
0 0,50 0,50
100 0,64 0,36
200 0,76 0,24
300 0,85 0,15
400 0,91 0,09
: erwarteter Punktestand für Spieler A
: bisherige Elo-Zahl von Spieler A
: bisherige Elo-Zahl von Spieler B

Entsprechend gilt für den erwarteten Punktestand für Spieler B

Hierbei gilt stets[Anm. 1]

Die in der Formel enthaltene Zahl 400 ist schachspezifisch und wurde von Arpad Elo so gewählt, dass die Elo-Zahlen mit den Wertungszahlen des früher verwendeten Schach-Rating-Systems von Kenneth Harkness möglichst gut kompatibel sind (im Schweizer Tischtennis wird z. B. 200 statt 400 verwendet, im deutschen 150, s. u.). Tatsächlich kann man das Harkness-System als eine stückweise lineare Approximation an das Elo-Modell auffassen. Beträgt der Wertungsunterschied mehr als 400 Punkte, so erlaubt die FIDE anstelle der tatsächlichen Differenz den Wert 400 bzw. −400 zu benutzen. Ab 2022 kann ein Spieler aber nur noch einmal pro Turnier von einer solchen Aufwertung profitieren, für die anderen eventuellen Gegner mit einem Wertungsunterschied > 400 wird dann mit dem tatsächlichen Wertungsunterschied gerechnet.[6]

Die Gewinnerwartung eines Spielers als Funktion der Punktedifferenz folgt in Elos Modell einer logistischen Funktion. Das heißt jedoch nicht, dass die Stärken der Spieler logistisch verteilt sind. Elo verzichtet auf eine solche Verteilungsannahme. Sein Modell fußt auf der charakteristischen Eigenschaft der Multiplikativität der Erwartungswerte.

Multiplikativität der Erwartungswerte

Die Erwartungswerte sind multiplikativ. Wenn etwa Spieler A gegenüber Spieler B ein 3:1-Favorit ist (d. h., A erzielt in Partien gegen B 75 % der Punkte) und B gegenüber C ein 2:1-Favorit, so fordert bzw. folgt aus Elos Modell, dass A gegenüber C ein 6:1-Favorit ist.

Allgemein: Ist A ein x:1-Favorit gegenüber B und B ein y:1-Favorit gegenüber C, so ist gemäß Elos Modell A ein (x*y):1-Favorit gegenüber C.

Dies kann man leicht nachrechnen. Die Multiplikativität ist aber keine Konsequenz aus einer Normalverteilung, was man oft liest. Diese bezieht sich nur auf die Abweichung der tatsächlichen Spielergebnisse eines Spielers vom Erwartungswert (s. u.) und nicht auf eine Normalverteilung der Stärken der Spieler. Die Forderung nach Multiplikativität stellt den besseren Ausgangspunkt für die Entwicklung des Modells dar – insbesondere für die Kalkulation der Spielstärken von Spielern früherer Epochen.

Anpassung der Elo-Zahl

Die neue Elo-Zahl von Spieler A ergibt sich aus der bisherigen Leistung und der aktuellen Leistung, wobei letztere mit einem Faktor/Koeffizienten gewichtet wird. Je größer , desto stärker wirken sich die erspielten Ergebnisse auf die neue Elo-Zahl aus:

:neue Elo-Zahl
:alte Elo-Zahl
:legt den theoretisch maximal möglichen Elo-Punktgewinn/-verlust fest, den es bei einer Partie geben kann. Er ist damit ein Koeffizient für den „Entwicklungsstand“ eines Spielers (englisch: development coefficient), den es im Schach in drei Größen gibt (40, 20, 10):[6]
a) für Spieler, die neu in der Ratingliste sind und weniger als dreißig gewertete Partien aufweisen. b) für alle Spieler bis zum Ende des Kalenderjahres ihres 18. Geburtstags, solange ihre Bewertung < 2300 bleibt.
für alle Spieler mit mindestens dreißig gewerteten Partien und einer Elo-Zahl < 2400. Dieser k-Wert trifft für die meisten erwachsenen Spieler zu.
für alle Top-Spieler mit einer Elo-Zahl ≥ 2400 und die sich auch auf diesem Level etwa halten können.
ist im Schweizer Tischtennis einheitlich geltend (s. u.)
:tatsächlich erreichte Punkte von Spieler A (1 für jeden Sieg, 0,5 für jedes Unentschieden, 0 für jede Niederlage)

Beispiel: Alfred (2806) vs. Berta (2577)

Der Schachspieler Alfred (Elo: 2806=) spielt gegen die Schachspielerin Berta (Elo: 2577=). Das entspricht einem Wertungsungunterschied von 229. Gemäß der ersten Formel erwartet man, dass Alfred gegen Berta im Mittel 0,789 Punkte pro Spiel bekommt:

Nach einem Spiel gibt es drei Möglichkeiten (angenommen sei dabei ):

a) Berta gewinnt – also . Die neuen Elo-Punktestände für Alfred und für Berta sind

Alfred büßt acht Elo-Punkte ein, während Berta acht Elo-Punkte gewinnt.

b) Alfred gewinnt – also .

Alfred erhält zwei Elo-Punkte, Berta verliert zwei.

c) Unentschieden – also .

Alfred verliert drei Elo-Punkte, Berta gewinnt drei.

Weitere Beispiele

  • Ab welchem Wertungsungunterschied (Elo-Differenz zwischen den Spielern) ist bei einem Sieg der maximale Elo-Punktgewinn möglich?
Der maximal mögliche Elo-Punktgewinn/-verlust ist durch den -Faktor festgelegt.
Bei (Topspieler) können also theoretisch maximal 10 Elo-Punkte in einer Partie gewonnen/verloren werden. Um die zu erreichen, müsste man einen Spieler mit einer um 512 höheren Elo-Zahl besiegen (EA  0,05).[Anm. 2]
Bei müsste man für maximal mögliche 20 Elo-Punkte einen Spieler mit einer um 637 höheren Elo-Zahl besiegen (EA  0,025).
Bei würde man die theoretisch möglichen 40 Elo-Punkte ab einer Elo-Differenz von 760 gewinnen (EA  0,0125).
  • Wie groß ist der Elo-Punktgewinn bei einem Sieg gegen einen gleichstarken Spieler?
Sind beide Spieler gleich stark, also und entsprechend , so können bei einem Sieg maximal also Elo-Punkte dazugewonnen werden. Bei einem Remis bleiben die Elo-Zahlen unverändert.
  • Wie groß darf der Wertungsungunterschied sein, um bei einem Remis gegen einen schwächeren Spieler keine Elo-Punkte zu verlieren?
    Analog wäre die Frage: Ab welchem Wertungsungunterschied muss man gegen einen schwächeren Spieler gewinnen, um keine Elo-Punkte abgeben zu müssen?
Dafür muss der Punktzugewinn sein, da ab −0,5 auf −1 gerundet wird. Da (Remis) gilt (nach Umstellung der Formel): .
Bei ergibt das für . Für einen solchen Erwartungswert darf der Wertungsunterschied maximal Elo-Punktebetragen.[Anm. 3]
Bei ergibt sich die Bedingung , wofür der Wertungsunterschied nicht mehr als Elo-Punkte betragen darf. Anders gesagt: Hat der Gegenspieler eine um mindestens 18 Punkte schlechtere Elo-Zahl, verliert man bei einem Remis mindestens einen Elo-Punkt. Analog dazu reicht dem schwächeren Spieler ab einem solchen Wertungsungunterschied auch ein Remis, um seine Elo-Zahl zu verbessern.
Bei ist die Bedingung , wofür der Wertungsunterschied nicht mehr als Elo-Punkte betragen darf.

Probleme und statistische Phänomene von Rating-Systemen

Intransitivität von Wahrscheinlichkeitsrelationen

Ist Spieler A gegenüber Spieler B der Favorit und B gegenüber C, so besitzt A ein höheres Rating als B und B ein höheres als C. Damit besitzt A ein höheres Rating als C und müsste Favorit gegenüber C sein.

Diese Folgerung ist aber keineswegs zwingend, da Wahrscheinlichkeits- bzw. Präferenzrelationen nicht notwendigerweise transitiv sind. Dieses Problem ist keine Besonderheit des Elo-Systems, sondern ein prinzipielles Problem aller Rating-Systeme. (vgl. Condorcet-Paradoxon, „Chinesische Würfel“ oder „Intransitive Würfel“)

Transitivität ist jedoch eine notwendige Voraussetzung für ein sinnvolles Rating-System. Um diese Eigenschaft zu sichern, setzte Arpad Elo bei der Entwicklung seines Rating-Systems voraus, dass das zu erwartende Spielergebnis in Abhängigkeit der Spielstärken mithilfe der Formel: (siehe oben) beschreibbar ist. Aus dieser Annahme folgt neben der Transitivität auch die oben dargestellte Multiplikativität der Erwartungswerte.

Deflation und Inflation

Will man mithilfe der Elo-Zahlen – oder anderer Ratings, dies betrifft nicht nur das Elo-System – die Stärken von Spielern aus unterschiedlichen Epochen vergleichen, so sollte ein Rating von z. B. 1600 aus dem Jahre 1970 gleichbedeutend mit einem Rating von 1600 aus dem Jahre 2000 sein. Insbesondere sollte, da sich infolge der Weiterentwicklung der Theorie die durchschnittliche Spielstärke im Laufe der Zeit zumindest nicht verschlechtert, sich die mittlere Ratingzahl nicht verringern.

Beim Elo-System gewinnt der Sieger einer Partie genau so viele Rating-Punkte hinzu, wie der Verlierer einbüßt: die mittlere Spielstärke beider bleibt gleich. Umfasst der Rating-Pool (die Rangliste) nur starke Spieler, so ist folgendes Phänomen zu beobachten: Sooft ein Spieler neu in die Ratings aufgenommen wird, tritt er mit einer gewissen (niedrigen) Punktezahl ein. Im Laufe seiner Karriere verbessert er seine Stärke, gewinnt Punkte hinzu und scheidet später mit einer (hohen) Punktezahl aus – dadurch werden der Gesamtheit Punkte entzogen, und die mittlere Ratingzahl sinkt; d. h., das System ist deflationär.

Vergrößert man den Rating-Pool auch auf schwächere Spieler, so tritt der entgegengesetzte Effekt auf: Viele Spieler verlassen den Ratings-Pool mit einem niedrigeren Rating, als ihnen bei Eintritt zugemessen wurde – das System wird nun inflationär.

Dies war insbesondere früher der Fall, als der Weltschachbund FIDE Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, zuletzt im Juli 2009 auf 1200.[7] Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Ratings-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten. Eine maßvolle Inflation ist jedoch durchaus erwünscht, diese sollte in ihrem Ausmaß der Weiterentwicklung der Spielstärken im Laufe der Zeit Rechnung tragen, allerdings ergibt sich hier zumeist das Problem einer zu großen Inflation.

So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Im Jahr 2000 gab es nur einen Spieler (Kasparow) mit einer Elo-Zahl größer 2800, elf Spieler größer 2700, und etwa 90 erreichten einen Wert über 2600.[8] Im Juli 2010 hatten bereits über 200 aktive Spieler eine Elo-Zahl größer 2600, davon 37 mindestens 2700; drei Spieler hatten sogar eine Elozahl von 2800 oder höher,[9] was 20 Jahre zuvor undenkbar schien.

Die durchschnittliche Elo-Zahl der ersten 100 Spieler der Weltrangliste stieg zwischen Juli 2000 und Juli 2012 von 2644 auf 2703 Punkte, also eine Steigerung um 59 Wertungspunkte. Seit 2012 liegt der Mittelwert zwischen 2700 und 2706 und ist damit recht konstant.[10]

Das Tausend-Partien-Problem

Ein weiteres Phänomen ist das sogenannte Tausend-Partien-Problem. Oft treffen Spieler der gleichen Spielstärke immer wieder aufeinander. Angenommen, zwei Spieler mit Elo 2000 spielen zehn Partien, bei denen der eine 80 % der Punkte erreicht. Nach der Berechnung der neuen Elo-Zahl ergeben sich die Werte 2080 für den Sieger und 1920 für den Verlierer. Tragen die beiden Spieler jedoch 1000 Partien mit gleichem Punkteverhältnis aus, ohne dass die Wertung aktualisiert wird, so ergibt sich für den Sieger eine neue Wertungszahl, die höher als die des aktuellen Weltmeisters ist. Jedoch ist dieses Szenario nur theoretischer Natur. Nach dem Statistikgesetz der großen Zahl darf man erwarten, dass die beiden gleich starken Spieler (beide hatten Elo 2000) sich nach vielen Partien den zu erwartenden 50 % annähern. Zudem wird es in der Praxis nie 1000 Partien ohne Ratingaktualisierung geben.

Die Entwicklung der Wertzahlen wird auch von der Auswertungsperiode beeinflusst. Nach einer Testphase mit unregelmäßigen Veröffentlichungen wurde von 1975 bis 1980 einmal jährlich im Januar eine neue Liste veröffentlicht. Beginnend im Juli 1981 wurde auf halbjährliche Veröffentlichung umgestellt und dies bis Juli 2000 so beibehalten. Im Oktober 2000 wurde dann auf Veröffentlichung alle drei Monate umgestellt. Von Juli 2009 bis Juli 2012 wurde alle zwei Monate ausgewertet.[7] Seit August 2012 wird monatlich ausgewertet.[11] Die minimale Wertungszahl beträgt seitdem 1000 Punkte, zuvor lag sie bei 1200. Sinnvoll wäre prinzipiell eine Auswertung nach jedem Turnier, da so Formschwankungen von Spielern besser ausgeglichen werden können. Allerdings ist das derzeit nicht geplant.

Schwankungsbreite und Aussagekraft

Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und annähernd normalverteilt und schwanken mit einer Standardabweichung von 200 um einen mittleren Wert. Es gibt viele Schachspieler mit Spielstärken unter 1200. Auf diesem Spielniveau ist das Elo-System in der Vorhersagesicherheit aber nur eingeschränkt anwendbar. Wichtig ist insbesondere auf Hobbyspielerniveau, dass ein Spieler seine Zahl auch gegen stärkere Gegner verteidigen kann, ohne sich auf besondere Eigenschaften wie unbewusste psychische Schwächen oder schlechtes Zeitmanagement von Neulingen konzentrieren zu müssen. Utopisch hohe Werte werden durch Niederlagen schnell, exakt und zuverlässig korrigiert. Die recht stabile Elo-Zahl wird mit verschiedenen Verfahren ermittelt. Manche gehen von wenigen Spielen aus oder von ähnlich starken Turnierteilnehmern. Nach vielen Partien erreichen aber alle sehr ähnliche Gleichgewichte. Bei Computern ist die Verteilung nicht nur per 200-Punkte-Definition gleich, sondern auch vom Kurvenverhalten her darüber hinaus sehr ähnlich, allerdings gibt es bei ähnlich starken Maschinen eine weitere Spielstärkenspreizung in den verschiedenen Partiephasen.

Elo-Performance

Als Elo-Performance (auch Turnierleistung genannt) bezeichnet man die in Elo-Punkten ausgedrückte Leistung eines Spielers in einem einzelnen Turnier. Im Gegensatz zur normalen Elo-Berechnung geht die vorherige Elo-Zahl nicht in diese Wertung ein. Die Elo-Performance wird neben ihrem rein sportlichen Aussagewert als Kriterium zur Vergabe von Sonderpreisen gewählt, wenn ein anderer direkter Leistungsvergleich der Spieler nicht möglich ist – z. B., um den besten Einzelspieler in einem Mannschaftsturnier zu bestimmen.

Schach

Spielerklassen – Einstufung der Spielern nach Elo-Zahl

Vor Einführung der Elo-Zahl stufte man die Spieler beim Schach in neun Klassen oder Kategorien ein. Ein Unterschied von einer Klasse bedeutete, dass der bessere Spieler als Ergebnis einer Partie 0,75 Punkte erwarten darf. Im Elo-System entspricht dieser Spielstärkeunterschied einer Differenz von etwa 200 Wertungspunkten (genauer: 190,85).[Anm. 4] Eine Erweiterung stellt das Glicko-System dar.

Das Elo-System teilt die Schachspieler mit Hilfe der Elo-Zahl in neun Klassen ein, wobei die untere Grenze der obersten Klasse bei 2600 und die obere Grenze der untersten Klasse bei 1200 liegt.

Zuordnung der Titel nach der Wertungszahl
Elo-Zahl Kategorie Männer Kategorie Frauen
≥ 2500Großmeister (GM)
2400–2499Internationaler Meister (IM)
2300–2399FIDE-Meister (FM)Großmeister der Frauen (WGM)
2200–2299Candidate Master (CM) oder
Nationaler Meister
Internationaler Meister der Frauen (WIM)
2100–2199MeisteranwärterFIDE-Meister der Frauen (WFM)
2000–2099ExperteCandidate Master der Frauen (WCM)
1800–1999 Amateur, Klasse A, sehr guter Vereinsspieler
1600–1799 Amateur, Klasse B, starker Freizeitspieler
1400–1599 Amateur, Klasse C, überdurchschnittlicher Spieler
1200–1399 Amateur, Klasse D, durchschnittlicher Hobbyspieler
1000–1199 Gelegenheitsspieler
< 1000 Anfänger

Zu beachten ist dabei, dass man die verschiedenen Titel Großmeister (GM) und Internationaler Meister (IM) nicht nur auf Grund einer bestimmten Elo-Zahl erhält, sondern durch die Erfüllung von anderen festgelegten Normen. Um den Titel nach Erfüllung aller Normen zu erhalten, muss ein angehender GM allerdings eine Elo-Zahl von mindestens 2500, ein IM eine Zahl von mindestens 2400 einmal erreicht haben. Die Anforderungen an Titel für Frauen liegen jeweils um 200 Elo-Punkte niedriger als an entsprechende Titel für Männer.

Der Umfang einer Klasse beträgt 200 Elo-Punkte. Das System ist so kalibriert, dass ein Unterschied von 200 Punkten einer Gewinnerwartung des stärkeren Spielers von 76 % entspricht, 400 Punkte entsprechen 92 % Gewinnerwartung.[12] Die Formel P=1/(1+10−D/400) gilt dabei nur näherungsweise (D = Wertungsunterschied bzw. die Differenz der Spielstärken).[13] Der Vergleich beruht auf statistischen Verfahren. Bei 600 Punkten Unterschied gewinnt der stärkere Spieler statistisch fast immer (98 %).

Spielstärken ausgewählter Schachspieler

Nachdem im Jahr 1970 die Elo-Zahl als Wertungssystem eingeführt worden war, hatte zunächst Bobby Fischers Bestmarke von 2785 Punkten vom Juli 1972 für viele Jahre Bestand. Im Jahre 1999 erreichte der damalige klassische Schachweltmeister Garri Kasparow die Elo-Zahl von 2851 Punkten, die erst im Januar 2013 von Magnus Carlsen mit 2861 Punkten übertroffen wurde. Inzwischen konnte Carlsen den Rekord auf 2882 erhöhen (Liste vom Mai 2014).

Elo-Zahlen können auch für einzelne Turniere berechnet werden (siehe oben: Elo-Performance). Hierbei gelang Fabiano Caruana im Jahr 2014 beim Turnier um den Sinquefield Cup in St. Louis eine Elo-Leistung von 3103.[14] Die davor gültige höchste Turnier-Elo-Leistung war 3002, erzielt von Magnus Carlsen in Nanjing im Jahr 2010.[15]

Großmeister kommen normalerweise auf eine Elo-Zahl von mindestens 2500, ab 2600 Punkten kann man von der erweiterten Weltspitze sprechen. Den Stand der FIDE-Auswertung vom Februar 2022 zeigt die folgende Tabelle mit den zwanzig am höchsten bewerteten aktiven Spielern, ergänzt um die beste Frau und die besten männlichen und weiblichen Spieler aus Deutschland, Österreich und der Schweiz (in Klammern: Platz in der Frauenrangliste):

Rang Name Rating
(Feb. 2022)
Land
1 Magnus Carlsen 2865 Norwegen Norwegen
2 Alireza Firouzja 2804 Frankreich Frankreich
3 Ding Liren 2799 China Volksrepublik Volksrepublik China
4 Fabiano Caruana 2792 Vereinigte Staaten Vereinigte Staaten
5 Ian Nepomnashchi 2773 Russland Russland
6 Levon Aronian 2772 Armenien Armenien
7 Anish Giri 2772 Niederlande Niederlande
8 Wesley So 2772 Vereinigte Staaten Vereinigte Staaten
9 Şəhriyar Məmmədyarov 2767 Aserbaidschan Aserbaidschan
10 Alexander Grishchuk 2764 Russland Russland
11 Richárd Rapport 2763 Ungarn Ungarn
12 Maxime Vachier-Lagrave 2761 Frankreich Frankreich
13 Jan-Krzysztof Duda 2760 Polen Polen
14 Teymur Rəcəbov 2753 Aserbaidschan Aserbaidschan
15 Leinier Domínguez Pérez 2752 Vereinigte Staaten Vereinigte Staaten
16 Viswanathan Anand 2751 Indien Indien
17 Wang Hao 2744 China Volksrepublik Volksrepublik China
18 Sergey Karjakin 2743 Russland Russland
19 Veselin Topalov 2730 Bulgarien Bulgarien
20 Wei Yi 2729 China Volksrepublik Volksrepublik China
...
74 Vincent Keymer 2664 Deutschland Deutschland
...
82 (1) Hou Yifan 2658 China Volksrepublik Volksrepublik China
...
88 Markus Ragger 2656 Osterreich Österreich
...
212 Vadim Milov 2602 Schweiz Schweiz
676 (14) Elisabeth Pähtz 2507 Deutschland Deutschland
4536 (?) Regina Theissl-Pokorná 2296 Osterreich Österreich
5128 (?) Lena Georgescu 2278 Schweiz Schweiz

Historische Elo-Zahl im Schach

Für den Vergleich heutiger Spitzenspieler mit Großmeistern vor der Einführung der Elo-Zahl wird die sogenannte historische Elo-Zahl verwendet.

Spielstärke der Schachprogramme

Die Elo-Zahlen der Schachcomputer bzw. Computerprogramme sind nicht ohne weiteres mit denen menschlicher Schachspieler zu vergleichen, da sie überwiegend durch Partien zwischen Computern ermittelt wurden und nicht durch Teilnahme an offiziellen Turnieren.

Turnierkategorien – Einteilung der Turniere nach Elo-Zahl

Turnier-
kategorie
Elo-Durchschnitt
Von Bis
1 22512275
2 22762300
3 23012325
. . .
7 24012425
. . .
11 25012525
. . .
15 26012625
. . .
19 27012725
20 27262750
21 27512775
22 27762800
23 28012825

Auch Rundenturniere werden nach der durchschnittlichen Elo-Zahl der Teilnehmer in Kategorien eingeteilt. Hierbei entspricht ein Unterschied um eine Kategorie 25 Elo-Punkten. Als Turnier der Kategorie 1 wird dabei ein Turnier eingestuft, dessen Teilnehmer im Durchschnitt 2251 bis 2275 Elo-Punkte haben. Die zurzeit stärksten Turniere erreichen die Kategorie 22, was einem Durchschnitt von 2776 bis 2800 Elo-Punkten entspricht. Bei der Zürich Chess Challenge 2014 wurde im Januar 2014 erstmals Kategorie 23 (mit einem Elo-Durchschnitt von 2801) erreicht.

Weitere Anwendung und Verbreitung

Go

Bei Go wird die Spielstärke traditionell in Kyū-Graden (jap. ) für Schüler und Dan-Graden (jap. ) für Meister angegeben. Die Ermittlung dieser Spielstärke basiert innerhalb der European Go Federation und bei vielen Go-Servern im Internet auf einem von Elo abgeleiteten System, welches Kyū- und Dan-Grade wie folgt abbildet:

kyu/dan Elo Spielstärke und -erfahrung[16]
weltbeste 9p-KI5185AlphaGo Zero auf einem TPU-v2-Modul mit 180 TFLOPS[17]
weltbester 9p-Spieler3830Shin Jin-seo, weltbester Gospieler (Stand: 2. Dezember 2021)[18]
1p – 9pab circa 2600professioneller Go-Spieler (aus Japan, Korea oder China), der stärker als ein Amateur-6dan spielt
4d – 7dab 2350einer der besten Spieler seines Landes
1d – 3d2050–2349sehr guter Club-Spieler
4k – 1k1650–2049guter Club-Spieler
9k – 5k1150–1649regelmäßiger Club-Spieler
13k – 10k750–1149Club-Spieler
17k – 14k350–749regelmäßiger Hobby-Spieler
21k – 18k0–349Hobby-Spieler
24k – 22k einige Partien gegen Nicht-Anfänger gewonnen
27k – 25k einige Partien gegen Anfänger gewonnen
29k – 28k einige Partien gespielt
30k Regeln verstanden, aber noch keine Partie gespielt

Fußball

Die FIFA-Weltrangliste der Frauen wird seit 2003 offiziell mit einem adaptierten Elo-System ermittelt. Seit 2018 wird die FIFA-Weltrangliste für Männer auch auf ein adaptiertes Elo-System umgestellt.[19]

Eine länger bestehende inoffizielle Adaption des Elo-Systems für Männernationalmannschaften im Fußball sind die World Football Elo Ratings. Inoffizielle Elo-Ratings werden auch für Fußball-Clubs vorgenommen.[20]

Tischtennis

Swiss Table Tennis nutzt seit der Saison 2010/2011 eine etwas modifizierte Elo-Formel zur Berechnung von Wertungspunkten[21]

EA: Erwarteter Punktestand für Spieler A.
RA: bisherige Punkte-Zahl von Spieler A
RB: bisherige Punkte-Zahl von Spieler B

Der Erwartungswert für A beträgt nun EA · 100 %. Die neue Punkte-Zahl von Spieler A ist

SA: tatsächlich gespielter Punktestand (1 für jeden Sieg, 0 für jede Niederlage, Remis ist im Tischtennis nicht möglich)

In Deutschland wird nach einem analogen System für jeden Aktiven ein TTR-Wert errechnet.[22] Hier wird die Wertungsdifferenz durch 150 geteilt.[23]

Scrabble

Für weltweites Scrabble (Global Scrabble) wird eine Elo-Rangliste von der World English-language Scrabble Players’ Association (WESPA) geführt. Auf Rang 1 dieser Elo-Rangliste liegt der Neuseeländer Nigel Richards (2156 Elo-Punkte, Stand 17. Oktober 2020).[24]

Seit 2009 wird auch für das deutschsprachige Scrabble eine Elo-Rangliste geführt – basierend auf Turnieren ab 2005. Unter 206 Spielern aus 5 Ländern liegt hier der Deutsche Ben Berger mit 1754 Elo-Punkten auf Rang 1 (Stand: 26. Februar 2017).[25]

League of Legends

Im MOBA League of Legends, einer Liga eines Computer-Strategiespiels, wurde ebenfalls das Elo-System bei gewerteten Spielen verwendet. Inzwischen wurde es durch das Ligasystem ersetzt, dem aber noch das Elo-System zu Grunde liegt.[26]

Bei einem Sieg bekommt man League Points (LP), bei einer Niederlage werden LP abgezogen. Bis Ende 2020 musste man bei 100 LP ein Best of three bzw. five gewinnen, um eine Liga aufzusteigen.

Erläuterungen

  1. Beweis: Wir setzen zur Abkürzung
    und erhalten
    Vorstehender Ausdruck ist definiert, da eine Zehnerpotenz ist, für die stets gilt. Wir können nun schreiben
    Beides sind definierte Brüche, da für als Zehnerpotenz auch gilt. In die Ursprungsformel eingesetzt folgt nun:
    q. e. d.
  2. Um die Frage zu beantworten, muss die erste Elo-Formel nach (Elo-Differenz der Spieler) umgestellt werden:
    Für gilt nun: Um die maximalen Elo-Punkte zu gewinnen, muss der Punktgewinn also sein, da bei auf abgerundet werden würde. (Bei muss der Punktgewinn also sein, bei usw.) Das heißt also für den Punktgewinn:
    Mit (Partie gewonnen) ergibt das:
    Für ergibt sich also . In die obige Formel eingesetzt ergibt das:
  3. Je nach -Wert müssen für unterschiedliche Werte eingesetzt werden: (bei k=10), (bei k=20), (bei k=40)
  4. eingesetzt in Formel 4 ergibt einen Wertungsunterschied von rund 191:
Schach
Go
Fußball

Einzelnachweise

  1. E. E. M. van Berkum: Bradley-Terry model, Encyclopedia of Mathematics Online, abgerufen am 18. November 2014.
  2. Ralph Allan Bradley, Milton E. Terry: Rank Analysis of Incomplete Block Designs: I. The Method of Paired Comparisons. Biometrika, Bd. 39, Nr. 3/4, S. 324, 1952 JSTOR (abgerufen am 22. August 2018).
  3. David R. Hunter: MM algorithms for generalized Bradley–Terry models. The Annals of Statistics, Bd. 32, Nr. 1, 2004, S. 384–406 Online JSTOR (abgerufen am 22. August 2018).
  4. Ernst Zermelo: Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung. Mathematische Zeitschrift, Bd. 29, Nr. 1, 1929, S. 436–460 DOI (abgerufen am 22. August 2018).
  5. Heinz-Dieter Ebbinghaus: Ernst Zermelo: An Approach to His Life and Work. Springer, Berlin 2007, ISBN 978-3-5404-9553-6, S. 268–269.
  6. FIDE Rating Regulations In: handbook.fide.com Punkt 8.3 „Ermittlung der Elo-Anpassung von Ranglisten-Spielern“ mit Festlegungen für den k-Faktor (englisch)
  7. Changes in the Rating Regulations from 1.7.2009 Auf: fide.com, 15. Juli 2009
  8. Top 100 Players July 2000 - Archive. fide.com, abgerufen am 6. Dezember 2021.
  9. Top 100 Players July 2010 - Archive. fide.com, abgerufen am 6. Dezember 2021.
  10. http://ratings.fide.com/toplist.phtml?list=men
  11. FIDE July ratings – Carlsen at a record 2837, chessbase.com (englisch)
  12. 8.0. The working of the FIDE Rating System, World Chess Federation
  13. 12.0. Some comments on the Rating system, World Chess Federation
  14. Johannes Fischer: Sinquefield Cup: Drei Remis zum Schluss. In: Schach Nachrichten. chessbase, 7. September 2014, abgerufen am 8. September 2014.
  15. Stefan Löffler: Wie eine Maschine. Der erst 22 Jahre alte Fabiano Caruana lehrt Schach-Weltmeister Carlsen das Fürchten. In: Frankfurter Allgemeine Zeitung vom 8. September 2014, S. 32.
  16. Rémi Coulom: Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength. In: remi-coulom.fr. Abgerufen am 4. Januar 2017 (englisch).
  17. David Silver, Julian Schrittwieser, Karen Simonyan: Mastering the game of Go without human knowledge. In: Nature. Band 550, 19. Oktober 2017, S. 354–359 (englisch, Abstract).
  18. Shin Jin-seo. In: goratings.org. Abgerufen am 2. Dezember 2021 (englisch).
  19. https://resources.fifa.com/image/upload/revision-of-the-fifa-coca-cola-world-ranking.pdf?cloudid=akxuma7jhfjwlwfmfexz
  20. http://clubelo.com/
  21. (abgerufen am 20. Juli 2017).
  22. Zeitschrift tischtennis, 2020/11, Seite 32 f.
  23. TTR – Die „Elo-Zahl“ des Tischtennis In: statistik-dresden.de
  24. WESPA Ratings (Englisch) 17. Oktober 2020. Abgerufen am 4. April 2021.
  25. Elo-Rangliste (Memento vom 24. April 2012 im Internet Archive)
  26. http://forums.euw.leagueoflegends.com/board/showthread.php?t=1232907&page=1#post11986204
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.