Einzelnen Beitrag anzeigen
  #1  
Alt 11.09.2016, 15:36
Mulder Mulder ist gerade online
Morricone-Verehrer
Foren-Stammgast 1000
 
Registriert seit: 16.03.2003
Beiträge: 1.445
Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)
Mathematik / Statistik und TTR

Hier mal der Versuch (ohne Mathematiker zu sein), das Thema mathematisch von einer anderen Seite zu betrachten, um mal das Verständnis dafür zu erhöhen.

Mal sehen, was wir haben :
Zitat:
Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und annähernd normalverteilt und schwanken mit einer Standardabweichung von 200 [gilt für Schach] um einen mittleren Wert.
http://de.wikipedia.org/wiki/Elo-Zahl
Oder etwas genauer
Zitat:
[...]Through observation of previous tournament results, Elo found that one class accurately portrayed the standard deviation (σ) in terms of strength of performance for a given chess player over a series of games.
Using past results and Harkness ratings, Elo observed that the distribution of individual performances resembles a normal distribution with a σ of one class (200 points). Using a mean (μ) of zero(1) gives us the following probability density function (pdf):
http://en.chessbase.com/post/arpad-e...-rating-system
Elo beobachtete also, daß die Werte eines Spielers normalverteilt sind

Nun kann man auch die TTR-Werte mal auf Normalverteilung untersuchen. Wir haben die Werte eines Spielers und einen Mittelwert.

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	ttr3.png
Hits:	580
Größe:	10,5 KB
ID:	57331

Wenn man die Spieler übereinander legt, bekommt man sowas :

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	ttr_hist_komb2.png
Hits:	684
Größe:	21,6 KB
ID:	57330

Das Rote ist die Gauß-Kurve, die man erhält, wenn man Mittelwert (wurde für jeden Spieler auf 0 gesetzt, um nur die Abweichunge davon zu erhalten) und Standardabweichung mit den Spielerdaten (Optimalfall mit Änderungskonstante 16 und einer Mindestzahl von 20 Werten, um nur Spieler ohne großartige Spielstärkeänderungen zu nehmen, außerdem wurde der Zeitraum für einen Mittelwert auf ein Jahr begrenzt) berechnet.
Der Mittelwert der Standardabweichungen ist ca. 19.

So, das war nun der erste Schritt, der Nachweis, daß auch die TTR-Werte normalverteilt sind.


Wenn man das berücksichtigt, kann man genauere Angaben zur Spielstärke machen. Es gibt Systeme, die tun dies auch, indem Mittelwert und ein Fehlerbereich mit angegeben wird.
Eins ist z.B. Glicko, eine Weiterentwicklung des Elo-Systems.
Zitat:
Als Erweiterung zum Elo-System führt Glickman die Variable RD (ratings deviation) ein. Diese schätzt ab, wie genau die aktuelle Wertungszahl mit der tatsächlichen (aber unbekannten) Spielstärke übereinstimmt. Mit einer Wahrscheinlichkeit von 67**% liegt die tatsächliche Spielstärke im Bereich von ±RD der Wertungszahl, mit 95**% im Bereich von ±2 RD.
http://de.wikipedia.org/wiki/Glicko-System
Zitat:
Glickman wrote his Harvard doctoral dissertation on what he viewed as deficiencies with the Elo ratings system, and devised a replacement, which he dubbed the “Glicko” system, in what I can only regard as a humorous tribute to his predecessor Professor Elo.** (I love clever people.)
It is the Glicko system that chess.com uses to calculate your rating.

One of Glickman’s innovations was to recognize that your rating is only an estimation of your true strength, and that there is uncertainty regarding your rating.** This uncertainty is represented by what has been dubbed the Rating Deviation.** This is merely chess talk for what a statistician calls the Standard Deviation, but it is a number that represents this uncertainty.** The larger the number, the more uncertainty surrounding your rating
http://schach.chess.com/blog/kurtgod...ting-explained
Was man eigentlich wissen will, ist die wahre Spielstärke bzw. der wahre TTR-Wert. An den kommt man aber nicht ran, da die Werte zufällig entstehen (man gewinnt und verliert mit einer bestimmten Wahrscheinlichkeit).
Wenn man oft würfelt, wird jede Augenzahl auch nicht mit genau 1/6 der Würfe geworfen, auch nicht bei einer hohen Anzahl an Würfen. Genausowenig kann die Spielstärke exakt bestimmt werden, selbst wenn man viele Spiele spielt. Es gibt immer einen Unsicherheit. Umgekehrt kann man aber mit einem bestimmten Vertrauensniveau < 100% ein Intervall für die wahre Spielstärke berechnen.

Bevor wir dahin gehen, nochmal kurz was zu den einzelnen TTR-Werten, die man auf mytischtennis einsehen kann : es handelt sich hier quasi um Meßwerte. Die Meßwerte streuen um den Mittelwert. Die Standardabweichung bezieht sich direkt nur auf diese Meßwerte. So kann man sagen, daß 95% der Meßwerte sich im Intervall

Mittelwert ± 2 · Standardabweichung

liegen.

Dieses Intervall sagt aber noch nichts über die wahre Spielstärke. Es geht ähnlich, hierfür ein solches Intervall zu bestimmen, aber etwas komplizierter. Dafür muß erstmal die Standardabweichung des Mittelwertes berechnet werden :

Standardabweichung des Mittelwertes = Standardabweichung / Wurzel(Anzahl der Werte)

je mehr Werte es gibt, umso kleiner ist also die Standardabweichung des Mittelwertes. Bei einer größeren Anzahl an Werten könnte man, wie oben, auch den Faktor 2 nehmen, um das Intervall mit einem Vertrauensniveau von 95% zu ermitteln. Hier muß man sich jetzt der sogenannten t-Faktoren bedienen, die man in einer entsprechenden Tabelle findet. Der Grund ist, daß bei Werten < 30 (bei einem Vertrauensniveau von 95%) die Standardabweichung der Stichprobe nicht mit der wahren Standardabweichung übereinstimmt.
Zitat:
Und falls die wahre Varianz σ2 der Daten nicht bekannt ist, d.h. man stattdessen die Stichprobenvarianz s2 berechnen muss (und das ist in der Realität quasi immer so), ist der Mittelwert der Stichprobe nämlich nicht normalverteilt, sondern t-verteilt mit n−1 Freiheitsgraden.
http://www.crashkurs-statistik.de/t-...enmittelwerte/
Die t-Verteilung berücksichtigt das. Das Vertrauensintervall ergibt sich so zu

Vertrauensintervall = Mittelwert ± t-Faktor · Standardabweichung des Mittelwertes

Hier wäre das Ziel quasi erreicht.

Im folgenden nun die Anwendung auf den TTR.

Hierfür exemplarisch mal einige Spieler einer Bundesliga-Mannschaft in detaillierter Ansicht.

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein detailliert.jpg
Hits:	729
Größe:	195,7 KB
ID:	57329

Welche Änderungskonstanten der Spieler hat, ist für die Entstehung des Mittelwertes interessant

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein detailliert _ ak.jpg
Hits:	689
Größe:	128,1 KB
ID:	57324

Bedeutung der 1-fachen Standardabweichung

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein detailliert _ std1.jpg
Hits:	673
Größe:	131,3 KB
ID:	57326

Bedeutung der 2-fachen Standardabweichung

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein detailliert _ std2.jpg
Hits:	695
Größe:	132,3 KB
ID:	57327

Berechnung der Standardabweichung des Mittelwertes

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein detailliert _ stdm.jpg
Hits:	643
Größe:	109,9 KB
ID:	57325

Berechnung des Vertrauensbereichs

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein detailliert _ vb.jpg
Hits:	690
Größe:	126,8 KB
ID:	57328

Wie man sieht, ist der Vertrauensbereich gar nicht mal so groß, für 95% ist der Mittelwert prinzipiell schon eine gute Näherung. Der Vertrauensbereich ist allerdings nur die mathematisch bedingte Unsicherheit. Die Fehler, die in realen Spielsizuationen auftreten (ginge wohl nur mit einer pauschalen Schätzung), müßten eigentlich noch addiert werden.

Eine Hauptunsicherheit ist z.B., daß die Spielstärken nicht transitiv sein müssen. A schlägt B und B schlägt C heißt nicht unbedingt, daß A auch C schlägt. Theoretisch setzt das Elo-System dies aber voraus.

Man sieht auch, der der einzelne TTR-Wert (hier der letzte) in den seltensten Fllen im Vertrauensbereich liegt und daher für eine Rangliste von Spielern derselben Klasse eigentlich nicht geeignet ist. Er springt nur immer wie ein besoffener Frosch umher.

So könnte eine Rangliste sein.

Klicken Sie auf die Grafik für eine größere Ansicht

Name:	Statistik Verein.jpg
Hits:	783
Größe:	106,7 KB
ID:	57332


Nach den AGB von mytt wäre sowas hier (öffentliche statistische Verarbeitung) übrigens nicht erlaubt.

P:S: die obigen Bilder muß ich korrigieren, einige Spieler wurden nicht richtig verarbeitet
__________________
Ich würde dir ja glauben - wenn du nur Recht hättest.

Geändert von Mulder (11.09.2016 um 16:35 Uhr)
Mit Zitat antworten