TT-NEWS Tischtennis Forum

TT-NEWS Tischtennis Forum (https://forum.tt-news.de/index.php)
-   allgemeines Tischtennis-Forum (https://forum.tt-news.de/forumdisplay.php?f=1)
-   -   Mathematik / Statistik und TTR (https://forum.tt-news.de/showthread.php?t=231641)

Mulder 11.09.2016 15:36

Mathematik / Statistik und TTR
 
Liste der Anhänge anzeigen (Anzahl: 10)
Hier mal der Versuch (ohne Mathematiker zu sein), das Thema mathematisch von einer anderen Seite zu betrachten, um mal das Verständnis dafür zu erhöhen.

Mal sehen, was wir haben :
Zitat:

Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und annähernd normalverteilt und schwanken mit einer Standardabweichung von 200 [gilt für Schach] um einen mittleren Wert.
http://de.wikipedia.org/wiki/Elo-Zahl
Oder etwas genauer
Zitat:

[...]Through observation of previous tournament results, Elo found that one class accurately portrayed the standard deviation (σ) in terms of strength of performance for a given chess player over a series of games.
Using past results and Harkness ratings, Elo observed that the distribution of individual performances resembles a normal distribution with a σ of one class (200 points). Using a mean (μ) of zero(1) gives us the following probability density function (pdf):
http://en.chessbase.com/post/arpad-e...-rating-system
Elo beobachtete also, daß die Werte eines Spielers normalverteilt sind

Nun kann man auch die TTR-Werte mal auf Normalverteilung untersuchen. Wir haben die Werte eines Spielers und einen Mittelwert.


Wenn man die Spieler übereinander legt, bekommt man sowas :


Das Rote ist die Gauß-Kurve, die man erhält, wenn man Mittelwert (wurde für jeden Spieler auf 0 gesetzt, um nur die Abweichunge davon zu erhalten) und Standardabweichung mit den Spielerdaten (Optimalfall mit Änderungskonstante 16 und einer Mindestzahl von 20 Werten, um nur Spieler ohne großartige Spielstärkeänderungen zu nehmen, außerdem wurde der Zeitraum für einen Mittelwert auf ein Jahr begrenzt) berechnet.
Der Mittelwert der Standardabweichungen ist ca. 19.

So, das war nun der erste Schritt, der Nachweis, daß auch die TTR-Werte normalverteilt sind.


Wenn man das berücksichtigt, kann man genauere Angaben zur Spielstärke machen. Es gibt Systeme, die tun dies auch, indem Mittelwert und ein Fehlerbereich mit angegeben wird.
Eins ist z.B. Glicko, eine Weiterentwicklung des Elo-Systems.
Zitat:

Als Erweiterung zum Elo-System führt Glickman die Variable RD (ratings deviation) ein. Diese schätzt ab, wie genau die aktuelle Wertungszahl mit der tatsächlichen (aber unbekannten) Spielstärke übereinstimmt. Mit einer Wahrscheinlichkeit von 67**% liegt die tatsächliche Spielstärke im Bereich von ±RD der Wertungszahl, mit 95**% im Bereich von ±2 RD.
http://de.wikipedia.org/wiki/Glicko-System
Zitat:

Glickman wrote his Harvard doctoral dissertation on what he viewed as deficiencies with the Elo ratings system, and devised a replacement, which he dubbed the “Glicko” system, in what I can only regard as a humorous tribute to his predecessor Professor Elo.** (I love clever people.)
It is the Glicko system that chess.com uses to calculate your rating.

One of Glickman’s innovations was to recognize that your rating is only an estimation of your true strength, and that there is uncertainty regarding your rating.** This uncertainty is represented by what has been dubbed the Rating Deviation.** This is merely chess talk for what a statistician calls the Standard Deviation, but it is a number that represents this uncertainty.** The larger the number, the more uncertainty surrounding your rating
http://schach.chess.com/blog/kurtgod...ting-explained
Was man eigentlich wissen will, ist die wahre Spielstärke bzw. der wahre TTR-Wert. An den kommt man aber nicht ran, da die Werte zufällig entstehen (man gewinnt und verliert mit einer bestimmten Wahrscheinlichkeit).
Wenn man oft würfelt, wird jede Augenzahl auch nicht mit genau 1/6 der Würfe geworfen, auch nicht bei einer hohen Anzahl an Würfen. Genausowenig kann die Spielstärke exakt bestimmt werden, selbst wenn man viele Spiele spielt. Es gibt immer einen Unsicherheit. Umgekehrt kann man aber mit einem bestimmten Vertrauensniveau < 100% ein Intervall für die wahre Spielstärke berechnen.

Bevor wir dahin gehen, nochmal kurz was zu den einzelnen TTR-Werten, die man auf mytischtennis einsehen kann : es handelt sich hier quasi um Meßwerte. Die Meßwerte streuen um den Mittelwert. Die Standardabweichung bezieht sich direkt nur auf diese Meßwerte. So kann man sagen, daß 95% der Meßwerte sich im Intervall

Mittelwert ± 2 · Standardabweichung

liegen.

Dieses Intervall sagt aber noch nichts über die wahre Spielstärke. Es geht ähnlich, hierfür ein solches Intervall zu bestimmen, aber etwas komplizierter. Dafür muß erstmal die Standardabweichung des Mittelwertes berechnet werden :

Standardabweichung des Mittelwertes = Standardabweichung / Wurzel(Anzahl der Werte)

je mehr Werte es gibt, umso kleiner ist also die Standardabweichung des Mittelwertes. Bei einer größeren Anzahl an Werten könnte man, wie oben, auch den Faktor 2 nehmen, um das Intervall mit einem Vertrauensniveau von 95% zu ermitteln. Hier muß man sich jetzt der sogenannten t-Faktoren bedienen, die man in einer entsprechenden Tabelle findet. Der Grund ist, daß bei Werten < 30 (bei einem Vertrauensniveau von 95%) die Standardabweichung der Stichprobe nicht mit der wahren Standardabweichung übereinstimmt.
Zitat:

Und falls die wahre Varianz σ2 der Daten nicht bekannt ist, d.h. man stattdessen die Stichprobenvarianz s2 berechnen muss (und das ist in der Realität quasi immer so), ist der Mittelwert der Stichprobe nämlich nicht normalverteilt, sondern t-verteilt mit n−1 Freiheitsgraden.
http://www.crashkurs-statistik.de/t-...enmittelwerte/
Die t-Verteilung berücksichtigt das. Das Vertrauensintervall ergibt sich so zu

Vertrauensintervall = Mittelwert ± t-Faktor · Standardabweichung des Mittelwertes

Hier wäre das Ziel quasi erreicht.

Im folgenden nun die Anwendung auf den TTR.

Hierfür exemplarisch mal einige Spieler einer Bundesliga-Mannschaft in detaillierter Ansicht.

Anhang 57329

Welche Änderungskonstanten der Spieler hat, ist für die Entstehung des Mittelwertes interessant

Anhang 57324

Bedeutung der 1-fachen Standardabweichung

Anhang 57326

Bedeutung der 2-fachen Standardabweichung

Anhang 57327

Berechnung der Standardabweichung des Mittelwertes

Anhang 57325

Berechnung des Vertrauensbereichs

Anhang 57328

Wie man sieht, ist der Vertrauensbereich gar nicht mal so groß, für 95% ist der Mittelwert prinzipiell schon eine gute Näherung. Der Vertrauensbereich ist allerdings nur die mathematisch bedingte Unsicherheit. Die Fehler, die in realen Spielsizuationen auftreten (ginge wohl nur mit einer pauschalen Schätzung), müßten eigentlich noch addiert werden.

Eine Hauptunsicherheit ist z.B., daß die Spielstärken nicht transitiv sein müssen. A schlägt B und B schlägt C heißt nicht unbedingt, daß A auch C schlägt. Theoretisch setzt das Elo-System dies aber voraus.

Man sieht auch, der der einzelne TTR-Wert (hier der letzte) in den seltensten Fllen im Vertrauensbereich liegt und daher für eine Rangliste von Spielern derselben Klasse eigentlich nicht geeignet ist. Er springt nur immer wie ein besoffener Frosch umher.

So könnte eine Rangliste sein.



Nach den AGB von mytt wäre sowas hier (öffentliche statistische Verarbeitung) übrigens nicht erlaubt.

P:S: die obigen Bilder muß ich korrigieren, einige Spieler wurden nicht richtig verarbeitet

Mulder 12.09.2016 11:05

AW: Mathematik / Statistik und TTR
 
Liste der Anhänge anzeigen (Anzahl: 1)
So müßte die detaillierte Rangliste eigentlich sein, aber letztlich gehts ja umsb Prinzip.


Vektor 12.09.2016 12:12

AW: Mathematik / Statistik und TTR
 
Sehr vieles von dem Geschriebnen klingt sehr gut und vernünftig. Insbesondere ein von der Menge der Daten abhängiger Vertrauensbereich ist aus mathematischer Sicht sichere sinnvoll.

Allerdings ist manches auch mit Vorsicht zu genießen. Wenn wir als Grundhypothese "schwankt um Mittelwert" hernehmen, so unterstellen wir, dass Spieler eine konstante Spielstärke haben, als keine Entwickung (Besser-Werden, Nachlassen) haben.
Genau Letzteres ist aber der Grund dafür, dass aktuelleren Ergebnissen ein höherer Einfluss auf den TTR-Wert zugerechnet wird als alten Ergebnissen.

Beachten muss man zudem auch, dass die einzelnen "Messwerte" keineswegs unabhängig voneinander sind. Ohne direkt zu überblicken, ob dies hier geschehen ist, muss man sich davor hüten, statistische Regeln für "stochastisch unabhhängige, normalverteilte Zufallsgrößen" anzuwenden.

Mulder 13.09.2016 00:05

AW: Mathematik / Statistik und TTR
 
Liste der Anhänge anzeigen (Anzahl: 1)
Zitat:

Zitat von Vektor (Beitrag 2777322)
Wenn wir als Grundhypothese "schwankt um Mittelwert" hernehmen

das gibt die Verteilung der Werte aber so vor. Wir nehmen sie nicht her, sondern sie ist da, damit ist es auch keine Hypothese

Zitat:

Zitat von Vektor (Beitrag 2777322)
, so unterstellen wir, dass Spieler eine konstante Spielstärke haben

Das habe ich auch getan oder eher vorausgesetzt
Zitat:

(Optimalfall mit Änderungskonstante 16 und einer Mindestzahl von 20 Werten, um nur Spieler ohne großartige Spielstärkeänderungen zu nehmen, außerdem wurde der Zeitraum für einen Mittelwert auf ein Jahr begrenzt) berechnet.
somit gilt die beobachtete Normalverteilung auch nur bei konstanter Spielstärke

Zitat:

Zitat von Vektor (Beitrag 2777322)
, als keine Entwickung (Besser-Werden, Nachlassen) haben.

nein, das ist kein Widerspruch.

Mir fallen 2 Möglichkeiten ein, um die Entwicklung eines Spielers zu berücksichtigen:

1.
man muß auch hier die Entwicklung der Mittelwerte betrachten. Je kleiner man hierbei aber den Zeitraum der Mittelwertbildung macht, umso höher ist auch der Unsicherheitsfaktor bzw. umso größer ist das Vertrauensintervall.

Wenn man gar nur einen einzigen Wert betrachtet (wie ja der aktuelle TTR oder der QTTR einer ist), so daß er selbst sein Mittelwert ist, kann man, jedenfalls mit der Tabelle der t-Faktoren, gar keinen Vertrauensbereich mehr angeben, d.h. ein einzelner Wert ist komplett unzuverlässig, um etwas über die Spielstärke zu sagen.


2.
Eine andere Möglichkeit wäre die Berechnung einer Geraden (oder sonstigen Funktion), wie man sie im Link in der 2. Abbildung Schach + Lerneffekt sieht.

Zitat:

Zitat von Vektor (Beitrag 2777322)
Genau Letzteres ist aber der Grund dafür, dass aktuelleren Ergebnissen ein höherer Einfluss auf den TTR-Wert zugerechnet wird als alten Ergebnissen.

das gibt der Elo aber, wie gesagt, nicht her, das zeigt auch das untige Münzwurfdiagramm. Deswegen haben Leute wie Glickman das Elo-System erweitert.

Zitat:

Zitat von Vektor (Beitrag 2777322)
Beachten muss man zudem auch, dass die einzelnen "Messwerte" keineswegs unabhängig voneinander sind.

Mach mal ne Strichliste mit Kopf und Zahl. Wenn im 20.Wurf 11mal Kopf geworfen wurde, ist das Verhältnis 11/20 = 0,55. Das heißt, daß beim nächsten Wurf nur 12/21 oder 11/21 auftreten können (falls es das ist, was du mit 'die Werte sind nicht unabhängig voneinander' meinst. Trotzdem sind die praktisch errechneten Wahrscheinlichkeitswerte normalverteilt um 0,5, den wahren Wert (+- Unsicherheit), zumindest wenn man immer dieselbe Anzahl an Würfen betrachtet. (Ansonsten sieht das so wie hier https://de.wikipedia.org/wiki/Datei:...ge-numbers.png , die Oszillation um 0,5 bleibt aber)
Ok, ich hab das mal gemacht, mit OOCalc aber
immer das Verhältnis von Kopf / Anzahl der Würfe der letzten 20 Würfe. So könnte auch der TTR-Verlauf aussehen, wenn 2 gleichstarke Spieler immer gegeneinander spielen.

Spätestens jetzt sollte man gemerkt haben, daß die einzelnen Werte keine Bedeutung haben, auch nicht für Leistungsschwankungen.

Ansonsten hab ich hier noch was gefunden, bis zur dritten Abbildung ist hierfür relevant.
http://magicblogs.de/multiplayerblog...-funktioniert/

Zitat:

Zitat von Vektor (Beitrag 2777322)
Ohne direkt zu überblicken, ob dies hier geschehen ist, muss man sich davor hüten, statistische Regeln für "stochastisch unabhhängige, normalverteilte Zufallsgrößen" anzuwenden.

Die Werte werden aber durch stochastisch unabhängige Ereignisse (Sieg/Niederlage) berechnet, daher verwundert die Normalverteilung keineswegs und die damit einhergehende statistische Bedeutung ist quasi naturgemäß. Siehe Münzwurfdiagramm (Ein Tischtennisspiel ist dabei ein Wurf mit gezinkter Münze, da er nicht gleichwahrscheinlich ist, aber das prinzip ist dasselbe). OOCalc kann leider keine Histogramme, aber um was wollen wir wetten, daß die Münzwurfwerte auch normalverteilt sind. Einfach, weil die Ursache dieselbe ist, der Zufall, daß ein Ereignis eintritt, Kopf oder Zahl, Sieg oder Niederlage.

Vektor 13.09.2016 08:15

AW: Mathematik / Statistik und TTR
 
Zitat:

Zitat von Mulder (Beitrag 2777509)
das gibt die Verteilung der Werte aber so vor. Wir nehmen sie nicht her, sondern sie ist da, damit ist es auch keine Hypothese
...
Das habe ich auch getan oder eher vorausgesetzt

Also als Hypothese unterstellt.
Und genau darauf bauen dann Schlussfolgerungen auf, die een nicht haltbar sind.

Mittelwerte von TTR-Werten werden immer von "alten" Spielen mehr beeinflusst als von "aktuellen" Spielen - und das ist widersinnig.

Bei unterstellter konstanter Spielstärke gibt es diesen Widersinn nicht, allerdings würde man dann besser jedes Spiel gleichstark gewichten.

Zitat:

Wenn man gar nur einen einzigen Wert betrachtet (wie ja der aktuelle TTR oder der QTTR einer ist), so daß er selbst sein Mittelwert ist[/B], kann man, jedenfalls mit der Tabelle der t-Faktoren, gar keinen Vertrauensbereich mehr angeben, d.h. ein einzelner Wert ist komplett unzuverlässig, um etwas über die Spielstärke zu sagen.
Du ignorierst hier völlig, dass ein TTR-Wert nicht ein einzelner Messwert ist, sondern sich aus vielen "Messungen" ergibt (und der nächste TTR-Wert sich aus fast denselben "Messungen" ergibt ...)


Zitat:

das gibt der Elo aber, wie gesagt, nicht her, das zeigt auch das untige Münzwurfdiagramm. Deswegen haben Leute wie Glickman das Elo-System erweitert.
Wie schon gesagt: Es ist durchaus sinnvoll, aus der Zahl der einfließenden Spiele (nicht: TTR-Werte!) auf so etwas wie ein "Vertrauensintervall" zu schließen, dass sich - wenn man keine unsinnigen Voraussetzungen unterstellt - aber nicht exakt bestimmen lässt.



Zitat:

zumindest wenn man immer dieselbe Anzahl an Würfen betrachtet.
Du betrachstest hier voneinander unabhängige Würfelserien. dann ist das richtig.

Wir haben für einen Spieler aber nur eine einzige Serie von Spielergebnissen, daraus ergibt sich eine (einzige) Kette von (hochgradig voneninander abhängigen) TTR-Werten.

Zitat:

Spätestens jetzt sollte man gemerkt haben, daß die einzelnen Werte keine Bedeutung haben, auch nicht für Leistungsschwankungen.
Wieder der entscheidende Punkt: Spielstärken verändern sich ...


Zitat:

Die Werte werden aber durch stochastisch unabhängige Ereignisse (Sieg/Niederlage) berechnet, daher verwundert die Normalverteilung keineswegs
Hier wirfst du Sachen zusammen, die nicht zusammengehören ...

Zitat:

Ein Tischtennisspiel ist dabei ein Wurf mit gezinkter Münze, da er nicht gleichwahrscheinlich ist, aber das prinzip ist dasselbe)
Du mittelst quasi diese Würfe mit Gewichtungsfaktoren (wie auch schon der TTR-Wert).
Dabei sind bei deiner Gewichtung alte Spiele mehr wert als neue - beim TTR-Wert ist es genau umgekehrt. Nun kann sich jeder selber überlegen, was sinnvoller ist.

TechMat 13.09.2016 08:34

AW: Mathematik / Statistik und TTR
 
Die Ereignisse A und B sind stochastisch unabhängig, falls gilt:
P(A und B) = P(A) * P(B), also die Wahrscheinlichkeit, dass A und B eintreten ist gleich der Wahrscheinlichkeit von A mal der Wahrscheinlichkeit von B.

Wenn ich vom jetzigen TTR-System ausgehe, so sind die Ereignisse aber nicht stochastisch unabhängig. Betrachte folgendes Szenario:
  • Ein Spieler hat einen aktuellen TTR von 1500, Änderungskonstante 16.
  • Sei A das Ereignis, dass der Spieler gegen einen Spieler mit TTR 1500 gewinnt.
  • Sei B das Ereignis, dass der Spieler am nächsten Tag gegen einen Spieler mit TTR 1500 gewinnt.

Für die Wahrscheinlichkeit von A gilt: P(A) = 1/2 (da beide Spieler 1500 haben)
Für die Wahrscheinlichkeit von B gilt: P(B) = 1/2 (da beide Spieler 1500 haben)

Aber für die Wahrscheinlichkeit, dass A und B eintritt (also dass der Spieler gegen beide Spieler gewinnt) ist laut aktuellem TTR-System:
P(A und B) > 1/4 = P(A) * P(B)
Grund:
Weil Ereignis A eingetreten ist, hat der Spieler 8 TTR Punkte hinzubekommen und hat somit am folgenden Tag einen TTR von 1508. Damit ist laut System seine Gewinnwahrscheinlichkeit gegen einen 1500er größer als 1/2

Ich habe mir dein System noch nicht angeschaut und kann daher auch nicht sagen, wie es dort aussieht. Da sich aber sicherlich auch dort der TTR Wert mit den alten Ergebnissen verändert, gehe ich mal stark davon aus, dass auch hier stochastische Abhängigkeit vorliegt.

Ob man dies aber vernachlässigen kann, ist wieder eine andere Frage und möchte ich mir jetzt keine Gedanken darüber machen :)

ps: Bin nicht ganz Fit in Stochastik / Statistik. Wenn ich irgendwo einen Denkfehler habe, dann korrigiert mich bitte :)

Vektor 13.09.2016 11:20

AW: Mathematik / Statistik und TTR
 
@TechMat: Das ist zwar auch richtig, aber nicht der entscheidende Punkt. Viel problematischer ist, die (hochgradig abhängigen) TTR-Werte als "Messpunkte" aufzufassen - und dann Regeln für unabhängige Messpunkte zu benutzen.

Icemanspirit 13.09.2016 13:06

AW: Mathematik / Statistik und TTR
 
Ich wuerde Dir bei einem solchem Interesse auch mal raten die Arbeiten von "Levy" anzuschauen.

Das meiste was normal erscheint hat zumeist anhaengige "tails" (Auslaeufer, ich habe die Englische Theorie gelernt und weiss deswegen leider nicht ob das die beste Uebersetzung in das Deutsche ist), welche man nur mit Levy-Theorie behandeln kann.

Hierbei machst du allerdings einen gewaltigen Theoriesprung. Alles was du hier bisher beschrieben hast sind vereinfachte Theorien und im Oberstufenbereich/ 1. Jahr Uni anzusiedeln. Levy-theorie wird typischerweise erst im Graduiertenbereich gelehrt.

Ich sage hier nicht, dass deine Annahmen falsch sind. Ich moechte nur zum Ausdruck bringen, dass Du eigentlich zu viele Annahmen einfliessen laesst. Nehme mal einen Schritt Abstand und betrachte deine Annahmen genauer. Kannst du diese auf mathematisch korrekter Weise ableiten? (eventuell mit Nutzung der genaueren Maßtheorie?)

mfg

Mulder 13.09.2016 13:31

AW: Mathematik / Statistik und TTR
 
@TechMat
Wenn du Münzen wirfst, nimmst du ja auch nicht errechnete Wahrscheinlichkeitswerten wie 11/20 und 12/21, sondern einfach 0,5, also den wahren Wert, um die stochastische Unabhängig zweier Würfe zu zeigen. Ebenso müßtest du das auch mit den TTR-Werten machen. Beim TTR müßte man auch den wahren Wert nehmen, der vor und nach dem Spiel gleich ist, der aber nunmal nicht exakt bestimmt werden kann.

Für stochastische (Un-)Abhängigkeit muß man die reale Situation betrachte.

Du machst zwei Spiele, die reale Spielstärke der Kontrahenten ist unbekannt und damit auch die Gewinnwahrscheinlichkeit

übertragen heißt das

Du wirfst 2 gezinkte Münzen, mit einer unbekannten Gezinktheit


die Würfe der beiden Münzen haben aber keinerlei Einfluß aufeinander, ebenso ist es egal, ob du Fr gegen X und So gegen Y spielst oder umgekehrt, die Spiele haben nix miteinander zu tun

Zitat:

Zwei Ereignisse A und B sind stochastisch unabhängig,
wenn das Eintreten des einen Ereignissen
das Eintreten des anderen Ereignisses nicht beeinflusst.
http://www.mathebibel.de/stochastische-unabhaengigkeit
Der TTR kommt jetzt dadurch ins Spiel, daß auf jede Seite der Münze ein Wert geschrieben wird. Der geworfene Wert hat einen Einfluß darauf, welche Werte auf der zweiten Münze geschrieben werden, aber keinen auf die Gezinktheit der Münzen (Gewinnwahrscheinlichkeit der Spieler).

Icemanspirit 13.09.2016 13:36

AW: Mathematik / Statistik und TTR
 
Zitat:

Zitat von Mulder (Beitrag 2777689)
@Techmath
Wenn du Münzen wirfst, nimmst du ja auch nicht errechnete Wahrscheinlichkeitswerten wie 11/20 und 12/21, sondern einfach 0,5, also den wahren Wert, um die stochastische Unabhängig zweier Würfe zu zeigen. (...)

Die reale Wahrscheinlichkeit ist nicht 0.5 pro Seite sondern bewegt sich eher bei 0.51 ;)


Alle Zeitangaben in WEZ +1. Es ist jetzt 11:49 Uhr.

Powered by vBulletin® Version 3.8.11 (Deutsch)
Copyright ©1999 - 2025, vBulletin Solutions, Inc.
www.TT-NEWS.de - ein Angebot der Firma ML SPORTING - Ust-IdNr. DE 190 59 22 77