Einzelnen Beitrag anzeigen
  #3763  
Alt 30.01.2020, 18:40
appelgrenfan appelgrenfan ist offline
registrierter Besucher
Foren-Stammgast 2000
 
Registriert seit: 29.01.2017
Alter: 56
Beiträge: 2.037
appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)
AW: Allgemeine Diskussion über TTR-Werte

Der TTR-Wert schwankt doch aus zwei Gründen, ich hoffe soweit sind wir uns einig:

1. Die (systembedingten) zufälligen Schwankungen um den wahren Wert herum
Angenommen zwei Spieler sind (was immer das heißen mag) gleich stark und haben "wahre" 2000 TTR Punkte. Sie spielen acht Matches nur gegeneinander und Spieler 1 hat dabei die Serie NNSNSSSN, wobei N eine Niederlage für Spieler 1 ist und S ein Sieg für Spieler 1. Das ergäbe dann diese TTR-Werte:
2000/2000 > N > 1992/2008 > N > 1985/2015 > S > 1995/2005 > N > 1988/2012 > S > 1997/2003 > S > 2005/1995 > S > 2012/1988 > N > 2003/1997
So lange im Schnitt beide Spieler gleich oft gewinnen, schwankt der Wert um die gemeinsame Stärke herum, nähert sich ihr aber immer wieder relativ gut an. Wenn der QTTR-Stichtag nun nach dem zweiten Match liegt, ist Spieler 1 um 15 Punkte unterbewertet. (Das hatte ich irgendwann mal mit Shit happens bezeichnet. )
Die Mittelwerte hier wären:
Spieler 1: 1997
Spieler 2: 2003
Die Mittelwerte der TTR-Werte liegen näher an der wahren Spielstärke als die allermeisten TTR-Tageswerte, die im Maximum eine Abweichung von 15 Punkten erreichen. Damit wäre das in der Tat eine Verbesserung.

2. Eine Veränderung der wahren Spielstärke
Das ist schwieriger zu simulieren. Nehmen wir deshalb auch wieder ein stark vereinfachtes Beispiel an: Unser Spieler 1 hatte lange 1800 Punkte, die auch seiner Spielstärke entsprachen. Dann geht er in Trainingslager und hat nun eine Stärke von 2000 Punkten, sein TTR liegt aber noch immer bei 1800. Er spielt die gleiche Serie wie oben, denn er hat ja seit dem Trainingslager die gleiche Spielstärke wie Spieler 2. Das ergäbe dann diese Serie:
1800/2000 > N > 1799/2001 > N > 1798/2002 > S > 1813/1987 > N > 1812/1988 > S > 1827/1973 > S > 1841/1959 > S > 1855/1945 > N > 1852/1948
Wie sieht hier der Mittelwert im Vergleich zum QTTR nach den 8 Spielen aus?
1822 = -30 Punkte
Spieler 1 wird also durch die Mittelwertbildung um 30 Punkte schlechter bewertet als nach QTTR.
Nach 7 Spielen:
1818 = -37 Punkte
Nach 6 Spielen:
1813 = -28 Punkte
Hier liegen also die Abweichungen zwischen Mittelwert und QTTR zum jeweiligen Stichtag deutlich weiter auseinander. Der "wahre" Wert wäre in diesem Beispiel ja 1900 Punkte, da wieder nur die beiden gegeneinander spielen, sie gleich stark sind und im ganzen System nur die 3800 (1800+2000) Punkte sind, die beide mit hineingebracht haben. Im Vergleich zur wahren Spielstärke wird also Spieler 1 in beiden Methoden unterbewertet, im Mittelwertverfahren aber erheblich stärker als im aktuellen TTR-System. Das meinte ich damit, dass die Mittelwertberechnung dazu führt, dass das ganze System träger wird, also die Veränderungen langsamer passieren.

Zitat:
Zitat von Mulder
Jetzt versuchst du eine Säule mit genau dieser Höhe nachzubauen
Der Vergleich hinkt doch, weil die Säule in deinem Bild als konstant angenommen wird. In Wirklichkeit müsste deine Metapher lauten, dass du eine Säule, deren tatsächliche Höhe nicht nur nicht direkt messbar ist, sondern sich auch noch bei jedem Messwert ändert, nachbauen sollst.


Zitat:
Zitat von Mulder
kann man bei Kindern gerne eine Regressionsgerade berechnen (oder'n Polynom, oder ne logistische Funktion), kann man auch generell machen, nur wird die Steigung bei AK16 Spielern quasi 0 sein
Ein System, das solche Hilfskonstruktionen benötigt, überzeugt mich nicht besonders. Wer legt fest, welche Form (Gerade oder Polynom etc.) gewählt wird? Bis zu welchen Alter? Und warum soll bei Spielern mit einer Änderungskonstante von 16 die Steigung quasi 0 sein? Damit postulierst du, dass halbwegs etablierte Spieler sich nur extrem langsam verbessern (oder verschlechtern). Mit meiner TT-Wirklichkeit zumindest geht diese Annahme nicht zusammen.

Zitat:
Zitat von Mulder
im übrigen sind es nicht meine Vorschläge, sondern das, was in mehreren Elo basierten Ratingsystemen implementiert wurden, um das alte Elo System zu verbessern
Aus welchen der von dir verlinkten Systemen kommt der Vorschlag der Mittelwertbildung? In den Glicko-Formeln kann ich dazu nichts finden, auch in den anderen Links bin ich nicht fündig geworden. (Kann's aber auch übersehen haben - oder ich hab dich einfach die ganze Zeit falsch verstanden.)


@Mulder Wir können doch über dieses hochspannende Thema anständig diskutieren, ohne ausfallend zu werden? Wenn ich nicht schon so viel dazu geschrieben hätte, ich hätte alles wieder gelöscht.
Mit Zitat antworten