Zurück   TT-NEWS Tischtennis Forum > Tischtennis allgemein > allgemeines Tischtennis-Forum
Registrieren Hilfe Kalender

allgemeines Tischtennis-Forum Dies ist unser Hauptforum. Hier geht es um Tischtennis allgemein und hier gehört alles rein, was nicht in die Fachforen oder sonstigen Foren passt.

Antwort
 
Themen-Optionen
  #3761  
Alt 30.01.2020, 16:55
Mulder Mulder ist offline
Morricone-Verehrer
Foren-Stammgast 1000
 
Registriert seit: 16.03.2003
Beiträge: 1.403
Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)
AW: Allgemeine Diskussion über TTR-Werte

Zitat:
Zitat von Vektor Beitrag anzeigen
@Mulder: Dein großer Denkfehler ist die Unterstellung einer "wahren", konstanten Spielstärke.
Sach mal, willst du mich völlig veren? Ich hab hier gerade 4 Verweise angebracht, bei denen von "true skill" oder "true strength" die Rede ist. Wenn du keine Lust hast, dich ernsthaft damit zu beschäftigen, halt dich doch einfach zurück.

Zitat:
Zitat von Vektor Beitrag anzeigen
Wenn es so wäre, dass Spielstärke kontant wäre, wäre Elo ein völlig ungeeigneter Ansatz.

[bei Elo ist es egal, ob die Spielstärke schwankt oder konstant ist, man braucht nur genug Ergebnisse und wie ich schon schrieb, kann man bei Kindern gerne eine Regressionsgerade berechnen (oder'n Polynom, oder ne logistische Funktion), kann man auch generell machen, nur wird die Steigung bei AK16 Spielern quasi 0 sein.]

Wenn man aber davon ausgeht, dass Ergebnisse umso mehr über Spielstärke aussagen, je aktueller sie sind

[du kannst keine Wahrscheinlichkeitsereignisse einzeln behandeln, du brauchst mehrere auf einmal. Du kannst nicht sagen : "Der letzte Wert sagt mehr über die Spielstärke als der 21-letzte", du kannst nur sagen "In den letzten 20 Spielen hat die Spielstärke (mit einer bestimmten Wahrscheinlichkeit) um soundsoviel Punkte zu-/abgenommen im ggs zu den 20 Spielen davor." Es sind

WAHRSCHEINLICHKEITSEREIGNISSE

, checkst du das nicht?

Wenn die letzten Spiele höher gewichtet werden sollen, muss trotzdem der Mittelwert gebildet werden, siehe weighted performance rating bei Chessmetrics zB


Nebenbei : Würde man übrigens nur den letzten TTR-Wert nehmen, würde folgendes passieren : Nehmen wir die Folge 1930 1940 1930, würde es gleichbedeutend damit sein, dass die letzten beiden Spiele nicht gespielt worden wären. Der Mittelwert berücksichtigt alle Spiele.]


, sieht die Situation völlig anders aus - man kann dann über parameter bestimmen, in welchem Maße alte Ergebnis an Bedeutung verlieren; und hier hat man sich auf ein Maß geeinigt, dass insgesamt als angemessen betrachtet wurde; alte Ergebnisse werden nicht zu schnell unbedeutend, bleiben aber auch nicht ewig wichtig (sofern der Spieler aktiv ist).

[das ist bei Elo völlig normal, weil nach jedem Spiel ein Summand hinzukommt, dadurch sinkt automatisch der Anteil früherer Spiele.]

Ohne Unterstellung konstanter Spielstärke sind deine Vorschläge einfach nicht sinnvoll - wie immer wieder gezeigt.
gar nichts hast du gezeigt

im übrigen sind es nicht meine Vorschläge, sondern das, was in mehreren Elo basierten Ratingsystemen implementiert wurden, um das alte Elo System zu verbessern (u.a. mit Mittelwert und Standardabweichung, einige habe ich just zitiert). Aber da sind deiner Meinung nach wohl alles Stümper am Werk, die das alles nur falsch verstanden haben. Du kannst gerne mal Professor Glickmann (Harvard) über seine fehlerhaften Annahmen belehren, die sein Doktorvater auch nur mal eben so durchgewunken hat, mal sehen, was er und der Rest der Fachhwelt dazu sagen.

Dir ist wirklich nicht mehr zu helfen. Bedauerlich nur, dass wie so oft ein Entscheidungsträger keine Ahnung hat, wovon er redet.

Sind Mathematiker wirklich so rar gesäht, dass sich niemand beim DTTB gefunden hat, der die nötige Kompetenz mitbringt?
__________________
Ich würde dir ja glauben - wenn du nur Recht hättest.
Mit Zitat antworten
  #3762  
Alt 30.01.2020, 17:17
Vektor Vektor ist offline
registrierter Besucher
Foren-Stammgast 1000
 
Registriert seit: 08.10.2000
Ort: Düren
Alter: 53
Beiträge: 1.923
Vektor ist zur Zeit noch ein unbeschriebenes Blatt (Renommeepunkte ungefähr beim Startwert +20)
AW: Allgemeine Diskussion über TTR-Werte

Wo steht etwas über Mittelwerte von Elo-Werten aus eine bestimmten Zeitraum?
Mit Zitat antworten
  #3763  
Alt 30.01.2020, 18:40
appelgrenfan appelgrenfan ist offline
registrierter Besucher
Foren-Stammgast 2000
 
Registriert seit: 29.01.2017
Alter: 56
Beiträge: 2.037
appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)
AW: Allgemeine Diskussion über TTR-Werte

Der TTR-Wert schwankt doch aus zwei Gründen, ich hoffe soweit sind wir uns einig:

1. Die (systembedingten) zufälligen Schwankungen um den wahren Wert herum
Angenommen zwei Spieler sind (was immer das heißen mag) gleich stark und haben "wahre" 2000 TTR Punkte. Sie spielen acht Matches nur gegeneinander und Spieler 1 hat dabei die Serie NNSNSSSN, wobei N eine Niederlage für Spieler 1 ist und S ein Sieg für Spieler 1. Das ergäbe dann diese TTR-Werte:
2000/2000 > N > 1992/2008 > N > 1985/2015 > S > 1995/2005 > N > 1988/2012 > S > 1997/2003 > S > 2005/1995 > S > 2012/1988 > N > 2003/1997
So lange im Schnitt beide Spieler gleich oft gewinnen, schwankt der Wert um die gemeinsame Stärke herum, nähert sich ihr aber immer wieder relativ gut an. Wenn der QTTR-Stichtag nun nach dem zweiten Match liegt, ist Spieler 1 um 15 Punkte unterbewertet. (Das hatte ich irgendwann mal mit Shit happens bezeichnet. )
Die Mittelwerte hier wären:
Spieler 1: 1997
Spieler 2: 2003
Die Mittelwerte der TTR-Werte liegen näher an der wahren Spielstärke als die allermeisten TTR-Tageswerte, die im Maximum eine Abweichung von 15 Punkten erreichen. Damit wäre das in der Tat eine Verbesserung.

2. Eine Veränderung der wahren Spielstärke
Das ist schwieriger zu simulieren. Nehmen wir deshalb auch wieder ein stark vereinfachtes Beispiel an: Unser Spieler 1 hatte lange 1800 Punkte, die auch seiner Spielstärke entsprachen. Dann geht er in Trainingslager und hat nun eine Stärke von 2000 Punkten, sein TTR liegt aber noch immer bei 1800. Er spielt die gleiche Serie wie oben, denn er hat ja seit dem Trainingslager die gleiche Spielstärke wie Spieler 2. Das ergäbe dann diese Serie:
1800/2000 > N > 1799/2001 > N > 1798/2002 > S > 1813/1987 > N > 1812/1988 > S > 1827/1973 > S > 1841/1959 > S > 1855/1945 > N > 1852/1948
Wie sieht hier der Mittelwert im Vergleich zum QTTR nach den 8 Spielen aus?
1822 = -30 Punkte
Spieler 1 wird also durch die Mittelwertbildung um 30 Punkte schlechter bewertet als nach QTTR.
Nach 7 Spielen:
1818 = -37 Punkte
Nach 6 Spielen:
1813 = -28 Punkte
Hier liegen also die Abweichungen zwischen Mittelwert und QTTR zum jeweiligen Stichtag deutlich weiter auseinander. Der "wahre" Wert wäre in diesem Beispiel ja 1900 Punkte, da wieder nur die beiden gegeneinander spielen, sie gleich stark sind und im ganzen System nur die 3800 (1800+2000) Punkte sind, die beide mit hineingebracht haben. Im Vergleich zur wahren Spielstärke wird also Spieler 1 in beiden Methoden unterbewertet, im Mittelwertverfahren aber erheblich stärker als im aktuellen TTR-System. Das meinte ich damit, dass die Mittelwertberechnung dazu führt, dass das ganze System träger wird, also die Veränderungen langsamer passieren.

Zitat:
Zitat von Mulder
Jetzt versuchst du eine Säule mit genau dieser Höhe nachzubauen
Der Vergleich hinkt doch, weil die Säule in deinem Bild als konstant angenommen wird. In Wirklichkeit müsste deine Metapher lauten, dass du eine Säule, deren tatsächliche Höhe nicht nur nicht direkt messbar ist, sondern sich auch noch bei jedem Messwert ändert, nachbauen sollst.


Zitat:
Zitat von Mulder
kann man bei Kindern gerne eine Regressionsgerade berechnen (oder'n Polynom, oder ne logistische Funktion), kann man auch generell machen, nur wird die Steigung bei AK16 Spielern quasi 0 sein
Ein System, das solche Hilfskonstruktionen benötigt, überzeugt mich nicht besonders. Wer legt fest, welche Form (Gerade oder Polynom etc.) gewählt wird? Bis zu welchen Alter? Und warum soll bei Spielern mit einer Änderungskonstante von 16 die Steigung quasi 0 sein? Damit postulierst du, dass halbwegs etablierte Spieler sich nur extrem langsam verbessern (oder verschlechtern). Mit meiner TT-Wirklichkeit zumindest geht diese Annahme nicht zusammen.

Zitat:
Zitat von Mulder
im übrigen sind es nicht meine Vorschläge, sondern das, was in mehreren Elo basierten Ratingsystemen implementiert wurden, um das alte Elo System zu verbessern
Aus welchen der von dir verlinkten Systemen kommt der Vorschlag der Mittelwertbildung? In den Glicko-Formeln kann ich dazu nichts finden, auch in den anderen Links bin ich nicht fündig geworden. (Kann's aber auch übersehen haben - oder ich hab dich einfach die ganze Zeit falsch verstanden.)


@Mulder Wir können doch über dieses hochspannende Thema anständig diskutieren, ohne ausfallend zu werden? Wenn ich nicht schon so viel dazu geschrieben hätte, ich hätte alles wieder gelöscht.
Mit Zitat antworten
  #3764  
Alt 30.01.2020, 19:28
Mulder Mulder ist offline
Morricone-Verehrer
Foren-Stammgast 1000
 
Registriert seit: 16.03.2003
Beiträge: 1.403
Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)
AW: Allgemeine Diskussion über TTR-Werte

Zitat:
Zitat von Vektor Beitrag anzeigen
Wo steht etwas über Mittelwerte von Elo-Werten aus eine bestimmten Zeitraum?
bei Glicko zB hier, wobei hier jedes Spiel nicht zu einem Elo-Wert berechnet wird, sondern gleich intern mehrere Spiele verarbeitet werden.

Zitat:
The Glicko system works best when the number of games in a rating period is moderate, say an average of 5-10 games per player in a rating period. The length of time for a rating period is at the discretion of the administrator.
auf Seite 3 die Formel für r' (Step 2), auf Seite 4 eine Beispielrechnung


Chessmetrics macht es wohl jährlich
Zitat:
The Method of Maximum Likelihood requires an "a priori", or "prior" distribution, as well as a "posterior" distribution. In the specific case of rating calculations, the prior distribution describes our estimate of a player's true level of skill, exactly a year ago. The mean of this distribution is the actual calculated Chessmetrics rating a year ago, and the variance is based upon the quantity of games played, leading up to that calculation. The posterior distribution represents a performance rating, namely the observed performance level of the player during the year in question. The mean of that distribution is the player's true level of skill a year ago, and the variance is based upon the quantity of games played during the subsequent year.

Elo selber
https://en.wikipedia.org/wiki/Elo_rating_system
Zitat:
Elo thought of a player's true skill as the mean of that player's performance random variable.
mean heisst Mittelwert
__________________
Ich würde dir ja glauben - wenn du nur Recht hättest.

Geändert von Mulder (30.01.2020 um 19:35 Uhr)
Mit Zitat antworten
  #3765  
Alt 30.01.2020, 20:22
Vektor Vektor ist offline
registrierter Besucher
Foren-Stammgast 1000
 
Registriert seit: 08.10.2000
Ort: Düren
Alter: 53
Beiträge: 1.923
Vektor ist zur Zeit noch ein unbeschriebenes Blatt (Renommeepunkte ungefähr beim Startwert +20)
AW: Allgemeine Diskussion über TTR-Werte

Zitat:
Zitat von Mulder Beitrag anzeigen
bei Glicko zB hier, wobei hier jedes Spiel nicht zu einem Elo-Wert berechnet wird, sondern gleich intern mehrere Spiele verarbeitet werden.
Das ist etwas VÖLLIG anderes. Mehrere Spiele zusammen zu betrachten (wie wir es bei einem Turnier oder auch einem Meisterschaftsspiel machen - oder wie es bim Schach passiert, weil sie es nicht genauer berkstelligen können, so weit ich weiß.

Jede Elo-Berechnung "mittelt" Performance; die Gewichte der einzelnen Partien machen den Unterschied.

Wenn man alle Spiele (eines Zeitraums) in einen Topf schmeißt, hat jedes Spiel dasselbe Gewicht.
Bei der TTR-Berechnung haben aktuellere Spiele ein höheres Gewicht als alte.
Und bei deinem Vorschlag haben alte Spiele ein höheres Gewicht als neue.


Nehmen wir die Spieler A und B; beide starten mit 1500 und spielen nur gegen 1500er ...

A gewinnt zunächst 5-mal, verliert dann 5-mal.
B verliert zuerst 5-mal, gewinnt dann 5-mal.

Alles in einem Topf: Beide landen bei 1500
TTR: B landet oberhalb von 1500, A darunter
Mittelwert der TTRs: A landet oberhalb von 1500, B darunter.

Wer von beiden ist aktuell wohl stärker? Und welches System bildet das ab?
Mit Zitat antworten
  #3766  
Alt 30.01.2020, 20:40
Benutzerbild von Fastest115
Fastest115 Fastest115 ist gerade online
registrierter Besucher
Ältestenrat - Hall of Fame GOLD
 
Registriert seit: 05.11.2003
Ort: Lünen
Alter: 58
Beiträge: 27.618
Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)Fastest115 ist ein absoluter Lichtblick (Renommeepunkte mindestens +750)
AW: Allgemeine Diskussion über TTR-Werte

Zitat:
Zitat von Vektor Beitrag anzeigen
Nehmen wir die Spieler A und B; beide starten mit 1500 und spielen nur gegen 1500er ...

A gewinnt zunächst 5-mal, verliert dann 5-mal.
B verliert zuerst 5-mal, gewinnt dann 5-mal.

Alles in einem Topf: Beide landen bei 1500
TTR: B landet oberhalb von 1500, A darunter
Mittelwert der TTRs: A landet oberhalb von 1500, B darunter.

Wer von beiden ist aktuell wohl stärker? Und welches System bildet das ab?
Genau so ist es
__________________
Zitat Kriegela: Zu Tode geänderte Sportart - Rest in Peace - Tischtennis
Me too ... TT Classic rules
TT mit P-Ball ist wie S... mit einer Gummipuppe.
Mit Zitat antworten
  #3767  
Alt 31.01.2020, 10:17
appelgrenfan appelgrenfan ist offline
registrierter Besucher
Foren-Stammgast 2000
 
Registriert seit: 29.01.2017
Alter: 56
Beiträge: 2.037
appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)
AW: Allgemeine Diskussion über TTR-Werte

Zitat:
Zitat von Mulder Beitrag anzeigen
bei Glicko zB hier, wobei hier jedes Spiel nicht zu einem Elo-Wert berechnet wird, sondern gleich intern mehrere Spiele verarbeitet werden.
Das meinst du mit dem Mittelwert? Genau das macht doch ELO/TTR ja auch!? Glicko berechnet, wir im ELO-System, die Abweichungen vom Erwartungswert, gewichtet aber die einzelnen Abweichungen nach der vermutlichen Genauigkeit des gegnerischen Werts. Spiele gegen Gegner mit geringerer Genauigkeit (wenige Spiele bislang, lange nicht gespielt, hohe Volatilität der Ergebnisse) haben einen geringeren Einfluss auf die Änderung des eigenen Werts. Von einer Mittelwertbildung über einen längeren Zeitraum wie 6-12 Monate kann ich dort aber nichts sehen.

Das Glicko-System dürfte tatsächlich genauere Ergebnisse bringen können. Aber zu welchem Preis? Es ist viel aufwändiger, und schnelle Überschlagsrechnungen wie jetzt beim TTR wären nicht mehr möglich. Damit würde die Akzeptanz unter den Beteiligten deutlich leiden.
Mit Zitat antworten
  #3768  
Alt 31.01.2020, 16:06
Mulder Mulder ist offline
Morricone-Verehrer
Foren-Stammgast 1000
 
Registriert seit: 16.03.2003
Beiträge: 1.403
Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)
AW: Allgemeine Diskussion über TTR-Werte

Falls du jetzy verstanden hast, dass man mehrere Werte braucht, muss ich dich beglückwünschen, dann wärst du jetzt weiter als Vektor, der in seinem Beispiel tatsächlich wieder mit der Bedeutung einzelner TTR-Werte um die Ecke kommt, obwohl ich es kurz vorher erklärt habe (und ihm prompt auch jemand auf den Leim geht), dass TTR-Werte nicht einzeln betrachtet werden können.



Also, ich sage nicht, dass ich das Glickosystem für Tischtennis nehmen würde und zwar auch, wie du sagst, weil man nicht überschlagen kann. Man hat die TTR-Werte, also nimmt man sie einfach und verarbeitet sie statistisch korrekt.


Es stimmt auch, dass bei Glicko innerhalb der letzten 10 Spiele die Reihenfolge keine Rolle spielt, sondern die Zuverlässigkeit der gegnerischen Werte, der k-Faktor ist quasi variabel.

Die Genauigkeit wird auch dadurch erhöht, dass die gegnerischen Werte ebenso auf Basis von 5-10 Spielen berechnet wurden. Also, sowohl die Anzahl als auch Genauigkeit der Werte sind höher.

Im Gegensatz dazu errechnen sich TTR-Werte auf der Basis von 1-2 Ergebnissen bei Punktspielen, ohne Angabe einer Standardabweichung. Und das ist das Entscheidendende :

Wie hoch ist die Standardabweichung eines einzelnen TTR-Wertes?

Beantwortet euch diese Frage und man sieht sofort, warum ein einzelner TTR-Wert keine Bedeutung hat. Daher ist auch das ganze ältere-ttr-werte-wirken-stärker/gleich/schwächer-Gerede völlig irrelevant, solange keine Mittelwerte gebildet werden. So wie es jetzt ist, werden ungenaue Werte auf Basis ungenauer Werte berechnet, daher schwanken sie viel stärker.

Sollte ich in absehbarer Zeit mein Notebook repariert bekommen, werde ich mal zwischen der Vorhersagbarkeit meiner Mittelwertmethode und der bisherigen Methode mit den aktuellen TTR-Werte vergleichen. Bis dahin verbleibe ich
__________________
Ich würde dir ja glauben - wenn du nur Recht hättest.
Mit Zitat antworten
  #3769  
Alt 01.02.2020, 11:18
appelgrenfan appelgrenfan ist offline
registrierter Besucher
Foren-Stammgast 2000
 
Registriert seit: 29.01.2017
Alter: 56
Beiträge: 2.037
appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)appelgrenfan genießt höchstes Ansehen (Renommeepunkte mindestens +1000)
AW: Allgemeine Diskussion über TTR-Werte

Ich hab jetzt verstanden, dass du verschiedenste Dinge zusammenwirfst, die nichts miteinander zu tun haben, und ich habe verstanden, dass du weiterhin mit arroganten Formulierungen um dich wirfst, wenn jemand anderer Meinung ist.
Mit Zitat antworten
  #3770  
Alt 01.02.2020, 18:19
Mulder Mulder ist offline
Morricone-Verehrer
Foren-Stammgast 1000
 
Registriert seit: 16.03.2003
Beiträge: 1.403
Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)Mulder ist ein sehr geschätzer Mensch dessen Wort hier Gewicht hat (Renommeepunkte mindestens +250)
AW: Allgemeine Diskussion über TTR-Werte

wenn du meinst


Also, das ganze hat ja nicht erst gestern angefangen, sondern schon 2011. Damals gab es schon zwei User, die TTR-Werte statistisch sahen und die Ansicht vertraten, dass der Mittelwert den "echten Wert" oder die "echte Spielstärke" widerspiegelt


Zitat:
Zitat von sVeNd Beitrag anzeigen
mal was anderes:
wenn sich meine spielstärke um100 punkte oder so ändert, wie lange dauert es, bis sich mein ttr-wert angepasst hat? und wie groß sind die schwankungen um den wahren ttr-wert?

Zitat:
Zitat von Variatio Beitrag anzeigen
Bei konstanter Leistung so um die +-25 Punkte. Bei manchen Spielern auch deutlich kleiner - ich fuehle mich seit Anfang des Jahres sehr konstant, und bewege mich seit 16 Spielen in einem Bereich von +-5 Punkten.


Angenommen, du hast zunaechst X Punkte, deine "reale" Spielstaerke ist jedoch X+100. Deine Gegner befinden sich im Bereich X-100 und X+100.
Wenn ich das hier randomisiert simuliere, dauert es 10-30 Spiele, bis du in dem oben genannten 25-Punkte-Korridor angelangt bist.
Zitat:
Zitat von Variatio Beitrag anzeigen
Zitat:
deine spielstärke ist, oder soll zumindest darstellen, was das System AKTUELL anzeigt!

Punktverluste oder Gewinne durch krankheit, Glück oder Pech oder auch unmotivation berücksichtigt es nicht!
Du meinst hier Einzelfallereignisse, sVeNd meint aber eine tatsaechliche Spielstaerkeaenderung. Z.B. wenn du jetzt in der Sommerpause fleissig trainierst, und damit tatsaechlich MITTELFRISTIG BESSER bist, was aber in den TTR-Punkten noch nicht eingeflossen ist.
Zitat:
Zitat von sVeNd Beitrag anzeigen
war etwas aufwändiger, aber habs jetzt mal was in die richtung gemacht. und zwar habe ich das zur berechnung der schwankungen genutzte histogramm verwendet, um zu ermitteln, mit welcher wahrscheinlichkeit sich der statistisch schwankende ttr und der "wahre" ttr in der reihenfolge umkehren können. zu beachten ist dabei, dass es sich hierbei um statistische eigenschaften "mathematischer" spieler (konstante spielstärke, gültigkeit des ttr-modells, keine tagesform, spielsystemanfälligkeit, veränderung der spielstärke etc.) handelt.

ich habe zum einen die wahrscheinlichkeit berechnet, dass bei vorgegebener differenz der "echten" spielstärken die momentanen spielstärken eine umgekehrte reihenfolge der spielstärke aufweisen und zum anderen das umgekehrte szenario, dass die vorgegebene differenz der momentanen spielstärken eine andere reihenfolge als die echten spielstärken nahelegt. interessanterweise sind die beiden wahrscheinlichkeiten aufgrund der hier vorliegenden symmetrischen verteilung um den mittelwert gleich.

wahrscheinlichkeiten (aus der simulation) dafür, dass der nach momentanen ttr stärkere spieler den kleineren "wahren" ttr hat:
0 punkte differenz: 0.5 (konsistenzcheck)
10 punkte differenz: 0.38
20 punkte differenz: 0.27
30 punkte differenz: 0.18
50 punkte differenz: 0.06
80 punkte differenz: 0.007

ein fazit ist hier schwer zu ziehen, weil reale(=menschliche) spieler natürlich eine hohe menge an weiteren unsicherheiten ins spiel bringen. außerdem kann man sicher darüber diskutieren, welches ausmaß an statistischer sicherheit gewollt ist, um eine umgekehrte aufstellung zweier spieler entgegen dem ttr auszuschließen. meiner ansicht nach jedenfalls sind 20 oder 30 punkte dafür nicht ausreichend, weil für etwa jedes vierte oder fünfte spielerpaar dies bereits statistisch falsch ist. die unsicherheiten aus den eigenschaften eines menschlichen spielers dürften diese fehlerquote zudem noch einmal deutlich erhöhen.

Zitat:
Zitat von sVeNd Beitrag anzeigen
hallo variatio,
danke für den relativ quantitativen beitrag. ich habe selber jetzt eine kleine simulation geschrieben, deren ergebnisse ich hier kurz zusammenstellen/vergleichen möchte.

zum vergleich: meine simulation generiert ein quadratisches sample von gegnern, wobei die differenz zwischen echter und anfangsspielstärke in der mitte des intervalls liegt. mit quadratisch ist gemeint, dass die zufallszahlen quadriert werden, sodass gegner mit hohem oder niedrigem ttr seltener generiert werden (dem liegt die annahme zugrunde, dass man gegen gegner mit 14:1 bilanz weit seltener spielt als gegen gegner mit ausgeglichener bilanz). die bei mir andere zentrierung des intervalls hat nur geringen einfluss auf die simulationsergebnisse.

1. das erreichen des randes des korridors ist die falsche bedingung, da man nicht ausschließen kann, dass sich gerade eine schwankung nach oben maximal auswirkt. Die richtige bedingung (auch aus symmetriegründen) ist daher, das erste errreichen der echten spielstärke als kriterium für die dauer des strebens ins gleichgewicht zu verwenden.

2. die ergebnisse meiner simulation bzgl. des erreichens der echten spielstärke sind folgendermaßen (gleiche situation: 100 punkte unterschied, intervalllänge 200 punkte, änderungskonstante 16):
-erreichen der spielstärke nach 15 spielen (etwa eine halbrunde): in 1.2 % der fälle
- nach 30 spielen (etwa eine saison): in 34.2 % der fälle
- nach 60 spielen: in 84.7 % der fälle
- durchschnittliche dauer: 40.8 spiele

(einfach formuliertes) fazit: wenn man sich um eine klasse (bei uns 100 punkte) verbessert/verschlechtert, dauert es etwas mehr als eine saison, bis der ttr das wiedergibt.

[ich habe 100000 durchläufe verwendet, man bekommt allerdings mit weit weniger schon nahezu identische ergebnisse]


meine ergebnisse in dem oben skizzierten fall für die schwankungen nach erstmaligem erreichen der echten spielstärke:
- schwankung um mehr als 100 punkte: etwa 0.001% der fälle -> kann vernachlässigt werden
- varianz s der verteilung: 22.9 punkte
- mittlere abweichung vom echten ttr-wert: 18.2 punkte
- anteil der verteilung der ttr-werte im intervall [ttr_echt- 0.5s, ttr_echt + 0.5s]: 35.6%
- anteil der verteilung der ttr-werte im intervall [ttr_echt- s, ttr_echt +s]: 65.4%
- anteil der verteilung der ttr-werte im intervall [ttr_echt- 2s, ttr_echt + 2s]: 94.2%

fazit: auch nach erreichen des "echten" ttr-wertes sind noch erhebliche schwankungen zu beobachten. allein aus statistischen gründen liegt der ttr bereits in mehr als einem drittel aller fälle außerhalb eines 45.8 punkte langen intervalls um den "echten" ttr. die "menschlichen" unsicherheiten (keine identische form in zwei spielen, tagesform, stärken/schwächen gegen spielsysteme) sind dabei noch in keinster weise berücksichtigt.



ich habe es noch dreimal vorgebracht

2014
Zitat:
Zitat von Mulder Beitrag anzeigen
Aus mathematischer Sicht sind alle TTR-Werte gleichweitig, und zwar so wie sie zustande gekommen sind. Es sind Meßwerte der wahren Spielstärke. Daß jeder TTR-Wert aus den vorherigen Spielen errechnet wird, ändert nichts an diesem Status.
Die TTR-Werte streuen - es wird bei ELO angenommen normalverteilt - um die wahre Spielstärke, welche bei ausreichender Anzahl der Mittelwert ist. Das gilt natürlich nur bei konstanter Spielstärke, es mach also keinen Sinn bei Jugendlichen den Mittelwert der letzten 3 Jahre zu bestimmen.

Der Mittelwert einer Halbserie ist mit einer viel höheren Wahrscheinlichkeit an der wahren Spielstärke dran als ein einzelner TTR-Wert wie der QTTR-Wert, der nur ein einzelner Meßwert ist.
Vektors Antwort
Zitat:
Zitat von Vektor Beitrag anzeigen
ist das, was du schreibst, ganz einfach Unsinn.

Es soll ja gerade auch Entwicklung abgebildet werden - also wäre es geradezu unsinnig, ein Modell zu unterstellen, bei dem Spieler ein übner die Zeit konstante Spielstärke hätten.

Wäre der TTR-Wert zu einem bestimmten Stichtag nicht derjenige Wert, mit dem man die Stärke aus Sicht dieses Tages am besten schätzt, dann sollte der TTR_Wert an diesem Tag ein anderer sein ;-)


2015
Zitat:
Zitat von Mulder Beitrag anzeigen
Wenn sich der 2.KK oben Spieler und der 2.VL unten Spieler um weniger als 100 Punkte unterscheiden, dann ist das halt so. Die Spieler trennen also keine Welten.



Fair wäre die Geschichte mal, wenn vielleicht mal die Spielstärke zur Aufstellung herangezogen werden würde, und nicht ein einzelner TTR-Wert. Die TTR-Werte streuen nämlich normalverteilt (laut der Annahme von Elo, habs auch mit TTR-Werten überprüft und kommt hin) um die Spielstärke. Auf die Spielstärke würde man kommen, indem man den Mittelwert der TTR-Werte bildet (und natürlich den Fehler berechnet).

Dabei muß der Zeitraum natürlich so gewhlt werden, daß die Spielstärke annähernd konstant ist. Eine Halbserie könnte ausreichend sein, nicht zu lang, nicht zu kurz.

https://www.ipc.kit.edu/2255.php (Punkte 1 und 2 reichen schon, TTR-Werte sin nichts weiter als Messwerte der Spielstärke (xw))

Es ist aber ziemlich grausam, daß die TTR-Erfinder wohl keine Ahnung davon haben. So ein Aufwand kanns ja wohl nicht sein, die Mittelwerte noch zu berechnen.
Vektors Antwort
Zitat:
Zitat von Vektor Beitrag anzeigen
Man, man, man - da zieht's einem wirklich die Schuhe aus! Wie oft müssen wir dir noch erklären, dass bei Mittelwertbildung der völlig unsinnige Effekt auftritt, dass Spiele vom Anfang des Zeitraums wesentlich stärkeren Einfluss haben als die topfrisch aktuellen ...

Das müsste jeder, der Grundkenntnisse in Arithmetik hat, sofort sehen. Wenn von so einer Seite dann Vorwürfe der Ahnungslosikeit kommen, ist das schon ziemlich traurig.


Nimmt man ein Modell mit konstanter Spielstärke her, ist es natürlich nicht sinnvoll bei Spielen eine Chronologie zu betrachten - genau diese "konstante Spielstärke" ist aber nicht zu unterstellen ... ansonsten wäre es das Sinnvollste, alle Spiele (nicht TTR-Zwischenstände!!!) aus dem Zeitraum mit konstanter Stärke gleich hoch zu gewichten.


(Mit Messwerten im Sinne des Links haben TTR-Werte übrigens überhaupt nichts zu tun. Dort geht es um unabhängige Messungen - ansonsten gibt es gar keinen Sinn, von der Gaussverteilung um den wahren Wert herum auszugehen etc.
Und unabhängig sind die TTR-Werte, von denen du einen Mittelwert bilden willst, nun mal in keinster Weise - die Werte sind gemäß Konstruktion in hohem Maße vom Vortageswert abhängig ...
Fazit: Thema völlig verfehlt. Da hat sich jemand im Glashaus nicht im Dunkeln umgezogen ...)

und 2016

also, seit 2011 könnte man's wissen, wenn man denn wollte
__________________
Ich würde dir ja glauben - wenn du nur Recht hättest.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
ttr-relevant

« Vorheriges Thema | Nächstes Thema »

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Diskussion über Diskussionen klugscheisser Stammtisch 17 11.02.2010 13:33
2008: Allgemeine Diskussion Mikkky Internationale TT-NEWS Open 13 02.07.2008 00:56
2007: Allgemeine Diskussion Nosti49 Internationale TT-NEWS Open 313 13.07.2007 09:19


Alle Zeitangaben in WEZ +1. Es ist jetzt 16:42 Uhr.


Powered by vBulletin® Version 3.8.11 (Deutsch)
Copyright ©1999 - 2026, vBulletin Solutions, Inc.
www.TT-NEWS.de - ein Angebot der Firma ML SPORTING - Ust-IdNr. DE 190 59 22 77