TT-NEWS Tischtennis Forum

TT-NEWS Tischtennis Forum (https://forum.tt-news.de/index.php)
-   allgemeines Tischtennis-Forum (https://forum.tt-news.de/forumdisplay.php?f=1)
-   -   TT_POS: Abschätzung der Spielstärkeverhältnisse (https://forum.tt-news.de/showthread.php?t=5158)

Jens Makait 12.02.2002 09:40

Zitat:

Original geschrieben von sVeNd
von klassen welcher spielstärke wurden da daten verwendet?

Ich habe alle Daten von tt-info gesaugt, die dort verfügbar sind.
Generell kann man sagen, dass dort die höheren Ligen so vollständig gepflegt werden, dass die detaillierten Bilanzen ausgewiesen werden konnten. Die kann ich dann für die Analyse heranziehen.
Für tiefere Klassen sind nur die Spiel-Ergebnisse und keine Bilanzen gepflegt. Die nützen mir nichts.
(Man muß mal einen laangen Blick in die Datei tt-info-2000-1_korr.txt werfen)

Die Herren-Analyse baut auf diese Weise auf den Bilanzen von 32 Ligen auf. Es werden die Bilanzen von 2976 Spielern ausgewertet.
Die Datenbestände für Damen, Jungen und Mädchen sind kleiner.

Gegenwärtig kann man einige Dinge beim Einlesen einstellen (Herren, Damen...), man kann aber keine Auswahl der einzulesenden Klassen vornehmen. Eine Aufgabe für lange Winterabende?

Jens

Jens Makait 12.02.2002 09:58

Zitat:

Original geschrieben von Frank Schmidt
Aber mal ganz ehrlich: bringt es wirklich so viel, wenn ich weiß, dass ein Spieler in einem höheren Paarkreuz durchscnittlich 22,635673% weniger Spiele gewinnt?
Ist vielleicht eine ganz nette Spielerei, aber der Aufwand steht doch wohl in keinem Verhältnis zum Nutzen.

Vorab:
Dass das ganze auch mit einem gewissen Spieltrieb zu tun hat, streite ich sicher nicht ab. S'ist ja auchnichts Schlimmes.


Über eine sinnvolle Anzahl der angezeigten Nachkommastellen kann man sicher auch unterschiedlicher Meinung sein (soo viele zeige ich ja bei den Prozentzahlen auch gar nicht an). Vielleicht sollte ich nicht 3 sondern nur 2 oder auch nur 1 Nachkommastelle anzeigen. Aber lieber eine Stelle zuviel als eine Stelle zuwenig.

Meine Triebfeder ist aber tatsächlich die Tatsache, dass es so viele unterschiedliche Wertungssysteme gibt, die beim Vergleich von Spielergebnissen zu ganz unterschiedlichen Wertungen kommen. Diese Unterschiede sind teilweise grotesk, was nur den Schluss zulässt, dass es Systeme gibt, die zu grotesken Ergebnissen kommen. (darüber ließ ich mich ja schon mal aus)
Und welche sind nun die, die die Realität treffen?

Da möchte ich für mich (und wenn es andere interessiert natürlich gerne auch für andere oder (nun werde ich größenwahnsinnig) für TT-Deutschland ;-) ) etwas Klarheit schaffen.

Mein linearer Ansatz (dazu schreibe ich in einem anderen Posting sicher noch mal was) ist halt nur ein Anfang, entspricht aber dem linearen Ansatz vieler Wertungssysteme und kann somit einen Beitrag für die "Einstellung" dieser Wertungssysteme leisten.

Ich bin aber auch sehr interessiert an Vorschlägen für andere Modelle, die die Spielstärke im TT-Sport beschreiben. Dann kann man sich ja Gedanken um Schätzmethoden für die dafür relevanten Parameter machen.

Einen ersten Blick über den linearen Tellerrand hinaus bietet aber bereits jetzt die 'differenzierte Analyse' von TT_POS. Kann man da doch bereits ablesen, wie die zu erwartende Bilanzänderung z.B. beim Paarkreuzwechsel von der aktuellen Erfolgsquote abhängt.

(Sorry, nun habe ich doch viel mehr geschrieben, als du in deinem Posting angesprochen hast. Ich finde das Thema eben interessant, und ich denke auch, man weiß eigentlich noch zuwenig Konkretes darüber)
Jens

Benjamin 12.02.2002 10:52

Zitat:

Original geschrieben von Frank Schmidt
Aber mal ganz ehrlich: bringt es wirklich so viel, wenn ich weiß, dass ein Spieler in einem höheren Paarkreuz durchscnittlich 22,635673% weniger Spiele gewinnt?
Ist vielleicht eine ganz nette Spielerei, aber der Aufwand steht doch wohl in keinem Verhältnis zum Nutzen.

Hallo Frank,

das schöne an solch einer Spielerei ist doch, dass niemand gezwungen ist daran teilzunehmen. :)

Ich jedenfalls finde es auch sehr spannend und habe mir das Programm geladen. :boing2:

Grüße
Benjamin

Ludwig 12.02.2002 15:29

Interessanter als ein Ligen-Vergleich finde ich die Abschätzung der Spielstärke der Einzelspieler. In den USA gibt es verschiedene Systeme (z.B. USATT bzw. David Marcus), mit dem die Spielstärke der Spieler gewertet wird. Dort gibt es weniger Ligenbetrieb als Einzelturniere. Männer und Frauen treten in gemeinsamen Turnieren an, die Einteilung in Klassen erfolgt nach Spielstärke. Die Turnierergebnisse werden direkt an die Zentralstelle weitergeleitet, so das immer eine halbwegs aktuelle Liste vorliegt. Ein solches System würde eventuell dazu führen, das mehr Teilnehmer zu Turnieren fahren. Für Leute aus den unteren Paarkreuzen oder aus den niedrigeren Klassen ist eine Turnierteilnahme derzeit uninteressant. Warum soll man sich als Spieler der dritten Kreisklasse hinten von einem Spieler Kreisliga oder Bezirksklasse vorn abschiessen lassen ? Durch die Spielstärkeneinteilung und gemeinsame Klassen für Frauen und Männer gibt es auch nicht mehr das Problem, das ein oder zwei Frauen für eine Klasse melden und dann ohne spielen zu können wieder heimfahren müssen.
Der Klassenvergleich der Ligen wäre mit einem solchen System auch eine sehr einfache Sache: Man addiert nur die Leistungsstärke der Mannschaftsmitglieder.

The albatross 12.02.2002 16:03

Dieser Aufwertungseffekt von Turnieren ergibt sich zwangsläufig bei jedem globalen Ranglistensystem. Beispiel: In Frankreich spielt fast jeder Spieler Rangliste, das ist dort ein Riesen-Event und jeder mehrere Ausspielungen pro Saison.

Folge: Die Jugend ist stärker motiviert, weil jeder Spieler von Beginn an eingestuft wird und DIE MITGLIEDERZAHLEN STEIGEN RASANT, nicht so wie in Deutschland, wo sie von Jahr zu Jahr sinken.

Mr Tischtennis 12.02.2002 16:15

@ Christina

Die Badenliga Mädchen ist wohl etwas schwächer als die Verbandsliga WH, da eine badische Mannschaft, die in Baden keine Gegner hatte, nun in der Verbandsliga WH mitspielt (ich glaube die sind Vierter). Bei den Damen dürfte das in etwa vergleichbar sein.

@ Jens

Dein Engagement schätze ich wirklich sehr hoch. Deine Ergebnisse stimmen im Bundesdurchschnitt wohl überein, auch wenn fast ausschließlich Ergebnisse aus Bayern und Hessen verarbeitet wurden. Sie sollten durchaus als statistische Grundlage für die Erstellung eines Punktesystems dienen, mit dem die Spielstärke jedes einzelnen Spielers bestimmt werden kann.

Jetzt müssen diese Ergebnisse nur noch verwertet werden! Ich bin zur Zeit dabei, die Ergebnisse aus deinem anderen Programm (TT_sim) auszuwerten. In Kombination mit den Ergebnissen aus dem "TT-pos" könnte man mit Sicherheit eine Formel entwickeln, mit der die Spielstärke jedes einzelnen Spielers genauestens ausgerechnet werden kann (allerdings wird das sehr schlecht zu verwirklichen sein, da man eine solch "hohe Mathematik" kaum einem Klassenleiter zumuten kann, erst recht nicht dem, der keinen Computer besitzt). In meiner eigenen Spielklasse bin ich immer wieder dabei, neue Bilanzformeln auszuprobieren; und diese kommen der wirklichen Spielstärke immer näher!!!

Cogito 12.02.2002 16:48

Liebe Leute,

ich kann nur noch einmal versuchen eure Aufmerksamkeit auf das Elo-System zu richten:

1.
Punkte-Berechnung
Die Punkteberechnung erfolgt nach dem ELO-System. Das Elo System wurde um 1960 von Apard Elo entwickelt, hauptsächlich um eine objektive und langfristige Bewertung im Schach zu ermöglichen. Daraus entwickelte sich das meistverbreiteste Ratingsystem für das wir uns auch entschieden haben, gerade weil es so lang erprobt und auf viele andere 'Sport'-Arten abbildbar ist. (Ein Beispiel für die mathematische Berechnung findet Ihr am Ende des Texts.)

Ziel des Elo-Systems ist es, nicht immer mehr Punkte zuverteilen, sondern den Spielern die Punkte zuzuteilen, die er sich verdient hat. Ein Team mit der Bewertung 1000 entspricht also genau dem Durchschnitts Team, wohingegen ein Team mit 1500 Punkten schon wesentlich besser ist. Von dem 1500er Team wird erwartet, dass es gegen ein 1000er Team gewinnt und zwar mit einem gewissen Mindest-Verhältnis in Prozent. Dieses Verhältnis kann man auf unterschiedliche Weise berechnen:

Z.B. beim 1on1 ist es ganz simpel:
Spieler A hat 20 Frags, B 5 Frags. Somit hat A 80% (20/(20+5)*100), B 20% (5/(20+5)*100).
Spieler A erfüllt also genau die Erwartetungen und bekommt 0 Punkte, da er sich genau so verhält wie 1500 Punkte es verlangen. Er war nicht besser und auch nicht schlechter. Gleiches gilt also somit auch für Spieler B, der mit 1000 Punkten bewertet wurde.

Ein weiteres Beispiel, diesmal CTF:
Team A mit 1500 Punkten, Team B mit 1000 Punkten bewertet.
Erste Map:
Team A 3 Captures, Team B 8
Zweite Map:
Team A 4 Captures, Team B 1

Verhältnisse:
A : B
Erste Map: 27% zu 73%
Zweite Map: 80% zu 20%
Summe: 107% zu 93%

Team B hat also eine weit bessere Leistung erbracht als erwartet und bekommt dementsprechend mehr Punkte zu seiner jetztigen Bewertung addiert. Team A hat zwar gewonnen, aber eben nicht hoch genug und bekommt somit Punkte abgezogen, da die Erwartungen enttäuscht wurden.

Das Bewertungssystem ist beim Start der Ladder noch nicht sehr aussagekräftig, aber je länger jemand spielt, desto treffender ist seine Bewertung

2.
I expound on how the United States Chess Federation has rated players since first instituting the rating system in 1952. Chess is different from a number of sports in that the only objective information that can be drawn from a game is who won; basketball, football, hockey, etc provide additional information in the form of scores and other statistics. I accordingly discuss some potential modifications.
The Elo rating system
This system was cooked up by a guy named Arpad Elo and is named after him. It requires an initial set of ratings; I won't bother explaining how the USCF assigns them, except to note that its very similar to the RPI I discuss elsewhere. (Chess is less susceptible to the problem of a team that plays most of its games against teams that are much better or much worse than they are; this is because almost all games rated by the USCF are played in tournaments in which players who are doing well play each other, so that even if a player is playing an opponent who much better than they are at the beginning of the tournament, he will be playing much weaker opponents by the end of the tournament.) It's not terribly important how the initial ratings are set, so long as enough games are played after this for the Elo system to correct mistakes, which will eventually die out. Once ratings are established, the assumption is that a player who holds a given rating advantage over another player should win a certain percentage of his games against that player.
Elo assumed, and the system seems to work, that this advantage is essentially multiplicative; if player A beats player B 3 times as often as vice versa, and player B beats player C 3 times as often as vice versa, then player A should beat player C 9 times as often as the other way around. The ratings, then, are assigned logarithmically, so that the ratio (3) becomes a difference (proportional to the log of 3). There's still a scale factor to be decided, and the USCF uses a rating system where a difference of 400 points is a factor of ten; you can then calculate the probability that player A will beat player B by taking the difference between the ratings, dividing by 400, raising ten to that power, then dividing this by one more than itself (so that the probability of A beating B plus the probability of B beating A is equal to 1). The sticklers will be interested to know that a draw counts as half a win for each side; if two players play 4 games, I don't distinguish between two wins and two draws versus three wins and a loss.

Even if we don't accept the assumption of multiplicativeness, the next step is very reasonable so long as we have some way of calculating probabilities from ratings. (The very concept itself of "ratings" requires an assumption of transitivity, that if team A is better than team B and B is better than C that A is better than C, where "better than" means "will win more often than will lose". This assumption is almost certainly not exactly correct, but is often close. The fact that this is not always true is one of my complaints about single elimination tournaments.) If a player wins, his rating increases in proportion to the probability that he was to lose; if the player loses, his rating decreases in proportion to the probability that he was to win. Thus if the player wins exactly as often as he is supposed to, his rating stays fixed; if he wins more, his rating goes up over time, while if he loses it goes down. (For most players, the USCF changes the rating by 32 times the relevant probability; again, a draw is half a win and half a loss.)

For initiating ratings, you could calculate an RPI and multiply by 400, which is essentially what the USCF does. For sports, where everyone's season begins at the same time, we can alternatively just assign everyone the same rating at the beginning of the season and run all the games they played through this procedure twenty or thirty times until the ratings stabilize. Note

that if a team is undefeated or has no losses the rating will not stabilize; it will just run off. My solution is to multiply the rating by some fraction like .75 after each iteration. In some sense this treats the team as having lost a fraction of a game. This problem is somewhat ameliorated by consideration of score as presented later.
The USCF, of course, can't do this; where would it start from? As individuals enter and leave at different times, there is no start of the season from which to run the ratings.
The effect of changing that 32 I presented above is to change how quickly a team's rating will change; an increase will increase its volatility, which is undesirable, but it will also allow you to take account of a team's improvement. A smaller number is, in effect, an average over a longer period of time; 32 effectively averages, in practice, over about twenty or twenty five games, so that if a chess player gets markedly better it will take about that long before this is adequately reflected in the rating.
Winning and Winning Big
This, like the RPI, only thus far accounts for whether a team wins or loses. There are different sorts of ratings out there, some intending to predict margins of victory and others intending only to predict which team will win, and I favor the latter. Defense is a legitimate way to win games, and I think a basketball team that wins all of its games 2-0 against any competition is the best team. Winning games is ultimately the point, and teams in hockey will pull the goalie or in basketball will foul the opponent at the end of close games; these strategies are more likely to give the opponents more points, and tend to increase the margins of victory, but they also increase the number of points scored, so that a deficit is more likely to be closed than if such steps are not taken; if your team is down 4 and there is time for 3 more points to be scored, you are in worse condition than if you are down 6 and there is time for 10 more points to be scored. A significant margin of victory can thus often be created by a last ditch effort to save a lost game.
This isn't to say, however, that it is not fair for a ranking system to use scores, statistics, or astrology to predict which team is going to win; while I've defined what I consider desirable in a ranking system, any system that has been concocted is "good" so long as it meets that single criterion: it must predict in advance the winners of games. I expect it is fair to assume that a team that wins a game 72-71 on a last second shot would have been more likely to lose that game than a team that wins the game 91-50; if these results are recorded against the same team, one would suspect that the second team is better than the first. This leads me, then, to my alteration of the Elo system.

A Generalized Elo System
The Elo system says we can predict a team's probability of winning, and that a team that is more likely to win than its rating suggests should have its rating increased. In the same vein as this imminently sensible assumption comes our intuition that the score of a game also correlates to a team's likelihood of repeating the results; the team that won 72-71 has perhaps a 53% chance of winning a rematch, while the team that won 91-50 may have a 99% chance of winning a rematch. Presumably, then, if we had predicted that the former team has a 60% chance of winning, it would not be unreasonable to lower somewhat our estimate of that team based on new data suggesting that the teams are more evenly matched. At the same time, let's not forget the previous caveats against penalizing a team that widens a margin in an attempt to win the game; I think a certain amount of credit simply has to be given for the win, beyond any smooth function of the margin of victory.
To make things clearer, I write an equation. (I'm serious. I don't sympathize with people who are blindly frightened by equations; I often find them much clearer than words.) Let w be 1 if the team wins, w=0 if the team loses, and P is the probability that the team wins; then in the Elo system we change the rating by 32*(w-P), 32 times the difference between the result and the expected result. All I propose to do to modify this is to redefine w; w is going to be the probability I think the team has of winning a rematch based on its performance in the game. In the above example, I might say w=.53 for the team that wins 72-71. This is where I bring in my caveat about teams that gamble to win; I might get 80% of the value for w from the score, but some of it, say 20%, should be based only on whether they win. In this case .8*.53+.2*1=.62, so that I assign the value .62 to w; if I thought the team had a 60% chance of winning, I might actually bump them up a little then, because, even if it was close, they *did* win.

Poisson Statistics
For hockey, I can provide what I think is a very reasonable model for the probability of a team winning a rematch based on the score of a game. The same model works for soccer, but seems less justified for the more popular American sports, at least without some alteration.
I assume in hockey that, in any given 20 seconds or so, team A will have a certain (small) probability of beating scoring against team B, and team B will have a different (small) probability of scoring against team A. So long as these probabilities are constant throughout the game, that they don't change appreciably when the score changes, and so long as these probabilities are small, the probability of team A scoring a certain number of goals over the course of a game will follow a distribution well known to physicists, the Poisson distribution. The expected value, of course, is 180, the number of 20-second periods in a hockey match, times P, the probability of scoring a goal in one of those periods. For those with patience for combinatorics, I note that there are C(180,n) ways of scoring n goals, and that this gives a probability of C(180,n)P^n(1-P)^(180-n), which, for small n, is about (180^n/n!)*(P^n)*(1-P)^(180-n) = ((180*P)^n)(e^(-180*P))/n!, where n! is n factorial and e is 2.7183, the base of the natural logarithm; since 180*P is just the expected score m, we have a probability of (e^-m)(m^n)/n!, where the e^-m is just a constant that makes the total come out to 1 as the total of probabilities should.

For larger values of m, and even, to a decent approximation, for smaller ones, this distribution is similar to a normal curve, or a bell curve, where the standard deviation will be equal to the square root of the expected value; the difference between two random numbers that follow separate normal distributions follows a normal distribution itself, where the standard deviation is the square root of the sum of the squares of the separate distributions; the punch line is that the difference between the scores should follow a distribution centered at m1-m2 with a width equal to the square root of m1+m2, so that, with hockey at least, the probability associated with a victory by a score of m1 to m2 is approximately erf((m1-m2)/sqrt(m1+m2)), where erf is the error function, which is tabulated in standard probability tables.

If we gave each team 2 points for each goal they scored, we'd of course double both m1 and m2, which would double the numerator of (m1-m2)/sqrt(m1+m2) but would only multiply the denominator by the square root of 2; in such a system we would want to use erf((m1-m2)/sqrt(2*(m1+m2))). Football might work with a fudge factor similar to this; in the case of football it would presumably be between 3 and 7. In basketball, however, and to a lesser extent in football, there is a heavy inverse correlation between a team's scores, by which I mean that when one team scores the other team gets the ball and is more likely than not going to score before you get the ball back. The difference with hockey and soccer, then, is that in these sports there are very few goals scored per possession, which fits into the given assumptions well. For basketball and football, we need another term, giving us something like erf((m1-m2)/sqrt(n*(m1+m2-2r*sqrt(m1*m2)))), where n is a constant that sort of describes how many points a team scores in one go and r is a number between 0 and 1 that characterizes this inverse correlation alluded to earlier. n and r will really have to be fit semiempirically, that is to say by just trying different numbers and seeing what works for each given sport, but once you have those you can use the formula given to calculate this w to put into the rating-change formula that I gave.

Vielleicht können die Experten ja etwas damit anfangen. Wenn nicht, dann hilft vielleicht http://www.schachbund.de/WOrdng/ORDWO1.HTM
weiter. Dort sind die Regularien für die DWZ-Zahl, einer weiteren Variante (leider etwas schlechter als die Elo-Zahl) nachzusehen.

Also: EFINDET DAS RAD NICHT NOCH EINMAL !

Tansincos 12.02.2002 17:51

Programm
 
Die Idee zum dem Programm ist super, großes Kompliment! :top:
Ein Verbesserungsvorschlag: Es wäre gut, wenn man ausrechnen könnte, welche Bilanz man z.B. in der Verbandsliga Mitte spielen würde, wenn man in der Bezirksliga Vorne 17:5 spielt. Nur als Beispiel, ich meine, es wäre super ausrechnen zu können, welche Klasse man wohl mit welcher Bilanz spielen könte.

Walker 12.02.2002 19:03

Re: Programm
 
Zitat:

Original geschrieben von Tansincos
Nur als Beispiel, ich meine, es wäre super ausrechnen zu können, welche Klasse man wohl mit welcher Bilanz spielen könte.
Das wäre sehr cool. Allerdings halte ich das für nicht realisierbar wegen der unterschiedlichen Klasseneinteilung der Verbände, den unterschiednlichen Stärken der einzelnen Staffeln usw.

Tansincos 12.02.2002 19:24

@ Walker
 
Zu Schade, aber vielleicht findest du ja trotzdem irgendeine pauschale Möglichkeit?


Alle Zeitangaben in WEZ +1. Es ist jetzt 05:56 Uhr.

Powered by vBulletin® Version 3.8.11 (Deutsch)
Copyright ©1999 - 2025, vBulletin Solutions, Inc.
www.TT-NEWS.de - ein Angebot der Firma ML SPORTING - Ust-IdNr. DE 190 59 22 77