Bilanz

Wie genau ist das Modell?

Jeder kann sagen, ein Team habe 70 % Chance. Der ehrliche Test ist, was danach passiert: Gewinnen Teams mit 70 % Chance tatsächlich etwa sieben von zehn Mal? Hier ist die eine Zahl, die das beantwortet — und dann alle Stellen, an denen Sie unsere Arbeit überprüfen können.

Bewertet anhand von Ergebnissen, die Sie bereits kennen

Wenn dieses Modell einem Team eine 70-%-Chance gibt, passiert das ungefähr so oft. Wir haben es an jedem einzelnen der 987 Spiele bei 24 vergangenen Turnieren (2014–2024) getestet — jedes bewertet durch das Modell, das so rekonstruiert wurde, wie es am Tag vor dem Anpfiff stand, sodass es das Ergebnis nie gesehen hat — und seine angegebenen Wahrscheinlichkeiten lagen innerhalb von etwa 5.6 Prozentpunkten von dem, was tatsächlich passiert ist.

Als eine einzige Zahl ausgedrückt: Im Durchschnitt bewertete es das tatsächlich eingetretene Ergebnis mit etwa 35 % höherer Wahrscheinlichkeit als eine blinde 1-aus-3-Schätzung.

Für Statistisch-Interessierte: Das ist ein 0.572 gegenüber dem 0.667 einer blinden Schätzung — niedriger ist besser. Es ist der ehrliche Massstab für 2026, keine nachträglich geschönte Zahl.

Zum vollständigen Scoreboard — nach Turnier, nach Konfidenzband, mit Zuverlässigkeitsdiagrammen →

Das Turnier 2026 wird live bewertet — der Tracker oben aktualisiert sich pro Spiel.

Match by match

Tournament report card

Every match graded as it's played. The pre-match probability locks before kickoff; after the final whistle, it scores against the result. This is the live, match-level evidence behind the numbers above.

96/104 gradedmean 0.49754 strong calls

See every match, graded →

Überprüfen Sie die Arbeit

Fünf Wege, auf denen das Modell Rechenschaft ablegt — die Belege, die Fehlschläge und die versionierte Dokumentation hinter jeder Zahl.

Live + Out-of-Sample

Kalibrierungs-Scoreboard

Der vollständige Out-of-Sample-Backtest aufgeschlüsselt nach Turnier und Konfidenzband, plus der Live-Tracker, der jedes Spiel der WM 2026 während des Spiels bewertet. Ein mit 70 % bewertetes Ergebnis sollte etwa 70 % der Zeit eintreten — hier können Sie das überprüfen.

Das Argument · kostenlos

Warum den Zahlen vertrauen

Die Disziplin hinter den Wahrscheinlichkeiten — vorab registrierte Akzeptanzkriterien, ehrliche Berichte nach Kategorie und die Teile des Modells, in denen das Vertrauen tatsächlich geringer ist, namentlich benannt.

Veröffentlichte Fehlschläge

Was nicht funktioniert hat

Jede Modellvariante, die das Veröffentlichungs-Gate nicht bestanden hat, vollständig mit Bewertung veröffentlicht. Die Nicht-Veröffentlichungen sind genauso sichtbar wie die Erfolge — wenn nur die Gewinner gezeigt würden, würde das Modell unvermeidlicher wirken, als es ist.

Versionierte Dokumentation

Brier bei jeder Version

Die versionierte Geschichte des Modells — jedes Retraining mit seinem Brier bei Veröffentlichung gestempelt, damit die Zahl auf jeder Seite auf eine datierte Zeile zurückführt.

Wie es gebaut ist

Methodik

Die Komponentenmodelle, das Trainingsverfahren, die Datenquellen und das Backtest-Design — alles reproduzierbar aus öffentlichen Daten.

Prognose-Integrität

Vor dem Anpfiff gesperrt

Jede Spielprognose wird einige Stunden vor dem Anpfiff gesperrt. Die gesperrten Wahrscheinlichkeiten sind die endgültige Vorhersage, an der das Modell gemessen wird. Einmal eingefroren, können sich die Zahlen nicht mehr ändern, sodass die Kalibrierungswerte auf dieser Seite das widerspiegeln, was tatsächlich vor jedem Spiel veröffentlicht wurde.