Bilanz
Wie genau ist das Modell?
Jeder kann sagen, ein Team habe 70 % Chance. Der ehrliche Test ist, was danach passiert: Gewinnen Teams mit 70 % Chance tatsächlich etwa sieben von zehn Mal? Hier ist die eine Zahl, die das beantwortet — und dann alle Stellen, an denen Sie unsere Arbeit überprüfen können.
Bewertet anhand von Ergebnissen, die Sie bereits kennen
Wenn dieses Modell einem Team eine 70-%-Chance gibt, passiert das ungefähr so oft. Wir haben es an jedem einzelnen der 987 Spiele bei 24 vergangenen Turnieren (2014–2024) getestet — jedes bewertet durch das Modell, das so rekonstruiert wurde, wie es am Tag vor dem Anpfiff stand, sodass es das Ergebnis nie gesehen hat — und seine angegebenen Wahrscheinlichkeiten lagen innerhalb von etwa 5.6 Prozentpunkten von dem, was tatsächlich passiert ist.
Als eine einzige Zahl ausgedrückt: Im Durchschnitt bewertete es das tatsächlich eingetretene Ergebnis mit etwa 35 % höherer Wahrscheinlichkeit als eine blinde 1-aus-3-Schätzung.
Für Statistisch-Interessierte: Das ist ein 0.572 gegenüber dem 0.667 einer blinden Schätzung — niedriger ist besser. Es ist der ehrliche Massstab für 2026, keine nachträglich geschönte Zahl.
Zum vollständigen Scoreboard — nach Turnier, nach Konfidenzband, mit Zuverlässigkeitsdiagrammen →
Überprüfen Sie die Arbeit
Fünf Wege, auf denen das Modell Rechenschaft ablegt — die Belege, die Fehlschläge und die versionierte Dokumentation hinter jeder Zahl.
Live + Out-of-Sample
Kalibrierungs-Scoreboard
Der vollständige Out-of-Sample-Backtest aufgeschlüsselt nach Turnier und Konfidenzband, plus der Live-Tracker, der jedes Spiel der WM 2026 während des Spiels bewertet. Ein mit 70 % bewertetes Ergebnis sollte etwa 70 % der Zeit eintreten — hier können Sie das überprüfen.
Das Argument · kostenlos
Warum den Zahlen vertrauen
Die Disziplin hinter den Wahrscheinlichkeiten — vorab registrierte Akzeptanzkriterien, ehrliche Berichte nach Kategorie und die Teile des Modells, in denen das Vertrauen tatsächlich geringer ist, namentlich benannt.
Veröffentlichte Fehlschläge
Was nicht funktioniert hat
Jede Modellvariante, die das Veröffentlichungs-Gate nicht bestanden hat, vollständig mit Bewertung veröffentlicht. Die Nicht-Veröffentlichungen sind genauso sichtbar wie die Erfolge — wenn nur die Gewinner gezeigt würden, würde das Modell unvermeidlicher wirken, als es ist.
Versionierte Dokumentation
Brier bei jeder Version
Die versionierte Geschichte des Modells — jedes Retraining mit seinem Brier bei Veröffentlichung gestempelt, damit die Zahl auf jeder Seite auf eine datierte Zeile zurückführt.
Wie es gebaut ist
Methodik
Die Komponentenmodelle, das Trainingsverfahren, die Datenquellen und das Backtest-Design — alles reproduzierbar aus öffentlichen Daten.
Prognose-Integrität
Vor dem Anpfiff gesperrt
Jede Spielprognose wird einige Stunden vor dem Anpfiff gesperrt. Die gesperrten Wahrscheinlichkeiten sind die endgültige Vorhersage, an der das Modell gemessen wird. Einmal eingefroren, können sich die Zahlen nicht mehr ändern, sodass die Kalibrierungswerte auf dieser Seite das widerspiegeln, was tatsächlich vor jedem Spiel veröffentlicht wurde.