Investigación
Cómo se construyen los pronósticos — y por qué puedes confiar en ellos
Cada probabilidad se somete a un backtest walk-forward con una compuerta de 8×90 días antes de publicarse, y luego se evalúa en vivo contra resultados reales mientras se juega el torneo — metodología, backtests y limitaciones, todo a la vista, incluidos los experimentos que fracasaron.
23 artículos breves, 22 documentos de metodología, 23 notas de investigación y backtest.
- 3 modelos independientes, promediados
- Compuerta walk-forward de 8×90 días
- Experimentos fallidos publicados
- Construido solo con datos públicos
¿Puedes confiar en los números?
Construido para ser verificado
Qué determina si las probabilidades publicadas merecen ser tomadas en serio: cómo se sostienen frente a resultados reales, los fracasos publicados junto a los aciertos y el registro versionado detrás de cada número.
El argumento completo · gratis
Why trust these numbers
A probability publication is a credibility game. Anyone can publish numbers; the question is whether those numbers track outcomes once the matches finish. This page collects the d…
Seguimiento de calibración en vivo
¿Los números reflejan los resultados?
Brier score y calibración por nivel, evaluados contra resultados reales y actualizados durante el torneo. Un resultado valorado al 70 % debería ocurrir aproximadamente el 70 % de las veces — aquí es donde lo verificas.
Resultados negativos
Los experimentos que fracasaron
Cada variante del modelo que no superó la compuerta, publicada íntegramente con su veredicto. Los no-publicados son tan visibles como los aciertos.
Registro de cambios del modelo
Cada versión, documentada
El historial versionado del modelo — cada reentrenamiento y cambio de arquitectura, con su Brier score en el momento de publicación y enlace a sus notas completas. El número en cada página se remonta a una fila fechada aquí.
Metodología esencial
Empieza aquí
Los tres documentos que leer primero si quieres saber cómo funciona el modelo. Lectura completa y gratuita.
How we make predictions
How our 2026 World Cup prediction model works
Our 2026 FIFA World Cup forecasts come from a statistical prediction model that blends three approaches — an Elo rating system, a Dixon-Coles Poisson goals model, and a hierarchic…
How we make predictions
What we predict and how
For every prediction target — match outcomes, goal totals, scorelines, individual player events — there's a standard modelling approach and a set of input variables. This page cat…
Behind the scenes
Where our data comes from
The quality of any prediction depends on the data behind it. This page maps every data source we use — from free public archives to commercial feeds — and explains what each one p…
Lo que probamos
Notas de investigación
Registros de decisión de la construcción del modelo: hipótesis, backtest, resultado y veredicto de publicar o no publicar. Los experimentos fallidos se mantienen en el registro junto a los exitosos.
Not shipped · 3 June 2026
A within-match chase layer "passes" the headline gate — and the placebo proves it shouldn't
The feasibility probe found that, after controlling for team strength, only
Shipped · 31 May 2026
Testing our approach on the Champions League final
The `/test/live/<slug>/` route renders the live-tracker pipeline
Not shipped · 29 May 2026
Is composite *coverage* the lever for the player-strength offset? (No)
player-composite's match coverage — whether honestly (point-in-time WC
Todas las 23 notas de investigación →
Últimos artículos
Qué cambió recientemente
Notas breves de las ejecuciones y hallazgos más recientes del modelo.
11 June 2026 · OnThePitch Staff
Five places the model disagrees with the consensus
Models don't know narratives. They read results, schedules, and xG rates. Here are five places ours diverges most from the consensus, from Ecuador over Germany to Raphinha as the #1 anytime scorer, Iran at 81%, Spain an…
11 June 2026 · OnThePitch Staff
Argentina and Spain: 0.6 points apart, nothing else in common
The model's two most likely World Cup winners sit at 17.5% and 16.9%, a gap well inside simulation noise. They get there via opposite paths. Argentina runs through the best defensive rating in the field and a penalty ad…
11 June 2026 · OnThePitch Staff
Why prediction markets keep underrating World Cup draws
Prediction markets, including Polymarket, consistently compress draw probabilities in World Cup openers. The model disagrees. Here's why the structure of prediction markets makes draws hard to price correctly, and what…