リサーチ
予測はどのように構築されるか——そしてなぜ信頼できるのか
すべての確率は公開前に 8×90 日のウォークフォワード・ゲートでバックテストされ、大会期間中は実際の結果に対してリアルタイムにスコアリングされます。方法論、バックテスト、限界のすべてが公開されており、失敗した実験も含まれます。
23 件の短編記事、22 件の方法論ドキュメント、23 件の研究・バックテストノート。
- 3つの独立モデルの平均
- 8×90日ウォークフォワード・ゲート
- 失敗した実験も公開
- 公開データのみで構築
この数字を信頼できますか?
検証されるために作られています
公開された確率を真剣に受け止めるべきかどうかを決めるもの:実際の結果に対する検証結果、成功と並んで公開される失敗の記録、そしてすべての数字の背後にあるバージョン管理された記録。
完全な論証 · 無料
Why trust these numbers
A probability publication is a credibility game. Anyone can publish numbers; the question is whether those numbers track outcomes once the matches finish. This page collects the d…
ライブ・キャリブレーション・トラッカー
数字は結果を追跡していますか?
Brier score とティア別キャリブレーション。実際の結果に対してスコアリングされ、大会を通じて更新されます。70% と評価された結果は約 70% の頻度で起こるはず——ここで確認できます。
ネガティブリザルト
失敗した実験
ゲートを通過しなかったすべてのモデル・バリアント。判定とともに全文公開されています。不採用の結果は、成功と同等に可視化されています。
モデル変更履歴
すべてのバージョンを記録
モデルのバージョン管理された履歴——すべての再トレーニングとアーキテクチャ変更が、リリース時の Brier score とともに記録され、詳細ノートへリンクされています。各ページの数字は、ここの日付付き行に遡ることができます。
方法論の要点
ここから始める
モデルの仕組みを知りたい方が最初に読むべき3つのドキュメント。すべて無料で全文をお読みいただけます。
How we make predictions
How our 2026 World Cup prediction model works
Our 2026 FIFA World Cup forecasts come from a statistical prediction model that blends three approaches — an Elo rating system, a Dixon-Coles Poisson goals model, and a hierarchic…
How we make predictions
What we predict and how
For every prediction target — match outcomes, goal totals, scorelines, individual player events — there's a standard modelling approach and a set of input variables. This page cat…
Behind the scenes
Where our data comes from
The quality of any prediction depends on the data behind it. This page maps every data source we use — from free public archives to commercial feeds — and explains what each one p…
私たちが試したこと
リサーチノート
モデル構築の意思決定ログ:仮説、バックテスト、結果、採用/不採用の判定。失敗した実験は成功とともに記録されています。
Not shipped · 3 June 2026
A within-match chase layer "passes" the headline gate — and the placebo proves it shouldn't
The feasibility probe found that, after controlling for team strength, only
Shipped · 31 May 2026
Testing our approach on the Champions League final
The `/test/live/<slug>/` route renders the live-tracker pipeline
Not shipped · 29 May 2026
Is composite *coverage* the lever for the player-strength offset? (No)
player-composite's match coverage — whether honestly (point-in-time WC
最新の記事
最近の変更点
直近のモデル実行と発見からの短編ノート。
11 June 2026 · OnThePitch Staff
Five places the model disagrees with the consensus
Models don't know narratives. They read results, schedules, and xG rates. Here are five places ours diverges most from the consensus, from Ecuador over Germany to Raphinha as the #1 anytime scorer, Iran at 81%, Spain an…
11 June 2026 · OnThePitch Staff
Argentina and Spain: 0.6 points apart, nothing else in common
The model's two most likely World Cup winners sit at 17.5% and 16.9%, a gap well inside simulation noise. They get there via opposite paths. Argentina runs through the best defensive rating in the field and a penalty ad…
11 June 2026 · OnThePitch Staff
Why prediction markets keep underrating World Cup draws
Prediction markets, including Polymarket, consistently compress draw probabilities in World Cup openers. The model disagrees. Here's why the structure of prediction markets makes draws hard to price correctly, and what…