リサーチ

予測はどのように構築されるか——そしてなぜ信頼できるのか

すべての確率は公開前に 8×90 日のウォークフォワード・ゲートでバックテストされ、大会期間中は実際の結果に対してリアルタイムにスコアリングされます。方法論、バックテスト、限界のすべてが公開されており、失敗した実験も含まれます。

50 件の短編記事、22 件の方法論ドキュメント、25 件の研究・バックテストノート。

3つの独立モデルの平均
8×90日ウォークフォワード・ゲート
失敗した実験も公開
公開データのみで構築

この数字を信頼できますか？

検証されるために作られています

公開された確率を真剣に受け止めるべきかどうかを決めるもの：実際の結果に対する検証結果、成功と並んで公開される失敗の記録、そしてすべての数字の背後にあるバージョン管理された記録。

完全な論証 · 無料

Why trust these numbers

A probability publication is a credibility game. Anyone can publish numbers; the question is whether those numbers track outcomes once the matches finish. This page collects the d…

ライブ・キャリブレーション・トラッカー

数字は結果を追跡していますか？

Brier score とティア別キャリブレーション。実際の結果に対してスコアリングされ、大会を通じて更新されます。70% と評価された結果は約 70% の頻度で起こるはず——ここで確認できます。

ネガティブリザルト

失敗した実験

ゲートを通過しなかったすべてのモデル・バリアント。判定とともに全文公開されています。不採用の結果は、成功と同等に可視化されています。

モデル変更履歴

すべてのバージョンを記録

モデルのバージョン管理された履歴——すべての再トレーニングとアーキテクチャ変更が、リリース時の Brier score とともに記録され、詳細ノートへリンクされています。各ページの数字は、ここの日付付き行に遡ることができます。

方法論の要点

ここから始める

モデルの仕組みを知りたい方が最初に読むべき3つのドキュメント。すべて無料で全文をお読みいただけます。

How we make predictions

私たちが試したこと

リサーチノート

モデル構築の意思決定ログ：仮説、バックテスト、結果、採用/不採用の判定。失敗した実験は成功とともに記録されています。

Shipped · 29 June 2026

予測はどのように構築されるか——そしてなぜ信頼できるのか

検証されるために作られています

Why trust these numbers

数字は結果を追跡していますか？

失敗した実験

すべてのバージョンを記録

ここから始める

How our 2026 World Cup prediction model works

What we predict and how

Where our data comes from

リサーチノート

Neural Poisson: a nonlinear extension of Dixon-Coles

A within-match chase layer "passes" the headline gate — and the placebo proves it shouldn't

Testing our approach on the Champions League final

最近の変更点

July 1: France demolish Sweden, Haaland rescues Norway, Mexico end a 40-year drought

June 30: Paraguay eliminate Germany, Martinelli rescues Brazil, Morocco outlast the Netherlands

Four models are better than three