実績
モデルはどれくらい正確か?
誰でも「このチームは 70% の確率」と言うことはできます。本当のテストはその後何が起きるかです。70% と評価されたチームは実際に 10 回中約 7 回勝つのか? ここにその問いに答える数字があります。そしてその後に、私たちの仕事を検証できるすべての方法を示します。
あなたがすでに知っている結果で採点
このモデルがチームに 70% の確率を与えるとき、実際にほぼその通りになります。24 の過去の大会(2014–2024)における全 987 試合でテストしました。各試合はキックオフ前日時点のモデルで採点されており、結果を見ることなく評価されています。そしてモデルが示した確率は実際の結果と約 5.6 パーセントポイントの範囲に収まりました。
1 つの数字にまとめると:平均して、実際に起きた結果に対して盲目的な 3 分の 1 の推測よりも約 35% 高い確率を割り当てました。
統計に詳しい方へ:これは盲目的な推測の 0.667 に対する 0.572 の です。低いほど良い値です。これは 2026 年の正直な評価基準であり、事後に粉飾された数字ではありません。
仕事を検証する
モデルが説明責任を果たす 5 つの方法 — 証拠、失敗、そしてすべての数字の背後にあるバージョン管理された記録。
ライブ + サンプル外
キャリブレーション・スコアボード
大会別・信頼度帯別の完全なサンプル外バックテストに加え、2026 の各試合をリアルタイムで採点するライブトラッカー。70% と評価された結果は約 70% の頻度で起こるはずです — ここで確認できます。
論証 · 無料
なぜ数字を信頼できるのか
確率の背後にある規律 — 事前登録された受入基準、層別の正直な報告、そしてモデルの中で信頼度が本当に低い部分を名指しで示しています。
公開された失敗
うまくいかなかったもの
公開ゲートを通過しなかったすべてのモデル変種を、判定付きで全文公開。不採用の結果は成功と同じだけ可視化されています — 成功だけを見せたら、モデルは実際よりも必然的に見えてしまいます。
バージョン管理された記録
各バージョンの Brier
モデルのバージョン管理された履歴 — 各再トレーニングにリリース時の Brier が刻印されており、あらゆるページの数字が日付付きの行まで遡れます。
どのように構築されたか
方法論
構成モデル、トレーニング手順、データソース、バックテスト設計 — すべて公開データから再現可能です。
予測の完全性
キックオフ前にロック
すべての試合予測はキックオフの数時間前にロックされます。ロックされた確率がモデルの評価に使われる最終予測です。一度凍結されると数値は変更できないため、このページのキャリブレーションスコアは各試合前に実際に公開されたものを反映しています。