历史表现

模型有多准确？

任何人都能说一支球队有 70% 的机会。真正的考验是之后会发生什么：被赋予 70% 概率的球队是否真的大约十次赢七次？以下是回答这个问题的核心数字——然后是你可以检验我们工作的所有方式。

以你已知的结果来评分

当这个模型说一支球队有 70% 的概率时，结果大致如此。我们在 24 个过往锦标赛（2014–2024）的全部 987 场比赛上进行了测试——每一场都由开球前一天重建的模型进行评分，因此它从未看到结果——其声明的概率与实际发生的情况偏差约 5.6 个百分点。

用一个数字概括：平均而言，它对实际发生的结果给出的概率比盲猜三选一高出约 35%。

对于统计专业人士而言，这是 0.572 的，对比盲猜的 0.667——越低越好。这是 2026 年的诚实标尺，而非事后美化的数字。

查看完整计分板——按锦标赛、按置信区间、含可靠性图 →

2026 锦标赛正在实时评分——上方追踪器逐场更新。

Match by match

Tournament report card

Every match graded as it's played. The pre-match probability locks before kickoff; after the final whistle, it scores against the result. This is the live, match-level evidence behind the numbers above.

96/104 gradedmean 0.49754 strong calls

See every match, graded →

检验工作

模型接受问责的五种方式——证据、失败记录以及每个数字背后的版本化记录。

实时 + 样本外

开球前锁定

每场比赛的预测在开球前几小时锁定。锁定的概率是模型评估所依据的最终预测。一旦冻结，数字就无法更改，因此本页面的校准分数反映了每场比赛前实际发布的内容。

模型有多准确？

Tournament report card

检验工作

校准计分板

为何信任这些数字

未通过的实验

每个版本的 Brier

方法论

开球前锁定