Pesquisa
Resultados negativos
As variantes do modelo e adições de features que foram testadas, julgadas contra o portão walk-forward de Brier + ECE de 8×90 dias, e não melhoraram o conjunto publicado. Publicadas integralmente porque a decisão de não publicar é a mesma história de calibração da decisão de publicar: cada entrada abaixo registra uma hipótese que alguém poderia ter formulado, o teste que a julgou e o motivo pelo qual o teste disse não.
11 de 23 notas no corpus são não publicados. O índice completo de notas, incluindo as variantes que foram publicadas, está em /research/notes/.
Por que publicar os não publicados
- Sem seleção enviesada. Se apenas as variantes que melhoraram o portão fossem publicadas, o conjunto publicado pareceria mais inevitável do que é. Os não publicados são evidência do que o corpus e o portão não conseguem distinguir — são o espaço negativo ao redor de cada mudança publicada no modelo.
- Evita reteste acidental. Uma ablação fracassada de seis meses atrás é invisível para um novo colaborador a menos que seu relatório seja encontrável. Manter resultados negativos na mesma superfície dos positivos significa que "alguém já tentou isso?" tem uma resposta que não exige ler o log de commits.
- Delimita o teto do modelo. Uma sequência de variantes fracassadas com alta capacidade no mesmo corpus é em si uma medição: o portão é difícil de bater com os dados disponíveis atualmente. Esse sinal é mais útil para um leitor que pode ver as falhas do que para um que só vê os acertos.
- Não publicado3 June 2026
A within-match chase layer "passes" the headline gate — and the placebo proves it shouldn't
The feasibility probe found that, after controlling for team strength, only
Ler nota →
- Não publicado29 May 2026
Is composite *coverage* the lever for the player-strength offset? (No)
player-composite's match coverage — whether honestly (point-in-time WC
Ler nota →
- Não publicado29 May 2026
Does a player-form (momentum) offset improve match forecasts? (No)
player-form differential offset `Δ = α·(form_home − form_away)` does
Ler nota →
- Não publicado29 May 2026
Can we fit the player-strength coefficient instead of hand-setting it? (No)
α = 0.05 offset (Model 16) beats a per-fold fitted α on median Brier.
Ler nota →
- Não publicado27 May 2026
Anytime-scorer `start_prob` v2 — predicted-XI layer (default-off)
Model 5 (`scripts/build_anytime_scorer.py`) produces `P(player scores ≥ 1 across the WC tournament)`. The headline depends on `E[minutes]`, which is derived from `start_prob` (the per-match starter likelihood). The v1 chain was:
Ler nota →
- Não publicado27 May 2026
Do teams try harder in must-win games? (No, actually)
Football economics literature (Brams & Ismail 2018; Apesteguia & Palacios-Huerta 2010 on tournament-incentive distortions) reports that match outcomes in the final round of group-stage tournaments deviate from baseline expectations when the
Ler nota →
- Não publicado27 May 2026
Letting team ratings drift over time (didn't improve predictions)
Per the design note (variant a, "EMA on (α_t, β_t)"): each team's attack/defence parameters should EVOLVE through time rather than absorb every era's matches into a single stationary compromise. Refit DC at K snapshot timestamps (= the 8 qu
Ler nota →
- Não publicado24 May 2026
Do some playing styles beat others? (Not enough to measure)
- `scripts/build_style_matchup_training.py` (per-match training join)
Ler nota →
- Não publicado23 May 2026
Retuning the models for tournament football — what changed
PR #310 documented that all four models in the ensemble are ~7% worse on tournament matches than on the all-matches average. The natural follow-up is to refit the predict-time knobs on a tournament-only training slice and serve tournament-v
Ler nota →
- Não publicado21 May 2026
Does extra rest between matches help? (Not measurably)
Sports-science literature reports a measurable effect of recovery time on football performance: better-rested teams score slightly more goals than fatigued ones. The expected magnitude is small but consistent across studies (Mohr et al. 201
Ler nota →
- Não publicado
Can international-tournament StatsBomb signals beat the club-derived baseline?
PR #525 + PR #532 produced two new per-team signals extracted from StatsBomb open event data across WC 2018/2022, Euro 2020/2024, Copa America 2024, AFCON 2023:
Ler nota →