Pro Data

Coloque os números do modelo no seu código em minutos

157,119

pontos de dados

13,605 registros em 13 datasets, até 148 campos cada: cada valor gerado pelo modelo ou curado, reconstruído a partir da fonte todo dia. Gratuito para consultar aqui; obtenha tudo via API com uma chave gratuita.

48 nations1,215 players8,964 player-seasons958 match results

Todas as probabilidades para as 48 seleções e 104 jogos, elencos projetados, carreiras de jogadores temporada a temporada, resultados recentes e o histórico que alimenta o modelo: como JSON ou CSV, ou como ferramenta MCP que seu assistente pode chamar. Feito para pesquisadores, jogadores de fantasy, jornalistas e equipes de análise que querem o resultado do modelo em um pipeline, não em uma página. Teste um endpoint ao vivo com um comando: sem cadastro.

Disponível agora em acesso antecipado· Zip em massa + fatiamento histórico disponíveis · Notebooks reproduzíveis e resultados retroativos de WC2018/WC2022 chegando antes do início do torneio

Início rápido

Teste agora: sem cadastro

Execute isso. Retorna os cinco times com maior probabilidade de vencer o torneio diretamente do modelo ao vivo: sem conta, sem chave de API. Adicione ?format=csv para a variante tabular.

curl "https://onthepitch.now/api/v1/sample/"

Quer o panorama completo: todas as 48 seleções, todos os jogos, jogadores, elencos? Entre, gere uma chave de API (10 chamadas gratuitas para começar), e passe-a como Bearer token em qualquer endpoint:

curl -H "Authorization: Bearer otp_live_…" \
  "https://onthepitch.now/api/v1/forecast/"

Teste grátis: 10 chamadas

Entre e gere uma chave de API 10 chamadas programáticas gratuitas, compartilhadas entre esses endpoints REST e o servidor MCP hospedado: o suficiente para conectar os dados a um notebook ou assistente e ver funcionando. O handshake MCP não conta; apenas as chamadas de dados contam. O Pro Pass é ilimitado.

O que há nos dados

Ver referência interativa da API →

13 datasets, cada um acessível em /api/v1/ as JSON or — with ?format=csv — a flat table. /api/v1/sample/ is public; the rest are gated (a Bearer API key or a Pro session cookie). Below is exactly what each one returns. Full schemas live in the interactive reference (OpenAPI 3.0 spec at /api/v1/openapi.json).

Tournament forecast
48 nations
/api/v1/forecast/
Each nation's probability of lifting the trophy and of reaching every stage.
Retorna · 17 fields Tournament-win probability · advance from group · reach R16 / QF / SF / final · win-group probability · P(finish 1st–4th in group) · confederation · FIFA rank · group
Team forecast trajectory
576 snapshots
/api/v1/team-history/
How each team's forecast has moved over time — one row per daily build.
Retorna · 7 fields Team · build timestamp · Elo rating · tournament-win probability · 90% CI band (low & high)
Match forecast
104 matches
/api/v1/fixtures/
Win / draw / win plus match-event probabilities for every fixture in the bracket.
Retorna · 25 fields P(home / draw / away) · expected goals each side · over 0.5 / 1.5 / 2.5 / 3.5 goals · both teams to score · clean-sheet probability each side · kickoff, venue & city · stage & group
Predicted squads
1,248 players
/api/v1/predicted-squads/
Projected 26-man squad for every nation, one row per player.
Retorna · 13 fields Starting-XI vs bench slot · position · jersey number · captain flag · international caps & goals · composite rating · rank within position
Player index
1,215 players
/api/v1/players/
Career profile for every player in the modelling pool.
Retorna · 9 fields Name · nation · position · current club & league · birth year · career goals & assists
Player season history
8,964 player-seasons
/api/v1/player-history/
Season-by-season career record for every player — one row per player-season.
Retorna · 12 fields Player · season · team & league · position · matches & minutes · goals & assists · xG & xAG
Anytime scorer
50 ranked scorers
/api/v1/anytime-scorer/
Tournament scoring probabilities for the most likely goalscorers.
Retorna · 15 fields P(scores ≥1 in the tournament) · expected matches played · per-stage scoring probability (group → final) · rank
Recent match results
958 matches
/api/v1/results/
Every team's recent senior-international results — last 24 months, their POV.
Retorna · 10 fields Date · opponent · home / away / neutral · goals for & against · result · competition
Head-to-head records
144 pairings
/api/v1/h2h/
All-time record between each nation and its group-stage opponents.
Retorna · 12 fields Meetings · wins / draws / losses · last-meeting date, score, tournament & winner
Major-tournament history
106 tournament rows
/api/v1/majors/
Each nation's most-recent run at every major, with squad and coach continuity.
Retorna · 15 fields Tournament & year · matches · W-D-L · goals for / against · bracket finish · coach (name, year appointed, still in charge) · squad-pool continuity · ?tournament=&year= slicing
Group schedule
144 team-matchdays
/api/v1/schedule/
Every nation's three group-stage fixtures.
Retorna · 7 fields Matchday · date · opponent · host city & country
Team list
48 nations
/api/v1/teams/
The tournament field — the lookup table to join everything else on team_id.
Retorna · 6 fields team_id · name · confederation · FIFA rank · host flag · group
Bulk snapshot
One zip · ~3–5 MB
/api/v1/bulk/snapshot/
Every source file the site renders from, in a single download, with checksums.
Retorna 11 source JSONs + manifest (size, sha256 & built_at per file) · includes the deep fixture-enrichment blobs the per-endpoint variants flatten away

Como acessar

Todos os datasets acima são restritos, exceto o /api/v1/sample/ de prévia pública. Autentique com uma chave de API Bearer ou um cookie de sessão Pro; tudo mais sobre como obter os dados está abaixo.

CSV variant on every endpoint
Disponível
Pass ?format=csv on any endpoint for a tabular response, RFC-4180 quoted, suitable for spreadsheet or notebook import. All row types are flat — no nested JSON in CSV cells.
Match-day refresh + provenance metadata
Disponível
The model refits after every match day through the tournament: results, bracket movement, and revised probabilities flow into the API within hours. Every response carries the upstream snapshot's built_at timestamp in the envelope (JSON) or X-OnThePitch-Generated-At header (CSV). Cache is private 1h.
Bulk snapshot download (zip)
Disponível
GET /api/v1/bulk/snapshot/ returns one DEFLATE-compressed archive with the 11 source JSONs + a manifest (per-file size + sha256 + built_at). Includes the deep fixture enrichment blobs the per-endpoint variants flatten away. ~3–5 MB on the wire.
Historical tournament slicing
Disponível
Pass ?tournament=&year= on /api/v1/majors/ to extract a single tournament-year — e.g. every WC2026 team's WC2022 row in one call. The dataset stores each team's most-recent appearance per tournament, so WC2022 covers most qualifiers; WC2018 only covers teams that haven't been at a WC since.
Long-lived API keys
Disponível
Generate a Bearer key at /account/api-key/ and pass it as Authorization: Bearer otp_live_… on any endpoint — no cookie juggling for headless / CI / scheduled jobs. One key per account; reset it any time if it leaks.
MCP server — connect Claude / Cursor
Disponível
A hosted Model Context Protocol server at /api/mcp exposes every endpoint as an MCP tool. Add it to Claude Code, Claude Desktop, or Cursor with one command and ask questions against the live model — no install, no glue code.
Backfilled model outputs — WC2018, WC2022
Em breve
Pre-tournament model probabilities for the last two World Cups, replayed against frozen inputs so you can backtest the model end-to-end against known outcomes. Requires re-pulling historical FBref / Wikipedia snapshots; tracked as a separate research initiative.
Reproducible notebooks
Em breve
Jupyter notebooks that fit the model end-to-end from the public data files and reproduce the website's outputs. Run locally with the published datasets.

Exemplos

Três coisas que você pode fazer hoje

Set OTP_KEY to the API key you generate here (export OTP_KEY=otp_live_…) — one token, no cookie juggling, works the same from a shell, a notebook, or a scheduled job. (Signed in already? A Pro session cookie works too, but the key is the friendlier path.)

Full forecast as CSV

curl -H "Authorization: Bearer $OTP_KEY" \
  "https://onthepitch.now/api/v1/forecast/?format=csv" \
  -o forecast.csv

WC2022 historical slice

curl -H "Authorization: Bearer $OTP_KEY" \
  "https://onthepitch.now/api/v1/majors/?tournament=FIFA%20World%20Cup&year=2022" \
  -o wc2022.json

Bulk snapshot as a single zip

curl -H "Authorization: Bearer $OTP_KEY" \
  "https://onthepitch.now/api/v1/bulk/snapshot/" \
  -o onthepitch-snapshot-v1.zip

Construa com os dados

Baixe o snapshot, ajuste seu próprio modelo

O zip em massa contém tudo que o site público renderiza: previsão, jogos, elencos projetados, confrontos diretos, histórico de grandes torneios internacionais. Três receitas iniciais para carregar em um notebook e executar sua própria análise.

1 · Carregue o snapshot no pandas

Baixe o zip, extraia uma vez, depois leia cada arquivo como DataFrame. O envelope de previsão aninha uma linha por seleção: achate com pd.json_normalize.

import io, json, os, zipfile, requests, pandas as pd

z = zipfile.ZipFile(io.BytesIO(requests.get(
    "https://onthepitch.now/api/v1/bulk/snapshot/",
    headers={"Authorization": f"Bearer {os.environ['OTP_KEY']}"},
).content))

forecast = pd.json_normalize(
    json.loads(z.read("data.json"))["teams"],
)
fixtures = pd.json_normalize(
    json.loads(z.read("fixtures.json"))["fixtures"],
)
squads = pd.json_normalize(
    json.loads(z.read("predicted_squads.json"))["squads"],
    record_path="players",
    meta=["team_id"],
)

2 · Ajuste um modelo básico de probabilidade de vitória

Monte seu próprio modelo H/D/A a partir dos elencos projetados + a previsão por seleção. Avaliações compostas + soma de força do elenco é um conjunto razoável de variáveis iniciais; compare com as probabilidades publicadas para ver onde seu modelo concorda e discorda.

from sklearn.linear_model import LogisticRegression

# Aggregate predicted-XI composite to a team strength score.
xi = squads.query("slot == 'xi'")
strength = xi.groupby("team_id")["composite"].sum().rename("strength")

# Join strength onto fixtures and fit a logistic on prior tournament
# results (intl_majors.json has W/D/L from previous WCs + qualifiers).
intl = pd.json_normalize(
    json.loads(z.read("intl_majors.json"))["rows"],
)
features = intl.merge(strength, left_on="team_id", right_index=True)
X = features[["strength", "fifa_rank"]]
y = (features["finish"] >= 9).astype(int)  # 1 = quarter-final or better

clf = LogisticRegression().fit(X, y)
print(clf.coef_)

3 · Calibre seu modelo contra a previsão publicada

Quando seu modelo produzir probabilidades de título por seleção, compare com as nossas via Brier score e um gráfico de confiabilidade: a mesma métrica que usamos na documentação metodológica.

from sklearn.metrics import brier_score_loss

merged = forecast.merge(
    pd.Series(my_probs, name="my_p_win"),
    left_on="team_id", right_index=True,
)
print("OnThePitch Brier:", brier_score_loss(merged["won"], merged["p_win"]))
print("Yours        Brier:", brier_score_loss(merged["won"], merged["my_p_win"]))

A licença do Pass é para uso em pesquisa: ajuste, faça backtests, publique suas descobertas. Atribuição a o documento de metodologia é bem-vinda, mas não obrigatória.

Agentes

Conecte o Claude, Cursor ou qualquer cliente MCP

Um servidor Model Context Protocol hospedado em /api/mcp expõe cada endpoint como ferramenta MCP, para que você faça perguntas ao modelo ao vivo diretamente no seu assistente: sem instalação, sem código intermediário. Autentique com uma chave de API qualquer conta logada pode gerar uma, e suas primeiras 10 chamadas de ferramentas são gratuitas.

Adicione ao Claude Code

claude mcp add --transport http onthepitch \
  https://onthepitch.now/api/mcp \
  --header "Authorization: Bearer otp_live_…"

Then prompt naturally — “which team is most likely to win the group?”, “compare the projected XIs for France and England”, “how did Brazil do at WC2022?” — and the assistant calls the matching tool (get_forecast, get_predicted_squads, get_majors) and answers from the live data.

Pro Pass

Adquira o Pro Pass para acesso ilimitado

Toda conta recebe 10 chamadas gratuitas para experimentar a API + MCP. O Pro Pass é uma compra única de $35 para acesso ilimitado: tudo do Standard Pass mais os endpoints de dados, download do zip em massa e fatiamento de torneios históricos. Notebooks reproduzíveis chegam antes do início do torneio. Já possui o Standard Pass? Faça upgrade por $20.

Adquirir o Pro Pass: $35 →

24h money-back, no questions asked·No subscription, no auto-renewal·Access through 31 Dec 2026. See refund policy.