Pro Data

Coloque os números do modelo no seu código em minutos

156,421

pontos de dados

13,507 registros em 13 datasets, até 148 campos cada: cada valor gerado pelo modelo ou curado, reconstruído a partir da fonte todo dia. Gratuito para consultar aqui; obtenha tudo via API com uma chave gratuita.

48 nations1,215 players8,964 player-seasons958 match results

Todas as probabilidades para as 48 seleções e 104 jogos, elencos projetados, carreiras de jogadores temporada a temporada, resultados recentes e o histórico que alimenta o modelo: como JSON ou CSV, ou como ferramenta MCP que seu assistente pode chamar. Feito para pesquisadores, jogadores de fantasy, jornalistas e equipes de análise que querem o resultado do modelo em um pipeline, não em uma página. Teste um endpoint ao vivo com um comando: sem cadastro.

Disponível agora em acesso antecipado· Zip em massa + fatiamento histórico disponíveis · Notebooks reproduzíveis e resultados retroativos de WC2018/WC2022 chegando antes do início do torneio

Início rápido

Teste agora: sem cadastro

Execute isso. Retorna os cinco times com maior probabilidade de vencer o torneio diretamente do modelo ao vivo: sem conta, sem chave de API. Adicione ?format=csv para a variante tabular.

curl "https://onthepitch.now/api/v1/sample/"

Quer o panorama completo: todas as 48 seleções, todos os jogos, jogadores, elencos? Entre, gere uma chave de API (10 chamadas gratuitas para começar), e passe-a como Bearer token em qualquer endpoint:

curl -H "Authorization: Bearer otp_live_…" \
  "https://onthepitch.now/api/v1/forecast/"

Teste grátis: 10 chamadas

Entre e gere uma chave de API 10 chamadas programáticas gratuitas, compartilhadas entre esses endpoints REST e o servidor MCP hospedado: o suficiente para conectar os dados a um notebook ou assistente e ver funcionando. O handshake MCP não conta; apenas as chamadas de dados contam. O Pro Pass é ilimitado.

13 datasets, cada um acessível em /api/v1/ as JSON or — with ?format=csv — a flat table. /api/v1/sample/ is public; the rest are gated (a Bearer API key or a Pro session cookie). Below is exactly what each one returns. Full schemas live in the interactive reference (OpenAPI 3.0 spec at /api/v1/openapi.json).

  • Tournament forecast

    48 nations

    /api/v1/forecast/

    Each nation's probability of lifting the trophy and of reaching every stage.

    Retorna · 17 fields Tournament-win probability · advance from group · reach R16 / QF / SF / final · win-group probability · P(finish 1st–4th in group) · confederation · FIFA rank · group

  • Team forecast trajectory

    480 snapshots

    /api/v1/team-history/

    How each team's forecast has moved over time — one row per daily build.

    Retorna · 7 fields Team · build timestamp · Elo rating · tournament-win probability · 90% CI band (low & high)

  • Match forecast

    104 matches

    /api/v1/fixtures/

    Win / draw / win plus match-event probabilities for every fixture in the bracket.

    Retorna · 25 fields P(home / draw / away) · expected goals each side · over 0.5 / 1.5 / 2.5 / 3.5 goals · both teams to score · clean-sheet probability each side · kickoff, venue & city · stage & group

  • Predicted squads

    1,246 players

    /api/v1/predicted-squads/

    Projected 26-man squad for every nation, one row per player.

    Retorna · 13 fields Starting-XI vs bench slot · position · jersey number · captain flag · international caps & goals · composite rating · rank within position

  • Player index

    1,215 players

    /api/v1/players/

    Career profile for every player in the modelling pool.

    Retorna · 9 fields Name · nation · position · current club & league · birth year · career goals & assists

  • Player season history

    8,964 player-seasons

    /api/v1/player-history/

    Season-by-season career record for every player — one row per player-season.

    Retorna · 12 fields Player · season · team & league · position · matches & minutes · goals & assists · xG & xAG

  • Anytime scorer

    50 ranked scorers

    /api/v1/anytime-scorer/

    Tournament scoring probabilities for the most likely goalscorers.

    Retorna · 15 fields P(scores ≥1 in the tournament) · expected matches played · per-stage scoring probability (group → final) · rank

  • Recent match results

    958 matches

    /api/v1/results/

    Every team's recent senior-international results — last 24 months, their POV.

    Retorna · 10 fields Date · opponent · home / away / neutral · goals for & against · result · competition

  • Head-to-head records

    144 pairings

    /api/v1/h2h/

    All-time record between each nation and its group-stage opponents.

    Retorna · 12 fields Meetings · wins / draws / losses · last-meeting date, score, tournament & winner

  • Major-tournament history

    106 tournament rows

    /api/v1/majors/

    Each nation's most-recent run at every major, with squad and coach continuity.

    Retorna · 15 fields Tournament & year · matches · W-D-L · goals for / against · bracket finish · coach (name, year appointed, still in charge) · squad-pool continuity · ?tournament=&year= slicing

  • Group schedule

    144 team-matchdays

    /api/v1/schedule/

    Every nation's three group-stage fixtures.

    Retorna · 7 fields Matchday · date · opponent · host city & country

  • Team list

    48 nations

    /api/v1/teams/

    The tournament field — the lookup table to join everything else on team_id.

    Retorna · 6 fields team_id · name · confederation · FIFA rank · host flag · group

  • Bulk snapshot

    One zip · ~3–5 MB

    /api/v1/bulk/snapshot/

    Every source file the site renders from, in a single download, with checksums.

    Retorna 11 source JSONs + manifest (size, sha256 & built_at per file) · includes the deep fixture-enrichment blobs the per-endpoint variants flatten away

Como acessar

Todos os datasets acima são restritos, exceto o /api/v1/sample/ de prévia pública. Autentique com uma chave de API Bearer ou um cookie de sessão Pro; tudo mais sobre como obter os dados está abaixo.

  • CSV variant on every endpoint

    Disponível

    Pass ?format=csv on any endpoint for a tabular response, RFC-4180 quoted, suitable for spreadsheet or notebook import. All row types are flat — no nested JSON in CSV cells.

  • Daily refresh + provenance metadata

    Disponível

    Every response carries the upstream snapshot's built_at timestamp in the envelope (JSON) or X-OnThePitch-Generated-At header (CSV). Pipeline refits daily; cache is private 1h.

  • Bulk snapshot download (zip)

    Disponível

    GET /api/v1/bulk/snapshot/ returns one DEFLATE-compressed archive with the 11 source JSONs + a manifest (per-file size + sha256 + built_at). Includes the deep fixture enrichment blobs the per-endpoint variants flatten away. ~3–5 MB on the wire.

  • Historical tournament slicing

    Disponível

    Pass ?tournament=&year= on /api/v1/majors/ to extract a single tournament-year — e.g. every WC2026 team's WC2022 row in one call. The dataset stores each team's most-recent appearance per tournament, so WC2022 covers most qualifiers; WC2018 only covers teams that haven't been at a WC since.

  • Long-lived API keys

    Disponível

    Generate a Bearer key at /account/api-key/ and pass it as Authorization: Bearer otp_live_… on any endpoint — no cookie juggling for headless / CI / scheduled jobs. One key per account; reset it any time if it leaks.

  • MCP server — connect Claude / Cursor

    Disponível

    A hosted Model Context Protocol server at /api/mcp exposes every endpoint as an MCP tool. Add it to Claude Code, Claude Desktop, or Cursor with one command and ask questions against the live model — no install, no glue code.

  • Backfilled model outputs — WC2018, WC2022

    Em breve

    Pre-tournament model probabilities for the last two World Cups, replayed against frozen inputs so you can backtest the model end-to-end against known outcomes. Requires re-pulling historical FBref / Wikipedia snapshots; tracked as a separate research initiative.

  • Reproducible notebooks

    Em breve

    Jupyter notebooks that fit the model end-to-end from the public data files and reproduce the website's outputs. Run locally with the published datasets.

Exemplos

Três coisas que você pode fazer hoje

Set OTP_KEY to the API key you generate here (export OTP_KEY=otp_live_…) — one token, no cookie juggling, works the same from a shell, a notebook, or a scheduled job. (Signed in already? A Pro session cookie works too, but the key is the friendlier path.)

Full forecast as CSV

curl -H "Authorization: Bearer $OTP_KEY" \
  "https://onthepitch.now/api/v1/forecast/?format=csv" \
  -o forecast.csv

WC2022 historical slice

curl -H "Authorization: Bearer $OTP_KEY" \
  "https://onthepitch.now/api/v1/majors/?tournament=FIFA%20World%20Cup&year=2022" \
  -o wc2022.json

Bulk snapshot as a single zip

curl -H "Authorization: Bearer $OTP_KEY" \
  "https://onthepitch.now/api/v1/bulk/snapshot/" \
  -o onthepitch-snapshot-v1.zip

Construa com os dados

Baixe o snapshot, ajuste seu próprio modelo

O zip em massa contém tudo que o site público renderiza: previsão, jogos, elencos projetados, confrontos diretos, histórico de grandes torneios internacionais. Três receitas iniciais para carregar em um notebook e executar sua própria análise.

1 · Carregue o snapshot no pandas

Baixe o zip, extraia uma vez, depois leia cada arquivo como DataFrame. O envelope de previsão aninha uma linha por seleção: achate com pd.json_normalize.

import io, json, os, zipfile, requests, pandas as pd

z = zipfile.ZipFile(io.BytesIO(requests.get(
    "https://onthepitch.now/api/v1/bulk/snapshot/",
    headers={"Authorization": f"Bearer {os.environ['OTP_KEY']}"},
).content))

forecast = pd.json_normalize(
    json.loads(z.read("data.json"))["teams"],
)
fixtures = pd.json_normalize(
    json.loads(z.read("fixtures.json"))["fixtures"],
)
squads = pd.json_normalize(
    json.loads(z.read("predicted_squads.json"))["squads"],
    record_path="players",
    meta=["team_id"],
)

2 · Ajuste um modelo básico de probabilidade de vitória

Monte seu próprio modelo H/D/A a partir dos elencos projetados + a previsão por seleção. Avaliações compostas + soma de força do elenco é um conjunto razoável de variáveis iniciais; compare com as probabilidades publicadas para ver onde seu modelo concorda e discorda.

from sklearn.linear_model import LogisticRegression

# Aggregate predicted-XI composite to a team strength score.
xi = squads.query("slot == 'xi'")
strength = xi.groupby("team_id")["composite"].sum().rename("strength")

# Join strength onto fixtures and fit a logistic on prior tournament
# results (intl_majors.json has W/D/L from previous WCs + qualifiers).
intl = pd.json_normalize(
    json.loads(z.read("intl_majors.json"))["rows"],
)
features = intl.merge(strength, left_on="team_id", right_index=True)
X = features[["strength", "fifa_rank"]]
y = (features["finish"] >= 9).astype(int)  # 1 = quarter-final or better

clf = LogisticRegression().fit(X, y)
print(clf.coef_)

3 · Calibre seu modelo contra a previsão publicada

Quando seu modelo produzir probabilidades de título por seleção, compare com as nossas via Brier score e um gráfico de confiabilidade: a mesma métrica que usamos na documentação metodológica.

from sklearn.metrics import brier_score_loss

merged = forecast.merge(
    pd.Series(my_probs, name="my_p_win"),
    left_on="team_id", right_index=True,
)
print("OnThePitch Brier:", brier_score_loss(merged["won"], merged["p_win"]))
print("Yours        Brier:", brier_score_loss(merged["won"], merged["my_p_win"]))

A licença do Pass é para uso em pesquisa: ajuste, faça backtests, publique suas descobertas. Atribuição a o documento de metodologia é bem-vinda, mas não obrigatória.

Agentes

Conecte o Claude, Cursor ou qualquer cliente MCP

Um servidor Model Context Protocol hospedado em /api/mcp expõe cada endpoint como ferramenta MCP, para que você faça perguntas ao modelo ao vivo diretamente no seu assistente: sem instalação, sem código intermediário. Autentique com uma chave de API qualquer conta logada pode gerar uma, e suas primeiras 10 chamadas de ferramentas são gratuitas.

Adicione ao Claude Code

claude mcp add --transport http onthepitch \
  https://onthepitch.now/api/mcp \
  --header "Authorization: Bearer otp_live_…"

Then prompt naturally — “which team is most likely to win the group?”, “compare the projected XIs for France and England”, “how did Brazil do at WC2022?” — and the assistant calls the matching tool (get_forecast, get_predicted_squads, get_majors) and answers from the live data.

Pro Pass

Adquira o Pro Pass para acesso ilimitado

Toda conta recebe 10 chamadas gratuitas para experimentar a API + MCP. O Pro Pass é uma compra única de $35 para acesso ilimitado: tudo do Standard Pass mais os endpoints de dados, download do zip em massa e fatiamento de torneios históricos. Notebooks reproduzíveis chegam antes do início do torneio. Já possui o Standard Pass? Faça upgrade por $20.

24h self-service refund·No subscription, no auto-renewal·Access through 31 Dec 2026. See refund policy.