소개
스포츠 데이터, 모델, AI는 모두의 것이어야 합니다
지난 10년간 프로 구단과 각국 축구 협회는 분석 역량에 막대한 투자를 해왔습니다 — 독점 트래킹 피드, 내부 모델 스택, 전담 데이터 사이언스 팀, 그리고 대중에게 공개되지 않는 도구들. OnThePitch는 이를 대중에게 개방합니다 — 데이터, 모델, 그리고 그 이면의 AI를 — 2026 FIFA 월드컵을 시작으로.
OnThePitch
무엇을 제공하는가
월드컵을 위한 보정된 통계 모델 — 모든 경기의 승패 확률, 모든 대표팀의 예상 선발 XI, 우승 확률, 선수별 득점 확률, 기대 골, 그리고 그 모든 방법론. 공개 데이터 소스를 기반으로 구축하여 매 실행마다 갱신하며, 문서를 공개합니다.
자세한 내용은 /docs/methodology/에서 전체 방법론을, /posts/에서 짧은 연구 노트를, /data/에서 데이터 내보내기 엔드포인트를 확인하세요.
확률을 읽는 법
사이트의 모든 수치는 확률 — 장기적 빈도이지, 확실한 결과에 대한 예측이 아닙니다. 모델이 어떤 팀에 18%의 승률을 부여한다면, 유사한 경기를 여러 번 치를 때 이런 결과가 약 다섯 번에 한 번꼴로 나타난다는 의미입니다. 낮은 확률의 결과는 항상 발생합니다. 그것이 바로 18%가 뜻하는 바입니다.
수치가 빈도이기 때문에 같은 방식으로 검증합니다 — 모델의 예측과 실제 결과를 경기마다 비교합니다. 방법론은 확률이 어떻게 구축되고 보정되는지 설명하며, 과정에서 만나는 모든 용어와 컬럼에는 정의가 있습니다.
누구를 위한 것인가
실제 선발 가능성에 대해 확률 기반 관점을 원하는 판타지 플레이어. 감이 아닌 인용 가능한 모델 출력을 원하는 축구 기자. API를 통해 깔끔한 경기별 데이터를 원하는 스포츠 분석 애호가와 개발자. 토너먼트 역학을 연구하는 학술 연구자. 그리고 프로가 이미 사용하는 것과 같은 통계적 관점을 원하는 모든 축구 팬.
왜 이 일을 하는가
현대 Premier League 구단은 월 5자릿수 데이터 계약을 맺고, Dixon-Coles 변형 모델을 피팅하는 분석가를 고용하며, 팬들이 절대 읽을 수 없는 전술 보고서를 작성합니다. 그들이 생산하는 대부분은 비밀이 아닙니다 — Elo 재피팅, Poisson 골 모델, Bayesian 계층 모델 등 — 하지만 통합 비용이 비싸고, 바로 그 통합이 진입 장벽입니다.
우리가 주장하고 싶은 것은 그 통합이 공공재여야 한다는 것입니다. 브라우저를 가진 누구나 보정된 토너먼트 예측을 읽을 수 있다면, 경기에 대한 대화는 TV 해설자의 생각이 아닌 모델의 관점은 이러하고, 여기서 확신이 있으며, 여기서는 없다는 것으로 바뀝니다. 그것이 더 나은 대화이고, 이 프로젝트가 실현하고자 하는 것입니다.
우리의 작업 방식
공개 데이터 소스
모델이 읽는 모든 데이터는 공개되어 있습니다 — FIFA 일정, Wikipedia 스쿼드 페이지, worldfootballR 생태계를 통한 FBref, 공개 클럽 시즌 데이터. 전체 소스 목록은 방법론 페이지에 있으며, 모든 독자가 같은 공개 아카이브에서 입력 데이터를 재현할 수 있습니다.
방법론 완전 공개
사이트의 모든 확률은 아키텍처, 피처, 학습 절차, 한계가 /docs/에 기술된 모델에서 나옵니다. 페이지의 수치가 의외라면, 방법론이 그 출처를 설명해 줄 것입니다.
무료 기본 접근
핵심 예측 — 토너먼트 우승, 조별 순위, 토너먼트 대진 — 은 모든 독자에게 무료입니다. 예상 선발 XI, 스쿼드, 선수별 종합 평점, 전체 방법론도 포함됩니다. 더 깊은 분석 계층은 연구를 지원하는 일회성 Pass로 이용할 수 있습니다.
편집 범위
OnThePitch는 구조적으로 통계 출판물입니다 — FiveThirtyEight나 FBref와 같은 전통에 속합니다. 제품은 모델의 보정된 확률, 그 이면의 방법론, 그리고 이로부터 도출되는 팀별 및 선수별 분석입니다. 수익은 연구 자금으로 사용됩니다.
문의하기
버그를 발견했거나 기능을 제안하고 싶거나 연구에 대한 질문이 있으시면 피드백 양식이 가장 빠릅니다.
운영 주체
OnThePitch는 독립적인 스포츠 분석 프로젝트입니다.