실적 기록
모델은 얼마나 정확한가?
누구든 어떤 팀이 70% 확률이라고 말할 수 있습니다. 진짜 시험은 그 후에 무슨 일이 일어나는가입니다: 70% 확률을 받은 팀이 실제로 열 번 중 약 일곱 번 이기나요? 그 질문에 답하는 핵심 수치가 여기 있습니다 — 그리고 우리의 작업을 검증할 수 있는 모든 방법도 함께 제시합니다.
이미 알고 있는 결과로 채점
이 모델이 어떤 팀에 70%의 확률을 부여하면, 실제로 대략 그만큼 일어납니다. 24개 과거 대회(2014–2024)의 전체 987경기에 대해 테스트했습니다 — 각 경기는 경기 전날 시점의 모델로 채점되어 결과를 미리 보지 못했습니다 — 그리고 모델이 제시한 확률은 실제 결과와 약 5.6 퍼센트포인트 내에 들어왔습니다.
하나의 숫자로 요약하면: 평균적으로 실제 일어난 결과에 대해 맹목적인 3분의 1 추측보다 약 35% 더 높은 확률을 부여했습니다.
통계에 관심이 있는 분들을 위해, 이는 맹목적 추측의 0.667에 대한 0.572 입니다 — 낮을수록 좋습니다. 이것은 2026년의 정직한 척도이며, 사후에 꾸며진 숫자가 아닙니다.
작업 검증하기
모델이 책임을 지는 다섯 가지 방법 — 증거, 실패, 그리고 모든 수치 뒤의 버전 관리된 기록.
실시간 + 표본 외
보정 스코어보드
대회별, 신뢰 구간별로 분류된 전체 표본 외 백테스트와 2026 각 경기를 실시간으로 채점하는 라이브 트래커. 70%로 평가된 결과는 약 70%의 확률로 발생해야 합니다 — 여기서 확인하세요.
논증 · 무료
숫자를 신뢰할 수 있는 이유
확률 뒤의 엄격함 — 사전 등록된 수용 기준, 등급별 정직한 보고, 그리고 모델에서 신뢰도가 실제로 낮은 부분을 이름으로 명시합니다.
공개된 실패
효과가 없었던 것
출시 기준을 통과하지 못한 모든 모델 변형을 판정과 함께 전문 공개합니다. 미채택 결과는 성공만큼 투명하게 공개됩니다 — 성공만 보여주면 모델이 실제보다 더 필연적으로 보일 것입니다.
버전 관리된 기록
각 릴리스의 Brier
모델의 버전 관리된 역사 — 각 재훈련에 출시 시점의 Brier가 기록되어 있어, 모든 페이지의 수치가 날짜가 기록된 행으로 추적됩니다.
구축 방법
방법론
구성 모델, 훈련 절차, 데이터 소스, 백테스트 설계 — 모두 공개 데이터에서 재현 가능합니다.
예측 무결성
킥오프 전 잠금
모든 경기 예측은 킥오프 몇 시간 전에 잠깁니다. 잠긴 확률이 모델 평가에 사용되는 최종 예측입니다. 한번 동결되면 숫자는 변경할 수 없으므로, 이 페이지의 교정 점수는 각 경기 전에 실제로 게시된 내용을 반영합니다.