Performans kaydı
Model ne kadar doğru?
Herhangi biri bir takımın %70 şansı olduğunu söyleyebilir. Dürüst test, sonra ne olduğudur: %70 verilen takımlar gerçekten on seferin yaklaşık yedisinde kazanıyor mu? İşte bunu cevaplayan tek rakam — ve ardından çalışmamızı kontrol edebileceğiniz tüm yollar.
Zaten bildiğiniz sonuçlara karşı puanlandı
Bu model bir takıma %70 olasılık verdiğinde, gerçekleşen yaklaşık olarak bu kadardır. Geçmiş 24 turnuvadaki (2014–2024) 987 maçın tamamında test ettik — her biri maçtan bir gün önceki haliyle yeniden oluşturulan modelle puanlandı, dolayısıyla sonucu hiç görmedi — ve bildirilen olasılıklar, gerçekte olanla yaklaşık 5.6 yüzde puanı içinde kaldı.
Tek bir sayıya indirgenirse: ortalamada, gerçekte gerçekleşen sonuca kör bir 3'te 1 tahmininden yaklaşık %35 daha fazla olasılık atadı.
İstatistik odaklılar için, bu kör tahminin 0.667 değerine karşı 0.572 demektir — düşük olan daha iyidir. Bu 2026 için dürüst ölçüttür, olay sonrası güzelleştirilmiş bir rakam değildir.
Tam puan tablosunu görüntüleyin — turnuva, güven aralığı ve güvenilirlik diyagramlarıyla →
Çalışmayı kontrol edin
Modelin hesap verdiği beş yol — kanıtlar, başarısızlıklar ve her sayının arkasındaki sürüm kaydı.
Canlı + örneklem dışı
Kalibrasyon puan tablosu
Turnuva ve güven aralığına göre ayrıştırılmış eksiksiz örneklem dışı geriye dönük test, artı 2026'nın her maçını oynanırken puanlayan canlı takipçi. %70 olasılık verilen bir sonuç zamanın yaklaşık %70'inde gerçekleşmelidir — kontrol edeceğiniz yer burasıdır.
Argüman · ücretsiz
Rakamlara neden güvenmelisiniz
Olasılıkların arkasındaki disiplin — önceden kaydedilmiş kabul kriterleri, seviye bazında dürüst raporlama ve modelin güvenin gerçekten daha düşük olduğu kısımları, ismiyle belirtilmiş.
Yayımlanan başarısızlıklar
İşe yaramayan şeyler
Yayımlama kriterini geçemeyen her model varyantı, değerlendirmesiyle birlikte eksiksiz olarak yayımlanmıştır. Yayımlanmayan sonuçlar başarılar kadar görünürdür — yalnızca kazananlar gösterilseydi, model olduğundan daha kaçınılmaz görünürdü.
Sürüm kaydı
Her sürümde Brier
Modelin sürüm geçmişi — her yeniden eğitim, yayın anındaki Brier ile damgalanmış, böylece herhangi bir sayfadaki sayı tarihli bir satıra kadar izlenebilir.
Nasıl inşa edildi
Yöntem
Bileşen modeller, eğitim prosedürü, veri kaynakları ve geriye dönük test tasarımı — tamamı kamuya açık verilerden yeniden üretilebilir.
Tahmin bütünlüğü
Başlama vuruşundan önce kilitlendi
Her maç tahmini, başlama vuruşundan birkaç saat önce kilitlenir. Kilitlenen olasılıklar, modelin değerlendirildiği nihai tahmindir. Bir kez dondurulduktan sonra sayılar değiştirilemez, bu nedenle bu sayfadaki kalibrasyon puanları her maç öncesinde gerçekten yayımlananları yansıtır.