Pek çok kişi (ben dahil) futbolu "öngörülemeyen oyun" olarak adlandırır çünkü bir futbol karşılaşmasının skoru değiştirebilecek farklı faktörleri vardır.
Bu doğru… bir dereceye kadar.
Bir maçın son skorunu veya galibini tahmin etmek zordur, ancak iş bir müsabakanın galibini tahmin etmeye geldiğinde durum böyle değildir. Son 5 yılda, Bayern Münih tüm Bundesliga'ları kazanırken, Manchester City 4 Premier Lig kazandı.
Tesadüf? Öyle düşünmüyorum.
Aslında, 20-21 sezonunun ortasında Premier Lig, La Liga, Serie A ve Bundesliga'nın galibini tahmin etmek için bir model oluşturdum ve bu model , hepsinin galibini başarıyla tahmin etti.
O noktada 19 maç oynandığı için bu tahmini yapmak o kadar da zor değildi. Şimdi aynı modeli 2022 Dünya Kupası'nı tahmin etmek için kullanıyorum.
Neden? Niye? Peki, Poisson dağılımının tanımına bir göz atalım.
Ama bu yeterli değil. Hala Poisson dağılımının varsayımlarını karşılamamız gerekiyor.
Avrupa'nın en iyi liglerinin kazananlarını tahmin ettiğimde, en iyi 4 lig için son 5 yıldaki her maçtaki gol sayısının histogramını çizdim.
4 ligdeki gol sayısının histogramı
Herhangi bir ligin uygunluk eğrisine bakarsanız, Poisson dağılımı gibi görünür.
Artık bir maçta atılabilecek gol sayısının olasılığını hesaplamak için Poisson dağılımını kullanmanın mümkün olduğunu söyleyebiliriz.
İşte Poisson dağılımının formülü.
Düşündüğüm tahminleri yapmak için:
lambda : 90 dakikadaki gollerin medyanı (A Takımı ve B Takımı)
x : A Takımı ve B Takımı tarafından bir maçta atılabilecek gol sayısı
Lambda'yı hesaplamak için, her bir milli takımın attığı/yediği ortalama gollere ihtiyacımız var. Bu bizi bir sonraki noktaya götürür.
Avrupa'nın en iyi 4 ligi için yaptığım tahminde iç saha/deplasman faktörünü dikkate aldım ancak Dünya Kupası'nda hemen hemen tüm takımlar tarafsız bir stadyumda oynadığı için bu analizde bu faktörü dikkate almadım.
Her milli takımın attığı/yediği golleri aldığımda, her takımın grup aşamasında alacağı puan sayısını tahmin eden bir fonksiyon oluşturdum.
Basitçe söylemek gerekirse , kazanandan büyükse ev sahibi takım, aksi takdirde kazanan deplasman takımıdır.
Fonksiyonu bir kez daha çalıştırarak, kazananın...
Bu doğru… bir dereceye kadar.
Bir maçın son skorunu veya galibini tahmin etmek zordur, ancak iş bir müsabakanın galibini tahmin etmeye geldiğinde durum böyle değildir. Son 5 yılda, Bayern Münih tüm Bundesliga'ları kazanırken, Manchester City 4 Premier Lig kazandı.
Tesadüf? Öyle düşünmüyorum.
Aslında, 20-21 sezonunun ortasında Premier Lig, La Liga, Serie A ve Bundesliga'nın galibini tahmin etmek için bir model oluşturdum ve bu model , hepsinin galibini başarıyla tahmin etti.
O noktada 19 maç oynandığı için bu tahmini yapmak o kadar da zor değildi. Şimdi aynı modeli 2022 Dünya Kupası'nı tahmin etmek için kullanıyorum.
Maçları nasıl tahmin edeceğiz?
Tahmin yapmanın farklı yolları vardır. Süslü bir makine öğrenimi modeli oluşturabilir ve onu birden çok değişkenle besleyebilirdim, ancak bazı makaleleri okuduktan sonra Poisson dağılımına bir şans vermeye karar verdim.Neden? Niye? Peki, Poisson dağılımının tanımına bir göz atalım.
Golü bir futbol maçının 90 dakikasında olabilecek bir olay olarak düşünürsek, bir maçta A takımı ve B takımı tarafından atılabilecek gol sayısının olasılığını hesaplayabiliriz.Poisson dağılımı, sabit bir zaman aralığında veya fırsat bölgesinde meydana gelen olayların sayısını açıklayan ayrık bir olasılık dağılımıdır.
Ama bu yeterli değil. Hala Poisson dağılımının varsayımlarını karşılamamız gerekiyor.
- Olayların sayısı sayılabilir (bir maçta 1, 2, 3 veya daha fazla gol olabilir)
- Olayların oluşumu bağımsızdır (bir golün gerçekleşmesi başka bir golün olasılığını etkilememelidir)
- Olayların meydana gelme hızı sabittir (belirli bir zaman aralığında bir hedefin gerçekleşme olasılığı, aynı uzunluktaki diğer tüm zaman aralıkları için tam olarak aynı olmalıdır)
- İki olay tam olarak aynı anda gerçekleşemez (iki gol aynı anda gerçekleşemez)
Avrupa'nın en iyi liglerinin kazananlarını tahmin ettiğimde, en iyi 4 lig için son 5 yıldaki her maçtaki gol sayısının histogramını çizdim.
4 ligdeki gol sayısının histogramı
Herhangi bir ligin uygunluk eğrisine bakarsanız, Poisson dağılımı gibi görünür.
Artık bir maçta atılabilecek gol sayısının olasılığını hesaplamak için Poisson dağılımını kullanmanın mümkün olduğunu söyleyebiliriz.
İşte Poisson dağılımının formülü.
Düşündüğüm tahminleri yapmak için:
lambda : 90 dakikadaki gollerin medyanı (A Takımı ve B Takımı)
x : A Takımı ve B Takımı tarafından bir maçta atılabilecek gol sayısı
Lambda'yı hesaplamak için, her bir milli takımın attığı/yediği ortalama gollere ihtiyacımız var. Bu bizi bir sonraki noktaya götürür.
Her milli takımın attığı/yediği goller
1930'dan 2018'e kadar oynanan tüm Dünya Kupası maçlarından veri topladıktan sonra , her bir milli takımın attığı ve yediği ortalama golü hesaplayabilirim.Avrupa'nın en iyi 4 ligi için yaptığım tahminde iç saha/deplasman faktörünü dikkate aldım ancak Dünya Kupası'nda hemen hemen tüm takımlar tarafsız bir stadyumda oynadığı için bu analizde bu faktörü dikkate almadım.
Her milli takımın attığı/yediği golleri aldığımda, her takımın grup aşamasında alacağı puan sayısını tahmin eden bir fonksiyon oluşturdum.
Grup aşamasını tahmin etme
Aşağıda, her bir milli takımın grup aşamasında alacağı puanları tahmin etmek için kullandığım kod var. Göz korkutucu görünüyor, ancak yalnızca bu noktaya kadar bahsettiğim birçok şeyi koda çevirdi.Golleri tahmin etmek
Goller için puanları değil, her grubun galibini tahmin etmem gerekiyor.Basitçe söylemek gerekirse , kazanandan büyükse ev sahibi takım, aksi takdirde kazanan deplasman takımıdır.
Çeyrek final, yarı final ve final tahminleri
Tekrar kullanırsam get_winner, Dünya Kupası'nın galibini tahmin edebilirim. İşte nihai sonuç!!Fonksiyonu bir kez daha çalıştırarak, kazananın...