"Hayalgücü olmayan insanın kanatları olmaz."
Muhammed Ali

Yazarlar

Bülent Kalafat
Bülent Kalafat
@b_kalafat

Türkiye için xG Vakti

06/09/2018

Bu hafta içinde, Opta Türkiye şefi Barış Gerçeker, Süper Lig'deki maçların takım bazlı Expected Goals değerlerinin Maçkolik'te yayınlanacağını müjdeledi Twitter'da.  xG'nin Türk futbol jargonuna girme vakti çoktan gelmişti. Bu nedenle gecikmeli de olsa bu duyuru beni çok sevindirdi. xG diye kısaltılan Expected Goals, adını olasılık bilimindeki "Beklenen Değer" kavramından alıyor. Yazılarımda daha önce değindiğim xG ile 2011-12 sezonunda futbol istatistiğine kendimi kaptırınca tanışmıştım. O zamandan beri xG kavramına dair pek çok yazı ve görüş okudum. Bu edinimlerimden bazılarını sizle paylaşmak isterim.

Öncelikle xG şutlar kaydedilirken oluşan mutlak bir veri değil. Kaleye mesafe, öndeki savunmacı sayısı, şuttan önceki pas türü gibi şut tanımlayan bir takım verilerin, bir algoritma tarafından harmanlanmasıyla ortaya çıkan bir değer. Her şutun xG'si aslında size şunu söylüyor: "Bizim veritabanımızda olan X milyon şutu değerlendirince, bu şutun gol olma ihtimali buydu." Bu nedenle xG'yi aslında bir yorum olarak idrak etmeliyiz. Zira Opta ya da başka bir kaynaktan ham veri alan herhangi biri kendi xG modelini yaratabilir. Burada önemli olan xG modelinin arkasındaki varsayımların açıklanması ve mümkün olduğunca şeffaf bir şekilde paylaşılmasıdır. Örneğin Opta Ocak 2017'de kendi xG modelini ve hesaplamaya giren parametreleri açıklamıştı. Dikkat ederseniz bu listede kalecinin kaleye mesafesi bulunmuyor. Barış Gerçeker de bu yaz kendi modellerinde kalecinin kaleye mesafesinin bir parametre olmadığını belirtmişti zaten. Aşağıdaki grafiğin sahibi Micahel Caley'in kullandığı modeli açıkladığı yazısını buradan okuyabilirsiniz. Bunlar gibi detaylar xG'yi oluşturan verilerin harmanlanmasındaki nüanslar; dolayısıyla xG, maçtaki şut sayısı gibi farklı kaynaklarca aynı değerin atandığı bir veri değil.

Pek çok parametre için geçerli olduğu gibi, uzun zaman ve big data xG'nin de açıklama ve tahmin etme gücünü kuvvetlendiriyor. Daha basit tabirle, iki takımın müsabakasındaki toplam xG değerleri o maçı anlatmaya biraz faydalı olsa da takımlar hakkında bize bir fikir vermez. Kaldı ki bir maçta xG'si rakibinden düşük olan takım maçı kazanabilir. Çünkü olasılıklar dahilinde bir takım her yerden vurup 20 kötü şutla 1.5 civarı xG yakalar; diğeri toplam xG değeri 0.7 civarı olan 4-5 şuttan bir gol bulur. Sezon boyu ya da birkaç sezonun xG trendleri ise takımların girdiği ve maruz kaldığı pozisyonların değeri hakkında çok daha net fikirler verir. Bu özellikle dikkat edilmesi gereken ve xG ile haşır neşir olan veri bilimcisi kitlenin sık sık dile getirdiği bir konu. xG üzerinden çıkarımlara varırken dikkat edilmesi gereken noktaları sebepleriyle açıklayan bu yazıya bir göz atmanızı öneririm. Yukarıdaki gibi tek maçlık xG haritaları, takımların maç performanslarını açıklamaktan ziyade "%100'lük goller kaçtı" gibi iddiaların gerçekçiliğini tartan bir referans noktası olarak değerlendirilmeli. Eğer şut başına xG değeri paylaşılırsa, tek maçlık xG karşılaştırmaları biraz daha anlamlı hale gelebilir. Takımın ortalama şut / gol ihtmali yukarıda bahsettiğime benzer bir maçın açıklanmasında fayda sağlar; zira bir takımın diğerine göre gol ihtimali daha yüksek, dolayısıyla daha "kalitetli" pozisyonlara girdiği tespit edilir. 


Expected Goals kavramının İngiltere'de ana akım medya tarafından benimsenmesi epey uzun sürdü. Çünkü otorite kabul edilen eski futbolcuların çoğu ve bazı teknik direktörler xG'nin çok saçma bir veri olduğu konusunda kuvvetli beyanlarda bulunuyordu. Eski futbolcu Steve Nicol ve gazeteci Jeff Stelling'in xG'yi neredeyse aşağılayıcı ifadelerle yorumladığı programların videoları çok popülerdi bir ara. Buna rağmen Sky gibi kanallar geçtiğimiz sezondan beri devre arası ve maç sonu ekranlarında xG'ye yer veriyor. Ülkemizde ne zaman ve nasıl olacağını kestiremediğim bu ana akım kabullenişinin en önemli öncüsü bana kalırsa xG'nin uzun vadeli faydalarının artık inkar edilemeyecek düzeye gelmiş olmasıydı. Futbolcu keşfi ve performans analizi gibi konularda xG, alışılagelmiş verilere kıyasla daha güvenilir olduğu için, hızla kulüpler ve onlara hizmet sunan şirketlerce benimsendi. xG'nin benimsenmesi sayesinde Ted Knutson'un önderliğini ettiği Statsbomb'un yayınladığı "Pressure" ve "Passes Allowed Per Defensive Action" gibi, gene pek çok verinin harmanlanmasıyla oluşan kavramlara merak duyan kitle hızla büyüdü. Bu konulara ilgili her Twitter kullanıcısı, Avrupa'nın önde gelen liglerine dair yayınlanan veri bazlı materyalin giderek bollaştığına katılacaktır diye tahmin ediyorum.

Bunların hepsi futbolda veri analizi diyebileceğimiz bir zincirin yeni yeni halkaları. Şimdilik sadece Maçkolik'te yayınlanacak olsa bile, xG'nin herkesçe ulaşılabilir bir veri olması paragrafta bahsettiklerimin ülkemize sirayet etmesine olanak sağladığı için çok ama çok önemli. Umarım hızla kabul edilir ve diğer gelişmiş metriklerin de benimsenmesine öncülük eder.



GÜNCEL YAZILAR