Yüksek Lisans Adayı: Toyan Ünal
EABD: Bilişim Sistemleri
Tarih: 07.12.2023
Yer: A-212
Özet: Makine öğrenimi yöntemleri, tenis maçı sonuçlarının tahmin edilmesinde etkilidir ancak veri kümeleri, modeller, özellik kümeleri veya hiper parametrelerin seçimi, bu yöntemlerin ampirik doğaları nedeniyle sonuçları önemli ölçüde etkilemektedir. Bu tez çalışmasında, bu belirsizliği gidermek için deneysel SRP-CRISP-DM çerçevesi kullanılmıştır. Bu yaklaşım, sonuçların çeşitli veri kümeleri ve spor türleri genelinde hem tekrarlanabilir hem de yeniden üretilebilir olmasını sağlar. Çalışmamız, 2009 ile 2022 yılları arasındaki 14 yıllık tek erkekler tenis maçı verilerini kapsamaktadır, 2021 ve 2022 yıllarına ait veriler test seti olarak ayrılmıştır. Üç makine öğrenimi modeli ve iki özellik seçme yönteminin yanı sıra altı gelişmiş özellik çıkarım tekniği uygulanmıştır. Hiper parametre kestirimiyle birlikte 10 katlı zamana dayalı çapraz doğrulama yaklaşımı benimsenmiştir. Aşırı Gradyan Artırma modeli, eğitim ve ayarlamalardan sonra en etkili model olarak ortaya çıkmış olup test setinde 0.1913 ile en düşük Brier skoruna ve %70,5 doğruluğa ulaşmıştır. Bahis şirketlerinin bahis oranlarının ima ettiği ortalama kazanma oranları en yüksek tahmin gücüne sahip özellik olup maç sonuçlarının tahmin edilmesinde önemli rol oynamıştır.