BAGIKAN
(FIFA)

Sebagai acara terbesar dalam kalender sepakbola, para penggemar berspekulasi tentang tim mana yang mungkin menjadi pemenang dari Piala Dunia 2018 yang sekarang berlagsung di Rusia – begitupun dengan model kecerdasan-buatan yang berdasarkan 100.000 simulasi, telah membuat prediksinya juga.

Dengan menggunakan database statistik dari sekian turnamen sebelumnya, dan tiga metode AI yang berbeda untuk mengacak angka-angka, tim peneliti internasional di belakang pekerjaan berpikir Spanyol akan muncul sebagai pemenang … tetapi itu belum terlalu pasti.

Pada saat para petaruh mendukung Jerman untuk menjadi pemenang Piala Dunia, AI melakukan analisisnya, baik kekuatan tim maupun perjalanan mereka hingga maju ke babak final. Sementara Jerman akan mengalahkan Spanyol dalam pertandingan satu kali, model komputer menunjukkan jika tim Jerman kemungkinan akan menghadapi lawan yang lebih sulit melalui jalannya kompetisi.

“Dengan menganalisis probabilitas kemenangan yang bergantung pada pencapaian pada sudden death, ternyata faktanya bahwa tim Spanyol secara keseluruhan sedikit lebih disukai daripada Jerman terutama karena fakta bahwa Jerman memiliki peluang yang relatif tinggi untuk keluar di putaran 16, ” tulis para peneliti .

Tim peneliti terdiri dari akademisi dari Technische Universitat Dortmund, Universitas Teknik Munich di Jerman, dan Universitas Ghent di Belgia.

Mereka menggunakan tiga teknik untuk memproses statistiknya: regresi Poisson(menafsirkan dan menimbang banyak variabel yang berbeda), metode peringkat (mengevaluasi kekuatan saat ini masing-masing tim), dan pendekatan random forest (suatu algoritma yang digunakan pada klasifikasi data dalam jumlah yang besar).

Untuk Piala Dunia, metode random forest sangat cocok karena dapat terstruktur seperti turnamen sepak bola, tetapi bumbu rahasianya adalah bagaimana cara menggunakan pembelajaran mesin untuk memetakan cabang acak sehingga menghasilkan pohon keputusan – skenario dan konsekuensinya yang berbeda – berkali lipat.

Dengan memperoleh AI untuk menempatkan penekanan pada berbagai faktor ketika membuat pohon keputusan, mengulangi simulasi dan kemudian membandingkan setiap faktor, metode random forest dapat memberi para ahli statistik pandangan yang lebih baik tentang faktor mana yang paling penting dalam hasil akhir – seperti lawan Jerman dan Spanyol yang kemungkinan akan dihadapi.

Dibandingkan dengan model matematika lainnya, ia juga memberikan informasi yang lebih akurat di kemudian hari dalam pohon keputusan, di mana data pelatihannya mungkin langka.

Para peneliti memasangkan seluruh sumber data untuk menginformasikan model mereka. Dengan melihat kembali turnamen sebelumnya, mereka menemukan beberapa faktor penting (seperti jumlah pemain Liga Champions di tim) dan beberapa data lainnya yang kurang begitu penting (seperti kewarganegaraan pelatih tim).

Dengan statistik yang menunjukkan kombinasi metode peringkat dan pohon random forest adalah prediktor yang paling akurat, 100.000 simulasi Piala Dunia 2018 dijalankan berdasarkan model-model ini.

Spanyol muncul di puncak, dengan peluang 17,8 persen untuk menang. Jerman berada di urutan kedua dengan 17,1 persen, Brasil di urutan ketiga dengan 12,3 persen, Prancis keempat dengan 11,2 persen, dan Belgia kelima dengan 10,4 persen.

Arab Saudi, sementara itu, memiliki peluang nol persen untuk mencapai final.(Permintaan maaf kepada siapa pun yang mendukung mereka dan sudah terjadi)

Tetap waspada pada grafik dinding turnamen Anda – jika Jerman berhasil lolos ke perempat final, delapan tim terakhir, tim memiliki kesempatan yang sama dengan Spanyol.

Probabilitas tim maju dan menang. (arXiv.org)

Namun, tidak semua orang setuju dengan penilaian itu. Perusahaan keuangan Goldman Sachs telah melatih mesin pembelajaran mesinnya sendiri di Piala Dunia di Rusia dan menganggap Brasil akan menang . Perhitungan Goldman Sachs juga melibatkan elemen pemodelan random forest.

Tentu saja sepak bola, dan olahraga pada umumnya, memiliki sejarah panjang yang membuat marah para bandar dan model AI. Sangat sulit untuk mempertimbangkan segala sesuatu yang mungkin mempengaruhi kinerja tim – dan algoritma pembelajaran mesin apa yang dapat memprediksi tujuan spektakuler yang diciptakan dari ketiadaan?

Namun, menarik untuk memperhatikan metode statistik yang terlibat dalam memprediksi apa yang akan terjadi di Rusia. Pada malam tanggal 15 Juli, kita akan tahu apakah seratus ribu simulasi AI itu benar.

Studi ini belum ditinjau oleh rekan kerja, tetapi tersedia di server pra-cetak arXiv.org .