BAGIKAN

Catur bukanlah permainan yang mudah, menurut standar manusia. Tapi untuk kecerdasan buatan yang didukung oleh pola pikir yang luar biasa dan hampir asing, permainan catur bisa dikuasai dalam beberapa jam saja.

Dalam sebuah makalah baru, periset Google merinci bagaimana evolusi AI terbaru mereka, AlphaZero, mengembangkan “kinerja super” di catur, hanya membutuhkan waktu empat jam untuk mempelajari peraturan sebelum mengalahkan program catur juara dunia, Stockfish.

Dengan kata lain, semua pengetahuan catur manusia – dan sekitarnya – diserap dan dilampaui oleh AI dalam waktu yang dibutuhkan hanya sebentar saja.

Setelah diprogram dengan hanya aturan catur (tidak ada strategi), hanya dalam waktu empat jam AlphaZero telah menguasai permainan sejauh ia bisa menjadi yang terbaik dengan program permainan catur rate tertinggi : Stockfish .

Dalam serangkaian 100 pertandingan melawan Stockfish, AlphaZero memenangkan 25 pertandingan saat bermain putih (dengan keunggulan penggerak pertama), dan memungut tiga game yang dimainkan sebagai warna hitam. Sisa dari kontes menarik, dengan rekaman Stockfish tidak ada kemenangan dan AlphaZero tidak ada kerugian.

“Kami sekarang tahu siapa tuan baru kami,” kata peneliti catur David Kramaley, CEO situs catur ilmiah Chessable.

“Ini pasti akan merevolusi permainan, tapi pikirkan bagaimana ini bisa diterapkan di luar catur. Algoritma ini bisa menjalankan kota, benua, alam semesta.”

Dikembangkan oleh lab DeepMind AI milik Google, AlphaZero adalah versi populer dari AlphaGo Zero , yang mengkhususkan diri dalam bermain game papan cina, Go.

DeepMind telah menyempurnakan AI ini selama bertahun-tahun , dalam prosesnya menandingi serangkaian juara manusia yang jatuh seperti domino sebelum jaringan syaraf tiruan “Godlike” .

Kemenangan itu memuncak dalam kesuksesan yang mengejutkan di bulan Oktober, di mana versi AI otonom baru – yang hanya belajar dengan bermain sendiri, tidak pernah menghadapi manusia – mengalahkan semua inkarnasi sebelumnya.

Sebaliknya, pendahulunya AlphaGo Zero sebagian belajar bermain game dengan melihat gerakan yang dilakukan oleh pemain manusia.

Upaya itu dimaksudkan untuk membantu AI yang masih muda dalam strategi pembelajaran, namun tampaknya hal itu sebenarnya merupakan hambatan, karena pembelajaran mandiri AlphaGo Zero terbukti sangat efektif dalam kompetisi satu lawan satu.

“Ini seperti peradaban alien yang menciptakan matematika sendiri,” ilmuwan komputer Nick Hynes dari MIT mengatakan kepada Gizmodo pada bulan Oktober.

“Apa yang kita lihat di sini adalah model yang bebas dari bias dan prasangka manusia. Ia dapat mempelajari apa pun yang menentukannya secara optimal, yang mungkin memang lebih bernuansa bahwa konsepsi kita tentang hal yang sama.”

Tapi hal-hal yang bergerak begitu cepat di bidang ini yang sudah menjadi prestasi bulan Oktober mungkin sudah ketinggalan zaman.

Dalam makalah mereka yang baru , tim tersebut menguraikan bagaimana AI AlphaZero yang paling mutakhir mengambil ketergantungan diri – yang disebut pembelajaran penguatan – dan menerapkannya dengan rangkaian yang jauh lebih umum sehingga memberikan fokus yang lebih luas kepada pemecahan masalah.

Fokus yang lebih luas berarti AlphaZero tidak hanya bermain catur. Ini juga memainkan Shogi (alias catur Jepang) dan Go juga – dan, mungkin tidak mengejutkan, hanya butuh waktu dua dan delapan jam untuk menguasai game tersebut juga.

Untuk saat ini, ilmuwan komputer Google dan DeepMind tidak berkomentar secara terbuka mengenai penelitian baru, yang belum diulas secara penelaahan sejawat .

Tapi dari apa yang bisa kita ceritakan sejauh ini, pendakian algoritma yang memusingkan ini sampai ke puncak kecerdasan buatan jauh dari selesai, dan bahkan catur grandmaster pun bingung dengan tontonan di depan mereka.

“Saya selalu bertanya-tanya bagaimana jika spesies unggul mendarat di Bumi dan menunjukkan kepada kita bagaimana mereka bermain catur,” kata grandmaster Peter Heine Nielsen kepada BBC .

“Sekarang saya tahu.”

Temuan ini tersedia di website preprint arXiv .