Petualangan ASCII yang berusia puluhan tahun, Nethack, mungkin mengisyaratkan masa depan AI – TechCrunch


Model pembelajaran mesin sudah menguasai Catur, Pergilah, Permainan Atari, dan banyak lagi, tetapi untuk naik ke tingkat berikutnya, para peneliti di Facebook bermaksud agar AI AI mengambil jenis permainan yang berbeda: Nethack yang terkenal sulit dan sangat kompleks.

“Kami ingin membangun apa yang kami pikirkan ‘tantangan besar’ yang paling mudah diakses dengan permainan ini. Tidak akan memecahkan AI, tapi itu akan membuka jalan menuju lebih baik AI,” kata Edward Grefenstette dari Facebook AI Research. “Game adalah domain yang bagus untuk menemukan asumsi kami tentang apa yang membuat mesin cerdas dan menghancurkannya.”

Anda mungkin tidak akrab dengan Nethack, tetapi ini adalah salah satu game paling berpengaruh sepanjang masa. Anda seorang petualang di dunia fantasi, menggali kedalaman yang semakin berbahaya dari penjara bawah tanah yang berbeda setiap saat. Anda harus melawan monster, menavigasi jebakan dan bahaya lainnya, dan sementara itu tetap berhubungan baik dengan dewa Anda. Ini adalah “roguelike” pertama (setelah Rogue, pendahulunya yang langsung dan jauh lebih sederhana) dan bisa dibilang masih yang terbaik — hampir pasti yang paling sulit.

(Omong-omong, gratis, dan Anda bisa unduh dan mainkan di hampir semua platform.)

Grafik ASCII-nya yang sederhana, menggunakan ag untuk goblin, @ untuk pemain, garis dan titik untuk arsitektur level, dan seterusnya, memungkiri kompleksitasnya yang luar biasa. Karena Nethack, yang memulai debutnya pada tahun 1987, telah dalam pengembangan aktif sejak itu, dengan tim pengembangnya yang berpindah-pindah memperluas daftar objek dan makhluk, aturan, dan interaksi yang tak terhitung jumlahnya di antara mereka semua.

Dan ini adalah bagian dari apa yang membuat Nethack menjadi tantangan yang sulit dan menarik bagi AI: Ini sangat terbuka. Tidak hanya dunia yang berbeda setiap saat, tetapi setiap objek dan makhluk dapat berinteraksi dengan cara baru, kebanyakan dari mereka dikodekan dengan tangan selama beberapa dekade untuk mencakup setiap pilihan pemain yang mungkin.

Nethack dengan pembaruan grafis berbasis ubin – semua informasi masih tersedia melalui teks.

“Atari, Dota 2, StarCraft 2… solusi yang kami miliki untuk membuat kemajuan di sana sangat menarik. Nethack hanya menghadirkan tantangan yang berbeda. Anda harus mengandalkan pengetahuan manusia untuk memainkan game sebagai manusia,” kata Grefenstette.

Dalam permainan lain ini, ada strategi yang kurang lebih jelas untuk menang. Tentu saja ini lebih kompleks dalam game seperti Dota 2 daripada di game Atari 800, tetapi idenya sama — ada bagian yang dikontrol pemain, lingkungan papan permainan, dan kondisi kemenangan yang harus dikejar. Itu semacam kasus di Nethack, tapi lebih aneh dari itu. Untuk satu hal, gim ini berbeda setiap saat, dan tidak hanya dalam detailnya.

“Dungeon baru, dunia baru, monster dan item baru, kamu tidak memiliki save point. Jika Anda membuat kesalahan dan mati, Anda tidak akan mendapatkan kesempatan kedua. Ini seperti kehidupan nyata,” kata Grefenstette. “Anda harus belajar dari kesalahan dan datang ke situasi baru yang dipersenjatai dengan pengetahuan itu.”

Minum ramuan korosif adalah ide yang buruk, tentu saja, tapi bagaimana dengan melemparkannya ke monster? Melapisi senjatamu dengan itu? Menuangkannya di kunci peti harta karun? Mencairkannya dengan air? Kami memiliki ide intuitif tentang tindakan ini, tetapi AI yang bermain game tidak berpikir seperti kami.

Kedalaman dan kompleksitas sistem di Nethack sulit dijelaskan, tetapi keragaman dan kesulitan itu membuat game ini menjadi kandidat yang sempurna untuk sebuah kompetisi, menurut Grefenstette. “Anda harus mengandalkan pengetahuan manusia untuk memainkan game ini,” katanya.

Orang-orang telah merancang bot untuk bermain Nethack selama bertahun-tahun yang tidak bergantung pada jaringan saraf tetapi pohon keputusan serumit permainan itu sendiri. Tim di Facebook Research berharap dapat menghasilkan pendekatan baru dengan membangun lingkungan pelatihan yang dapat digunakan orang untuk menguji algoritme permainan berbasis pembelajaran mesin.

Layar Nethack dengan label yang menunjukkan apa yang diketahui AI.

Itu Lingkungan Belajar Nethack sebenarnya dibuat tahun lalu, tetapi Tantangan Nethack baru saja dimulai. NLE pada dasarnya adalah versi gim yang tertanam dalam lingkungan komputasi khusus yang memungkinkan AI berinteraksi dengannya melalui perintah teks (arah, tindakan seperti serangan atau quaff)

Ini adalah target yang menggoda bagi desainer AI yang ambisius. Sementara game seperti StarCraft 2 dapat menikmati profil yang lebih tinggi dalam beberapa hal, Nethack melegenda dan ide untuk membangun model di jalur yang sama sekali berbeda dari yang digunakan untuk mendominasi game lain merupakan tantangan yang menarik.

Ini juga, seperti yang dijelaskan Grefenstette, yang lebih mudah diakses daripada banyak di masa lalu. Jika Anda ingin membangun AI untuk StarCraft 2, Anda membutuhkan banyak daya komputasi yang tersedia untuk menjalankan mesin pengenalan visual pada citra dari game. Namun dalam kasus ini seluruh permainan ditransmisikan melalui teks, sehingga sangat efisien untuk digunakan. Ini dapat dimainkan ribuan kali lebih cepat daripada yang bisa dilakukan manusia bahkan dengan pengaturan komputasi paling dasar. Itu membuat tantangan terbuka lebar bagi individu dan kelompok yang tidak memiliki akses ke jenis pengaturan berdaya tinggi yang diperlukan untuk mendukung metode pembelajaran mesin lainnya.

“Kami ingin menciptakan lingkungan penelitian yang memiliki banyak tantangan bagi komunitas AI, tetapi tidak membatasinya hanya pada laboratorium akademik besar,” katanya.

Selama beberapa bulan ke depan, NLE akan tersedia untuk diuji oleh orang-orang, dan pesaing pada dasarnya dapat membangun bot atau AI mereka dengan cara apa pun yang mereka pilih. Tetapi ketika kompetisi itu sendiri dimulai dengan sungguh-sungguh pada 15 Oktober, mereka akan dibatasi untuk berinteraksi dengan game di lingkungan yang terkontrol melalui perintah standar — tidak ada akses khusus, tidak ada pemeriksaan RAM, dll.

Tujuan kompetisi adalah untuk menyelesaikan permainan, dan tim Facebook akan melacak berapa kali agen “naik”, seperti yang disebut di Nethack, dalam waktu yang ditentukan. Tapi “kami berasumsi ini akan menjadi nol untuk semua orang,” aku Grefenstette. Lagi pula, ini adalah salah satu game tersulit yang pernah dibuat, dan bahkan manusia yang telah memainkannya selama bertahun-tahun kesulitan menang bahkan sekali seumur hidup, apalagi beberapa kali berturut-turut. Akan ada metrik penilaian lain untuk menilai pemenang di sejumlah kategori.

Harapannya adalah tantangan ini memberikan benih pendekatan baru untuk AI, yang lebih menyerupai pemikiran manusia yang sebenarnya. Pintasan, coba-coba, peretasan skor, dan zerging tidak akan berfungsi di sini — agen perlu mempelajari sistem logika dan menerapkannya secara fleksibel dan cerdas, atau mati dengan mengerikan di tangan centaur atau beruang hantu yang marah.

Anda dapat memeriksa aturan dan lainnya spesifikasi Tantangan Nethack di sini. Hasilnya akan diumumkan pada konferensi NeuroIPS akhir tahun ini.



Sumber

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Stay Connected

21,989FansLike
0FollowersFollow
0SubscribersSubscribe
- Advertisement -

Latest Articles