• Sunday May 19,2019

AI yang Menguasai Manusia dalam Perjalanan Adakah sudah Usang

Anonim

Ingat AlphaGo? Anda tahu, kecerdasan buatan bahawa pada tahun 2016 dengan jelas mengalahkan pemain terbaik manusia dapat mengumpulkan dalam permainan strategi purba Cina Pergi; dengan itu memaksa kita untuk melepaskan ketinggalan terakhir permainan daging unggul dan darah yang dipegang di atas mesin?

Ingat itu?

Nah, inilah sesuatu untuk mengunyah: Lengan penyelidikan AI Google, DeepMind, pencipta semoga bermanfaat yang mencipta AlphaGo, telah memberikan versi gluteus maximus-pukulan usang. Dalam satu kajian yang diterbitkan pada Rabu dalam jurnal Nature, para penyelidik menggambarkan AI yang lebih mantap, lebih lega, autodidact yang mengalahkan permainan AlphaGo 100 kepada sifar. Zilch. Nada. Tiada apa-apa.

Sesuai dengan ini, ajaib AI baru ini dinamakan AlphaGo Zero, dan rahsia keunggulannya sangat menarik.

Lihat Ma, Tiada Manusia

Mungkin kita sepatutnya melihat ini datang. Lagipun, kehebatan AlphaGo bergantung kepada kepakaran manusia di tempat pertama. Rangkaian neural buatannya dilatih di perpustakaan besar permainan yang dimainkan oleh tuan manusia. AlphaGo menganalisis permainan-permainan itu, bergerak demi langkah, dan kemudian bermain sendiri dalam simulasi berulang-ulang, pengoptimuman hyper bergerak setiap giliran berdasarkan kedai pengetahuan manusia tentang permainan. AlphaGo mengambil apa yang dipelajari dari manusia dan melakukannya dengan lebih baik.

AlphaGo Zero berbeza. Penyelidik tidak memberi makan kepada rangkaian saraf mana-mana data dari permainan masa lalu yang dimainkan oleh manusia. AI bermula dari awal dengan slate kosong sepenuhnya, imajinasinya terhad hanya kepada peraturan permainan. AlphaGo Zero memulakan latihannya dengan membuat gerakan secara rawak dalam permainan simulasi menentang dirinya sendiri, belajar lebih sedikit dari setiap hasil, dan memperbaiki rangkaian saraf setiap kali.

Ia dilakukan seperti ini selama tiga hari, di mana 4.9 juta permainan dihasilkan, dan 1, 600 simulasi dihasilkan untuk setiap permainan tersebut. Hanya dalam masa 36 jam, AlphaGo Zero sudah bersedia untuk mengetuk pendahulunya dari puncak gunung. Sebagai perbandingan, versi AlphaGo yang mengalahkan Lee Sedol, pemain manusia terbaik di dunia, memerlukan beberapa bulan latihan dan bergantung pada perkakasan yang jauh untuk mendapatkan pekerjaan itu.

DeepMind, selepas mengalahkan Sedol, terus memperbaiki AlphaGo dalam beberapa lelaran. Pada awal tahun ini, AlphaGo Master mengalahkan 60 pemain Go dalam talian di dunia. AlphaGo Zero melepasi AlphaGo Master selepas 21 hari latihan. Selepas 40 hari, AlphaGo Zero boleh dikatakan perkara terbaik untuk pernah bermain Go.

Hakikat bahawa AlphaGo yang mengetuai manusia yang mengalahkan Sedol tidak dapat mengalahkan satu kemenangan terhadap diri sendiri yang diajar AlphaGo Zero mempunyai para penyelidik yang tiba-tiba menyimpulkan, dan mungkin kesimpulan yang berseri-seri. Dalam kajian mereka, mereka menulis:

"Ini menunjukkan bahawa AlphaGo Zero mungkin mempelajari strategi yang berbeza secara kualitatif terhadap permainan manusia.

AlphaGo Zero menemui tahap pengetahuan Go yang luar biasa semasa proses latihan diri. Ini termasuk bukan sahaja elemen asas pengetahuan Go manusia, tetapi juga strategi yang tidak standard melangkaui skop pengetahuan Go tradisional. "

Lebih dari ribuan tahun, beratus-ratus generasi, permainan dan buku yang tidak terhingga yang diterbitkan mengenai permainan tersebut, kemanusiaan mengumpulkan pengetahuan tentang Go. Dan tuan-tuan mencapai tahap mereka hanya dengan berdiri di atas bahu begitu banyak yang datang di hadapan mereka. Permainan ini mempunyai sejarah yang kaya, dan ada sebab ia masih menangkap imaginasi orang hari ini.

AlphaGo Zero, melalui pembelajaran secara rawak dan pembelajaran tetulang, bukan sahaja menguasai permainan Go, tetapi juga mencipta semula. Semua dalam masa kurang dari dua bulan.

Jangan Tunda Lutut Namun

Untuk seorang penyelidik kecerdasan buatan, membina AI dengan pengetahuan umum akan serupa dengan pendaratan di Marikh-tidak ada had apa yang boleh dilakukan oleh AI. Manusia mempunyai pengetahuan umum. Kami menggunakan perkakasan dan perisian biologi yang sama untuk memandu kereta, menyelesaikan masalah matematik, menulis puisi, menangkap baseball dan memainkan permainan Go. Kita juga boleh menyelesaikan masalah di mana penyelesaian itu tidak masuk akal, tidak ada "pemenang" dan peraturan untuk membimbing kita tidak wujud. Bagaimanakah seseorang menang dalam puisi?

AlphaGo Zero adalah satu lagi langkah ke arah pengetahuan umum. Ia membentuk strategi sendiri dan mengoptimumkan hasil tanpa mengkaji contoh sebelumnya. Pasti, tingkah laku yang muncul di sini adalah novel, dan mungkin belum pernah terjadi sebelumnya. Tetapi permainan Go mewakili masalah terkurung dengan peraturan dan definisi yang jelas apabila permainan tamat-walaupun terdapat jumlah minda yang berubah-ubah variasi permainan. Algoritma seperti AlphaGo Zero mempunyai potensi untuk mengajar dirinya sendiri dan melaksanakan pada tahap superhuman dalam tugas berasaskan peraturan di mana hasilnya diketahui: melabur, tuntutan insurans, diagnosis perubatan.

Tetapi bolehkah ia bermain, menulis novel, memandu kereta dan memilih tomato terbaik dari bahagian menghasilkan? Belum lagi, tetapi ia semakin dekat.


Artikel Yang Menarik

Kenapa Matahari berpusing seperti pinwheel?

Kenapa Matahari berpusing seperti pinwheel?

Mula-mula Matahari mengembangkan lubang besar, dan sekarang ia membalikkan hujungnya. Tetapi sekali lagi, jangan bimbang - semuanya baik. Beberapa hari lalu, saya menyiarkan video yang menunjukkan lubang raksasa di atmosfera Matahari. Sekarang, NASA telah menerbitkan sebuah animasi yang memperlihatkan akhir putaran Matahari seperti pinwheel

Spore: Apabila Permainan dan Sains Berjuang

Spore: Apabila Permainan dan Sains Berjuang

Lihatlah Guilfordus horribilus, dan rindu semua kamu yang menyeberang jalannya. Pada satu ketika di masa lalu, saya menyedari permainan yang sangat sejuk dalam kerja-kerja. Ia dipanggil Spore, dan ia adalah penciptaan Will Wright, yang pertama kali datang ke perhatian saya lama dahulu dengan SimCity, permainan ketagihan yang membolehkan anda membina dan menjalankan sebuah bandar mainan

Backlash Over Biofuels Builds in Europe

Backlash Over Biofuels Builds in Europe

Panel Kesatuan Eropah telah mencetuskan pusingan baru sturm und drang kerana ia membahaskan peranan yang harus dimainkan oleh biofuel dalam pencarian benua untuk tenaga bersih. Menambah kepada dialog tinggi oktana, satu laporan yang bocor ke akhbar British menimbulkan kemungkinan bahawa permintaan bagi biofuel menanggung beban tanggungjawab terhadap kenaikan harga makanan di seluruh dunia

JUGA: Bahagian XII

JUGA: Bahagian XII

Saya tidak mempunyai banyak keperluan untuk lubang api. Maksud saya, pasti akan menyenangkan pada malam-malam Boulder yang sejuk ketika kita ingin duduk di luar, dan lubang-lubang api adalah alat yang agak romantis dan selesa. Tetapi yang satu ini? Ayuh. Ya, saya mahu! Lagipun, saya datang dengan idea umum ini tahun lalu

Jenis Baru Ubat Menunjukkan Janji dalam Mengatasi Obesiti

Jenis Baru Ubat Menunjukkan Janji dalam Mengatasi Obesiti

Thunder God Vine adalah tumbuhan yang sangat mematikan: bunga, daun, dan akarnya sangat toksik. Tetapi penyelidikan baru menunjukkan bahawa sebatian yang terdapat di akarnya boleh menjadi pendekatan baru untuk merawat obesiti. Kompaun yang dipanggil Celastrol, yang ditemui di akar Thunder God Vine, boleh meningkatkan kepekaan badan terhadap hormon yang membantu memerangi obesiti, menurut penyelidikan baru

Otak Dalam Dish Perlu Tidur Terlalu?

Otak Dalam Dish Perlu Tidur Terlalu?

Semua haiwan tidur, tetapi walaupun dalam beberapa dekad penyelidikan, ahli sains saraf masih tidak mempunyai jawapan yang jelas mengapa. Sekarang kajian baru dramatik mendedahkan bahawa tidur mungkin merupakan keadaan asas bahawa walaupun sel-sel otak berkembang dalam keperluan hidangan. Ahli neurologi Switzerland Valerie Hinard dan rakan-rakannya melayan neuron kortikal tetikus dalam hidangan yang dilengkapi dengan susunan elektrod