• Friday July 19,2019

AI yang Menguasai Manusia dalam Perjalanan Adakah sudah Usang

Anonim

Ingat AlphaGo? Anda tahu, kecerdasan buatan bahawa pada tahun 2016 dengan jelas mengalahkan pemain terbaik manusia dapat mengumpulkan dalam permainan strategi purba Cina Pergi; dengan itu memaksa kita untuk melepaskan ketinggalan terakhir permainan daging unggul dan darah yang dipegang di atas mesin?

Ingat itu?

Nah, inilah sesuatu untuk mengunyah: Lengan penyelidikan AI Google, DeepMind, pencipta semoga bermanfaat yang mencipta AlphaGo, telah memberikan versi gluteus maximus-pukulan usang. Dalam satu kajian yang diterbitkan pada Rabu dalam jurnal Nature, para penyelidik menggambarkan AI yang lebih mantap, lebih lega, autodidact yang mengalahkan permainan AlphaGo 100 kepada sifar. Zilch. Nada. Tiada apa-apa.

Sesuai dengan ini, ajaib AI baru ini dinamakan AlphaGo Zero, dan rahsia keunggulannya sangat menarik.

Lihat Ma, Tiada Manusia

Mungkin kita sepatutnya melihat ini datang. Lagipun, kehebatan AlphaGo bergantung kepada kepakaran manusia di tempat pertama. Rangkaian neural buatannya dilatih di perpustakaan besar permainan yang dimainkan oleh tuan manusia. AlphaGo menganalisis permainan-permainan itu, bergerak demi langkah, dan kemudian bermain sendiri dalam simulasi berulang-ulang, pengoptimuman hyper bergerak setiap giliran berdasarkan kedai pengetahuan manusia tentang permainan. AlphaGo mengambil apa yang dipelajari dari manusia dan melakukannya dengan lebih baik.

AlphaGo Zero berbeza. Penyelidik tidak memberi makan kepada rangkaian saraf mana-mana data dari permainan masa lalu yang dimainkan oleh manusia. AI bermula dari awal dengan slate kosong sepenuhnya, imajinasinya terhad hanya kepada peraturan permainan. AlphaGo Zero memulakan latihannya dengan membuat gerakan secara rawak dalam permainan simulasi menentang dirinya sendiri, belajar lebih sedikit dari setiap hasil, dan memperbaiki rangkaian saraf setiap kali.

Ia dilakukan seperti ini selama tiga hari, di mana 4.9 juta permainan dihasilkan, dan 1, 600 simulasi dihasilkan untuk setiap permainan tersebut. Hanya dalam masa 36 jam, AlphaGo Zero sudah bersedia untuk mengetuk pendahulunya dari puncak gunung. Sebagai perbandingan, versi AlphaGo yang mengalahkan Lee Sedol, pemain manusia terbaik di dunia, memerlukan beberapa bulan latihan dan bergantung pada perkakasan yang jauh untuk mendapatkan pekerjaan itu.

DeepMind, selepas mengalahkan Sedol, terus memperbaiki AlphaGo dalam beberapa lelaran. Pada awal tahun ini, AlphaGo Master mengalahkan 60 pemain Go dalam talian di dunia. AlphaGo Zero melepasi AlphaGo Master selepas 21 hari latihan. Selepas 40 hari, AlphaGo Zero boleh dikatakan perkara terbaik untuk pernah bermain Go.

Hakikat bahawa AlphaGo yang mengetuai manusia yang mengalahkan Sedol tidak dapat mengalahkan satu kemenangan terhadap diri sendiri yang diajar AlphaGo Zero mempunyai para penyelidik yang tiba-tiba menyimpulkan, dan mungkin kesimpulan yang berseri-seri. Dalam kajian mereka, mereka menulis:

"Ini menunjukkan bahawa AlphaGo Zero mungkin mempelajari strategi yang berbeza secara kualitatif terhadap permainan manusia.

AlphaGo Zero menemui tahap pengetahuan Go yang luar biasa semasa proses latihan diri. Ini termasuk bukan sahaja elemen asas pengetahuan Go manusia, tetapi juga strategi yang tidak standard melangkaui skop pengetahuan Go tradisional. "

Lebih dari ribuan tahun, beratus-ratus generasi, permainan dan buku yang tidak terhingga yang diterbitkan mengenai permainan tersebut, kemanusiaan mengumpulkan pengetahuan tentang Go. Dan tuan-tuan mencapai tahap mereka hanya dengan berdiri di atas bahu begitu banyak yang datang di hadapan mereka. Permainan ini mempunyai sejarah yang kaya, dan ada sebab ia masih menangkap imaginasi orang hari ini.

AlphaGo Zero, melalui pembelajaran secara rawak dan pembelajaran tetulang, bukan sahaja menguasai permainan Go, tetapi juga mencipta semula. Semua dalam masa kurang dari dua bulan.

Jangan Tunda Lutut Namun

Untuk seorang penyelidik kecerdasan buatan, membina AI dengan pengetahuan umum akan serupa dengan pendaratan di Marikh-tidak ada had apa yang boleh dilakukan oleh AI. Manusia mempunyai pengetahuan umum. Kami menggunakan perkakasan dan perisian biologi yang sama untuk memandu kereta, menyelesaikan masalah matematik, menulis puisi, menangkap baseball dan memainkan permainan Go. Kita juga boleh menyelesaikan masalah di mana penyelesaian itu tidak masuk akal, tidak ada "pemenang" dan peraturan untuk membimbing kita tidak wujud. Bagaimanakah seseorang menang dalam puisi?

AlphaGo Zero adalah satu lagi langkah ke arah pengetahuan umum. Ia membentuk strategi sendiri dan mengoptimumkan hasil tanpa mengkaji contoh sebelumnya. Pasti, tingkah laku yang muncul di sini adalah novel, dan mungkin belum pernah terjadi sebelumnya. Tetapi permainan Go mewakili masalah terkurung dengan peraturan dan definisi yang jelas apabila permainan tamat-walaupun terdapat jumlah minda yang berubah-ubah variasi permainan. Algoritma seperti AlphaGo Zero mempunyai potensi untuk mengajar dirinya sendiri dan melaksanakan pada tahap superhuman dalam tugas berasaskan peraturan di mana hasilnya diketahui: melabur, tuntutan insurans, diagnosis perubatan.

Tetapi bolehkah ia bermain, menulis novel, memandu kereta dan memilih tomato terbaik dari bahagian menghasilkan? Belum lagi, tetapi ia semakin dekat.


Artikel Yang Menarik

Menentang MHC Menarik?  (atau tidak)

Menentang MHC Menarik? (atau tidak)

Saya telah menyebut MHC sebelum ini; mereka menarik dari perspektif evolusi kerana mereka adalah salah satu lokus yang paling polimorfik pada manusia, mungkin disebabkan oleh peranan mereka dalam rintangan penyakit dan strategi "portfolio pelbagai" yang nampaknya optimum sepanjang jangka masa panjang (jenis seks seperti )

Adakah Botox Running Amok dalam Jutaan Badan Rakyat?

Adakah Botox Running Amok dalam Jutaan Badan Rakyat?

Ia bukan hari yang baik untuk sesiapa sahaja yang berusaha untuk memenuhi jangkaan keindahan masyarakat yang tidak realistik. Pertama, Persatuan Penerbit Berkala British mengumumkan bahawa ia boleh membendung jumlah yang mengejutkan bagi airbrushing dan photoshopping (video) yang diperlukan untuk menjual majalah mereka

Agar Pemenang Peraduan Seni Meningkatkan karya-karya dengan Mikroba

Agar Pemenang Peraduan Seni Meningkatkan karya-karya dengan Mikroba

Tidak peduli betapa cerah tirai mandi tirai anda, ia tidak dapat bersaing dengan kulat yang memenangi pertandingan Agar Art tahun ini. Ini adalah tahun ketiga Persatuan Mikrobiologi Amerika telah menjalankan peraduan itu, meminta "kerja-kerja yang berada di terasnya sebuah organisma (s) yang tumbuh di agar

Kemaskini: Pertempuran Lebih Siapa Mendapat Nama Planet

Kemaskini: Pertempuran Lebih Siapa Mendapat Nama Planet

Khamis lepas, satu pasukan saintis yang bekerja dengan teleskop angkasa Kepler NASA menggambarkan tiga planet baru yang menarik yang mengelilingi bintang-bintang yang jauh. Mereka hanya sedikit lebih besar daripada Bumi dan orbit dalam "zon yang boleh dihuni" di mana suhu boleh menjadi tepat untuk air cair dan untuk kehidupan

NCBI ROFL: Hello, world!  (sekali lagi)

NCBI ROFL: Hello, world! (sekali lagi)

Tolong izinkan kami memperkenalkan diri. Kami adalah dua pelajar PhD dalam Molekul dan Biologi Sel di UC Berkeley. Kembali pada bulan Mac sepuluh, kami memulakan blog kecil bernama "NCBI ROFL" di mana kami menyiarkan artikel saintifik yang sebenar dengan subjek lucu dari pangkalan data PubMed (yang ditempatkan oleh Pusat Kebangsaan untuk maklumat Bioteknologi, aka NCBI)

Gen & budaya & susu

Gen & budaya & susu

Coevolution budaya gen adalah topik yang menarik bagi saya. Pertimbangkan pencernaan susu dewasa. Ia pelik, dan kelihatan seperti penyesuaian baru. Gen laktase telah berada di bawah pemilihan yang begitu kuat yang sering digunakan (atau rantau di sekelilingnya) sebagai kawalan untuk menguji sama ada kaedah baru untuk mengesan pemilihan sebenarnya berfungsi di mana kita fikir mereka harus bekerja