Google AI Doorbraak: Deep Mind kan leren zonder menselijke input

Deel dit verhaal!

Google staat in de top van bedrijven die op zoek zijn naar wereldwijde Technocracy, en hun drang naar autonome AI bedreigt de kern van de wereldmaatschappij. De dreiging is reëel, maar weinig burgers begrijpen de complexiteit van deze technologie.  TN Editor

Nog niet zo lang geleden was het beheersen van het oude Chinese spel Go buiten het bereik van kunstmatige intelligentie. Maar dan AlphaGo, de AI-speler van Google DeepMind, begon te vertrekken zelfs de beste menselijke tegenstanders in het stof. Maar zelfs deze wereld-kloppende AI had mensen nodig om van te leren. Toen, op woensdag, sloot de nieuwe versie van DeepMind mensen helemaal af.

AlphaGo Zero heeft de mogelijkheden van zijn voorganger overtroffen en voorbijgegaan aan AI's traditionele methode voor het leren van games, waarbij duizenden uren menselijk spel worden bekeken. In plaats daarvan begint het gewoon willekeurig te spelen en verbetert het zijn vaardigheden door herhaaldelijk tegen zichzelf te spelen. Drie dagen en 4.9 miljoen dergelijke games later, is het resultaat 's werelds beste Go-playing AI.

"Het is krachtiger dan eerdere benaderingen omdat we de beperkingen van menselijke kennis hebben weggenomen", zegt David Silver, de hoofdonderzoeker van AlphaGo.

"De mensheid heeft Go-kennis opgebouwd uit miljoenen games die gedurende duizenden jaren zijn gespeeld", schrijven de auteurs in hun paper. "In enkele dagen tijd ... kon AlphaGo Zero veel van deze Go-kennis herontdekken, evenals nieuwe strategieën die nieuwe inzichten verschaffen in de oudste games."

Dankzij de alternatieve benadering van AlphaGo Zero kon het strategieën ontdekken die mensen nog nooit hebben gevonden. Het heeft bijvoorbeeld veel verschillende joseki's geleerd - reeksen bewegingen die voor beide partijen geen nettoverlies tot gevolg hebben. Veel joseki's zijn opgeschreven tijdens de duizenden jaren dat Go is gespeeld, en in eerste instantie leerde AlphaGo Zero veel van de bekende. Maar naarmate zijn zelftraining voortduurde, begon het voorkeur te geven aan eerder onbekende sequenties.

Om deze nieuwe bewegingen te testen, plaatste DeepMind AlphaGo Zero tegen de versie die 18-tijd wereldkampioen Lee Sedol versloeg. In een 100-game wrok wedstrijd, het won 100-0. Dit ondanks slechts drie dagen training, vergeleken met enkele maanden voor zijn voorganger. Na 40 trainingsdagen won het ook 89-11 tegen een betere versie van AlphaGo die wereld nummer één Ke Jie (NATUURDOI: 10.1038 / nature24270).

Lees hier het hele verhaal ...

Inschrijven
Melden van
gast

0 Comments
Inline feedbacks
Bekijk alle reacties