Het kunstmatige intelligentieprogramma van DeepMind, AlphaZero, vertoont nu tekenen van mensachtige intuïtie en creativiteit, in wat ontwikkelaars in de geschiedenis hebben bestempeld als 'keerpunt'.
Het computersysteem verbaasde de wereld vorig jaar toen het het schaakspel helemaal onder de knie kreeg binnen slechts vier uur, ondanks dat het niet was geprogrammeerd hoe te winnen.
Maar nu, na een jaar testen en analyseren door schaakgrootmeesters, heeft de machine een nieuwe speelstijl ontwikkeld die nog nooit eerder is gezien, wat suggereert dat het programma nu improviseert als een mens.
In tegenstelling tot 's werelds beste schaakmachine - Stockfish - die miljoenen mogelijke uitkomsten berekent terwijl het speelt, leert AlphaZero van zijn eerdere successen en mislukkingen, waarbij zijn bewegingen gebaseerd zijn op een' vaag gevoel dat het allemaal gaat lukken op de lange termijn ', aldus experts van DeepMind.
Toen AlphaZero het opneemt tegen Stockfish in 1,000-games, verloor het slechts zes, won overtuigend 155 keer en tekende de resterende wedstrijden.
Toch was het de manier waarop het speelde die ontwikkelaars heeft verbaasd. Terwijl schaakcomputers voornamelijk hun stukken willen vasthouden, offerde AlphaZero zijn soldaten gemakkelijk op voor een betere positie in de schermutseling.
In een gesprek met The Telegraph zei prof. David Silver, die leiding geeft aan de onderzoeksgroep voor versterking van leren bij DeepMind: "Het heeft een zeer subtiel gevoel van intuïtie dat het helpt alle verschillende factoren in evenwicht te brengen.
"Het heeft een neuraal netwerk met miljoenen verschillende afstembare parameters, die elk hun eigen regels leren over wat goed is in schaken, en als je ze allemaal samenvoegt, heb je iets dat, op een nogal breinachtige manier, ons menselijk vermogen uitdrukt om werp een blik op een positie en zeg 'ah ha dit is het juiste om te doen'.
“Mijn persoonlijke overtuiging is dat we iets van een keerpunt hebben gezien waarbij we beginnen te begrijpen dat veel vaardigheden, zoals intuïtie en creativiteit, waarvan we eerder dachten dat ze alleen in het domein van de menselijke geest lagen, daadwerkelijk toegankelijk zijn voor machine-intelligentie ook. En ik vind dat een heel spannend moment in de geschiedenis. "
AlphaZero begon als een 'tabula rasa' of blanco leistelsel, geprogrammeerd met alleen de basisregels van schaken en leerde winnen door miljoenen spellen tegen zichzelf te spelen in een proces van vallen en opstaan dat bekend staat als versterkend leren.
Het is op dezelfde manier als het menselijk brein leert, waarbij tactieken worden aangepast op basis van een eerdere winst of verlies, waardoor het slechts 60 duizend posities per seconde kan zoeken, vergeleken met de ongeveer 60 miljoen Stokvis.
Binnen slechts een paar uur had het programma onafhankelijk menselijke openingen en strategieën ontdekt en gespeeld voordat het zijn eigen ideeën ontwikkelde, zoals snel rondzwerven bij de koning van de tegenstander en veel minder waarde hechten aan individuele stukken.
De nieuwe speelstijl is geanalyseerd Schaakgrootmeester Matthew Sadler en Women's International Master Natasha Regan, die het anders dan een traditionele schaakmotor zeggen.
"Het is alsof je de geheime notebooks van een geweldige speler uit het verleden ontdekt," zei Sadler.
Regan voegde eraan toe: “Het was fascinerend om te zien hoe AlphaZero's analyse verschilde van die van de beste schaakmachines en zelfs het beste Grandmaster-spel. AlphaZero zou een krachtig leermiddel kunnen zijn voor de hele gemeenschap. "
Garry Kasparov, voormalig wereldkampioen schaken, die in 1997 beroemd was geworden tegen de schaakmachine Deep Blue, zei: “In plaats van menselijke instructies en kennis met enorme snelheid te verwerken, zoals alle eerdere schaakmachines, genereert AlphaZero zijn eigen kennis.
"Het speelt met een zeer dynamische stijl, net als de mijne. De implicaties gaan veel verder dan mijn geliefde schaakbord."