Igor Mordatch is werken om machines te bouwen die een gesprek kunnen voeren. Dat is iets waar zoveel mensen aan werken. In Silicon Valley is chatbot nu een bonafide modewoord. Maar Mordatch is anders. Hij is geen taalkundige. Hij houdt zich niet bezig met de AI-technieken die typisch reiken naar taal. Hij is een robot die zijn carrière begon als animator. Hij bracht tijd door bij Pixar en werkte aan Toy Story 3, tussendoor als academicus op plaatsen als Stanford en de Universiteit van Washington, waar hij robots leerde bewegen als mensen. "Ik ben altijd geïnteresseerd geweest in het creëren van beweging", zegt hij. Nu komt al deze expertise op een onverwachte manier samen.
De 31-jarige is geboren in Oekraïne en opgegroeid in Toronto en is nu gastonderzoeker bij OpenAI, het kunstmatige intelligentie-lab, opgericht door Tesla-oprichter Elon Musk en Y-combinatorpresident Sam Altman. Daar onderzoekt Mordatch een nieuw pad naar machines die niet alleen met mensen kunnen communiceren, maar ook met elkaar. Hij bouwt virtuele werelden waar softwarebots leren hun eigen taal te creëren uit noodzaak.
Zoals gedetailleerd in een onderzoeksartikel dat deze week door OpenAI is gepubliceerd, creëerden Mordatch en zijn medewerkers een wereld waarin bots worden belast met het voltooien van bepaalde taken, zoals zichzelf verplaatsen naar een bepaald monument. De wereld is eenvoudig, alleen een groot wit vierkant - alle twee dimensies - en de bots zijn gekleurde vormen: een groene, rode of blauwe cirkel. Maar het punt van dit universum is complexer. De wereld stelt de bots in staat om hun eigen taal te creëren als een manier om samen te werken en elkaar te helpen die taken te voltooien.
Dit gebeurt allemaal door wat wordt genoemd versterking van leren, dezelfde fundamentele techniek die ten grondslag ligt aan AlphaGo, de machine uit het DeepMind AI-lab van Google die het oude spel Go heeft gekraakt. Kortom, de bots navigeren hun wereld door extreme vallen en opstaan, waarbij ze zorgvuldig bijhouden wat werkt en wat niet als ze een beloning bereiken, zoals het bereiken van een mijlpaal. Als een bepaalde actie hen helpt om die beloning te bereiken, weten ze het te blijven doen. Op dezelfde manier leren ze hun eigen taal te bouwen. Door elkaar te vertellen waar ze naartoe moeten gaan, krijgen ze allemaal sneller plaatsen.
Zoals Mordatch zegt: "We kunnen het succes van de dialoog verminderen tot: Ben je uiteindelijk bij het groene kan of niet?"
Om hun taal op te bouwen, wijzen de bots willekeurige abstracte karakters toe aan eenvoudige concepten die ze leren terwijl ze door hun virtuele wereld navigeren. Ze wijzen personages aan elkaar toe, aan locaties of objecten in de virtuele wereld en aan acties zoals "ga naar" of "kijk naar". Mordatch en zijn collega's hopen dat naarmate deze bottalen complexer worden, verwante technieken ze vervolgens kunnen vertalen in talen zoals Engels. Dat is nog ver weg - althans als een praktisch stukje software - maar een andere OpenAI-onderzoeker werkt al aan dit soort 'vertalerbot'.
Uiteindelijk, zegt Mordatch, kunnen deze methoden machines een dieper begrip van de taal geven, ze feitelijk laten zien waarom taal bestaat - en dat biedt een springplank naar echt gesprek, een computerinterface waar computerwetenschappers al lang van hebben gedroomd, maar nooit echt van af zijn gekomen.