Waar de Sterre bleef stille staan…

GENT 24/12 - Waar de ster bleef stilstaan werd op kerstmis de Messias geboren. Maar in ons verhaal is er geen sprake van stilstand. Integendeel, we brengen u het verhaal van Alfastar, een snel rijzende ster aan het firmament van de artificiële intelligentie. Welkom in de wondere wereld van Alfastar en StarCraft II.

Een spel onder de kerstboom?

StarCraft II is een computerspel waarin het digitaal canvas bevolkt wordt door een bonte schare manga-achtige figuren, kabouters en trollen, helpers en helden, ridders en tovenaars. Ze figureren er naast andere bizarre buitenaardse creaturen getooid in bonte kleuren, dikke harnassen en gewapend met allerlei schiet- en ander wapentuig uit een futuristische sword- en sorcery-achtige fantasiewereld. Het is een competitief spel dat wereldwijd dagelijks duizenden actieve spelers in de ban houdt. Weinig lezers zullen er evenwel wakker van liggen en zelfs na een eerste snelle blik, het geheel afdoen als een juveniel tijdverdrijf voor kinderen die net Minecraft of Roblox ontgroeid zijn. Met andere woorden: niet onmiddellijk iets waarvan artsen of andere geleerde mensen wakker moeten liggen.

StarCraft II: geen banaal spel

Maar hier slaan ze de bal mis. Want onder de motorkap van dit infantiel ogende computerspel zit één der meest uitdagende en complexe spelen ooit bedacht. Wie in dit spel wil excelleren, moet het strategisch denken van een schaakgrootmeester bezitten en dit combineren met het brein van een supereconoom.

Maar ook en simultaan - feillozer dan Sun Tsu zelf - uitblinken in anticipatie, militaire strategie, tactiek en diplomatie en dat alles tegelijk op diverse niveaus en schaalgroottes. StarCraft II is dus allesbehalve een banaal computerspelletje om enkele lege uurtjes mee te vullen. Het is daarentegen een heel moeilijk en vooral zeer complex spel. En een enorme uitdaging voor spelers (of teams) die enkel vrede nemen met overwinningen.

Het is net deze extreme moeilijkheidsgraad die voor de firma DeepMind (de bekende AI ontwikkelaar- intussen bij Google) een onweerstaanbare uitdaging leek te vormen om hun laatste AI-model op los te laten.

De alfaspelers van Silicon Valley

De AI wereld van Silicon Valley moet het blijkbaar hebben van grootse uitdagingen. Hoe moeilijker en schijnbaar onmogelijker de taak, des te gretiger lijken ze zich erin vast te bijten.

Dat was enkele jaren geleden ook al het geval. Toen stelde datzelfde team zich als doel om binnen de twee jaar een AI-systeem te ontwikkelen dat de wereldkampioen in het bekende Japanse bordspel GO, de Zuid-Koreaan Lee Sedol, zou kunnen verslaan. Ik was in maart 2018 een bevoorrechte getuige van deze spannende mens-machine wedstrijden waarbij inderdaad Lee Sedol het onderspit moest delven tegen de AlfaGo zoals de AI-entiteit genoemd werd.

Enkele jaren daarvoor (1996-1997) viel deze weinig benijdenswaardige rol al te beurt aan schaakgrootmeester Garry Kasparov. In een ronde van 6 matchen verloor hij van de IBM's AI-Deep Blue. De tijd van de cybernetica leek definitief aangebroken.

Winnen bij StarCraft II: hoe begin je daaraan?

StarCraft II is -zoals gezegd- een ongelooflijk moeilijk en complex spel. In tegenstelling tot schaak of Go krijgt een speler bovendien nooit het ganse speelveld te zien en is de denktijd beperkt (alles gebeurt in real time en een spel duurt maximum 1 uur). Constant moet de speler dus zijn strategie over honderden units met ieder verschillende rollen, competenties en functies afwegen t.o.v. globale economische perspectieven. Daarbij moet hij uiteraard ook rekening houden met- en zo mogelijk gepast anticiperen op - de strategie van de tegenstanders.

In dit competitief spel bestaat er geen optimale, altijd winnende strategie. Ieder spel is totaal anders en onvoorspelbaar. Enkel de actieve en aandachtige combinatie van tactische en strategische vaardigheden bepaalt wie op het einde van een match wint en verliest. Ook hier bestaan wereldwijde competities en zijn er ware grootmeesters. Hoe kan men hopen om Alfastar, in essentie een deep learning AI neuraal netwerksysteem gebouwd via een meerlagige neuronale reinforcement architectuur, op dit grootmeester niveau te brengen? Hoe begin je immers aan zoiets?

Reinforcement Learning

Reinforcement learning leunt sterk aan bij het neuronaal hiërarchisch netwerk model van onze biologische hersenwerking zoals geconcipieerd door Karl Friston (Predictive coding). Het is een neuraal netwerk algoritme dat al zijn sporen verdiend heeft in het aanleren van spelen met meerdere regels. Maar met StarCraft II spelen we toch in een hogere divisie

In een eerste versie van het programma leerden de makers hun AI het spel gewoon te spelen (regels toepassen) door het een reeks voorbeelden te "voederen", namelijk reeds door mensen gespeelde sessies. Zodra de AI autonoom in staat was het spel tot het einde te spelen (nog lang niet om te winnen) lieten ze de AI-clonen tegen diverse versies van zichzelf in competitie gaan waarbij elke versie zich toelegde op een bepaalde strategie. Op die manier werd een ganse liga AI-spelers gecreëerd en kon de master unit gedistribueerde kennis verzamelen. Dat liep allemaal niet zo eenvoudig als ik het hier schrijf en er dienden aanpassingen aan de architectuur te worden aangebracht gezien de AI de neiging had om bepaalde succesvolle strategieën tussen de spelen door te "vergeten".

"Het Alfastar-exploot werd met tromgeroffel gepubliceerd in Nature."

Zo ontstond een tweede alfastarliga, opnieuw bevolkt met honderden klonen van de master AI zelf. Waar deze aanvankelijk tegen elkaar speelden (competitief) bleek de geniale stap te bestaan uit het switchen naar een coöperatieve liga, waarbij de units een soort sherpa coach rol werd meegegeven. Daarin speelden de klonen niet tegen de basale AI "master in spe", maar hielpen ze hem door zijn zwakke punten duidelijk te maken. Zo zou de master zichzelf kunnen verbeteren en hen finaal steeds meer overtreffen.

In januari dit jaar bereikte Alfastar dan finaal het grootmeesterschap StarCraft II. Het versloeg 99.8% van alle andere (menselijke) spelers. Dat dit geen banaal "fait divers" betreft bewijst het feit dat het Alfastar-exploot met tromgeroffel gepubliceerd werd in Nature (2).

Wat leert ons dit?

Is deze digitale multi-agent AI dan onze nieuwe verlosser? Uiteraard niet in de religieuze of spirituele betekenis van het woord maar men kan niet negeren dat het hier om een historisch pivotaal moment in de tijd gaat. Het is een nieuwe stap op weg naar de ontwikkeling van intelligente artificiële sturingssystemen (bv. autonome voertuigen, complexe fabricagesystemen..) in een realistische en complexe, moeilijk voorspelbare realiteit.

Is "The Singularity" nabij?

Wat we bovendien vaststellen in de ontwikkeling en groei van dergelijke AI systemen is dat de "schaalfactor" een zeer sterke en niet voorspelbare invloed lijkt te hebben op hun prestaties en complementaire faculteiten. Er zijn uiteraard veel kritische stemmen die betwijfelen of dit zomaar door te trekken valt. En ook al blijft de AI-gemeenschap zelf eerder discreet en terughoudend, wie de prestaties van GPT-3 beluistert (luister naar het interview met deze AI) (3) zal toch moeten toegeven dat hier een nieuw fenomeen het levenslicht heeft gezien.

Ray Kurtzweil, de beminnelijke futuroloog die ik mocht ontmoeten in 2018, spreekt in zijn boeken over "The Singularity", ofwel het moment in de tijd dat artificiële intelligentie intelligentie onze menselijke intelligentie zal overtreffen. Sommigen stellen als datum 2042 voor (met een olijke knipoog naar " 42" als een symbolische datum) (4).

"Wat dit moment voor de mensheid zal betekenen is niet met zekerheid in te schatten."

Wat dit moment voor de mensheid zal betekenen is niet met zekerheid in te schatten. Wordt het een doemscenario type Terminator of daarentegen een stap naar een betere en meer evenwichtige en rechtvaardige toekomst voor de mensheid?

Doe eens een wens…

Misschien is het daarom geen bizarre kerstwens te hopen dat onze ethici en filosofen mee zullen mogen nadenken en beslissen rond hoe dergelijke technologie in de toekomst wordt aangewend.

Pas als de mensheid deze graad van maturiteit bereikt zal "de sterre echt stil kunnen staan".

Referenties

1/ https://en.wikipedia.org/wiki/Lee_Sedol

2/ https://www.nature.com/articles/s41586-019-1724-z

3/ https://www.youtube.com/watch?v=PqbB07n_uQ4

4) Phrases from The Hitchhiker's Guide to the Galaxy