Scroll to top

Top

1 reactie

DeepMind verslaat Go topspeler

Gepost op 10/02/2016
DeepMind verslaat Go topspeler

DeepMind is zonder twijfel een van de meest onduidelijke en tegelijk meest boeiende departementen die gehuistvest zijn bij de Amerikaanse zoekgigant. De basis van DM is een neuraal netwerk dat computers spelletjes leert spelen. Het begon allemaal met games zoals Pacman, maar inmiddels waagde hun AlphaGo kunstmatige intelligentie zich ook aan een spelletje Go. Niet zonder succes ook, want deze AI versloeg de Europees kampioen Fan Hui met maar liefst 5 – 0.

Wat is Go?

Go is een bordspel voor 2 spelers dat voornamelijk populair is in Oost-Azië. Inmiddels doken er in Europa ook reeds clubs op, maar vooralsnog blijft schaken hier populairder. Het spelbord bestaat uit 19 horizontale en 19 verticale lijnen wat een mooi totaal van 361 kruispunten oplevert. Elke speler beschikt over een stapel steentjes. De bedoeling is dan om een zo groot mogelijk gebied van het bord te veroveren. Dit doe je door groepen van kruispunten te omsingelen met steentjes in je eigen kleur. Beide partijen spelen zolang tot ze overeenkomen dat ze geen zetten meer kunnen uitvoeren die hun voordeel oplevert. Je snapt het al van deze uitleg: Go vraagt wat uitleg en ervaring. Als je interesse zou hebben in deze denksport kan je altijd terecht bij de Belgische Go-federatie.

Go is echter wel beduidend complexer dan schaken vanuit een computationeel standpunt. In 1996 werd Kasparov immers al verslagen door Deep Blue, maar dus tot 2016 bleef Go ver buiten het bereik van zelfs de meest geavanceerde kunstmatige intelligenties. De voornaamste reden hiervoor is de immense hoeveelheid aan mogelijke stappen. In stap 1 heb jij 362 keuzes (361 mogelijke kruispunten om een steen te leggen of passen), wat dus nog tot 362 mogelijkheden overlaat voor je tegenstander in stap 2 en zo verder. Bij elke stap dienen we het aantal toestanden te vermenigvuldigen, dus je krijgt al snel een idee van de complexiteit. Go is dan ook een sport dat vooral leunt op ervaring, je doet beroep op herkenning om gevaarlijke of mogelijks nuttige spelsituaties te herkennen. Computers evalueren voornamelijk en meer traditionele kunstmatige intelligenties zullen dus elk van deze miljoenen spelopties willen overwegen. Maar nu is dus de Europees kampioen verslagen door een atypische intelligentie: het DeepMind neuraal netwerk.

Tussen 9 en 15 maart zal de wereldkampioen (Lee Sedol) het opnemen tegen DeepMind’s AlphaGo. Die laat echter bijzonder weinig zorg tonen. “Ik ben overtuigd dat ik kan winnen, ten minste deze keer”. Met die deze keer hint Lee dan ook op de verbazingwekkende vooruitgang die DeepMind wist te maken de afgelopen jaren. De wedstrijd zal trouwens via YouTube live te volgen zijn, de exacte datum wordt later bekend gemaakt.

Facebook probeert de loef af te steken

Het was op 25 januari dat Google bekend maakte dat ze een aankondiging te doen hadden rond Go op de 27ste. Facebook dacht ze echter snel even de loef af te steken. Op 26 januari deelden ze dan ook vol trots mee dat ze een nieuw Go-systeem hadden ontwikkeld dat een zet kon berekenen in 0,1 seconden. Bovendien scoorde hun systeem even goed als het beste dat toen beschikbaar was. Jammer genoeg voor hen legde Google de lat de volgende dag een heel pak hoger…

Wat is DeepMind?

DeepMind is een toepassing van zogenaamde reinforcement learning. Dit is een tak van de Machine Learning (computers taken aanleren op basis van data dan de werkwijze stap per stap uit te leggen) dat op een net iets andere manier werkt. De werkwijze valt nog het best te vergelijken met hoe mensen gamen: er is een beloning dat hun drijft. Door deze beloning te proberen maximaliseren leert een reinforcement learning systeem hoe een bepaalde taak uitgevoerd dient te worden. En laat nu net dat heel krachtig zijn: zo kan je een enkel krachtig systeem vrij eenvoudig opnieuw trainen en inzetten voor een andere taak. De ontwikkelaars van DeepMind zitten ook zeker niet stil: deze week dook al hun nieuwste goocheltruc op. Ze willen DeepMind door een labyrint sturen. Het lijkt eenvoudig, maar de enige input dat deze AI krijgt is het beeld dat de pixels vormen. Hetzelfde als jij of ik zou zien dus.

De evolutie van AI is indrukwekkend. Analysten hadden pas over pakweg 10 jaar het mogelijk geacht dat een kunstmatige intelligentie kon heersen in Go. In maart weten we alvast of AlphaGo de nieuwe wereldkampioen wordt. Meer technische details kunnen jullie vinden in de publicatie van Nature.

https://www.youtube.com/watch?v=SUbqykXVx0A

Bram Vandewalle

Reacties

  1. Ondertussen won Alpha Go ook al de tweede match. Wanneer gaat openAI zich ermee bemoeien 🙂

Plaats reactie