Nieuws

‘The Queen’s Gambit’ door de ogen van een data scientist.

Schaken is hot. Niet in de laatste plaats door de Netflix hitserie ‘The Queen’s Gambit’. Het fictieve verhaal over schaakwonder Beth Harmon. Een weeskind dat haar verslavingen overwint en opklimt tot schaakgrootmeester.

Ons eigen schaakwonder
Bij Pipple hebben we ons eigen schaakwonder: Robin Swinkels is schaakgrootmeester en data scientist. En hoewel zijn enige verslaving schaakstukken zijn, ziet hij wel degelijk overeenkomsten tussen zijn werk bij Pipple, schaken en de Netflix serie. Robin: “Met Artificial Intelligence technieken, zoals Reinforcement Learning, kunnen we ongelofelijk veel scenario’s doorlopen. Door daar iedere keer de meest succesvolle uit te filteren komen we uiteindelijk tot het gewenste resultaat.” Net als in Reinforcement Learning is schaken vooruitkijken, scenario’s doorlopen en aanpassen aan ontwikkelingen, zoals een zet op het bord. Je denkt een pad uit, als dit niet tot het gewenste resultaat leidt, neem je een andere route.

Reinforcement Learning
In de serie leert Beth van iedere tegenstander die ze tegenkomt, ze ontwikkelt zichzelf, ontdekt nieuwe strategieën en wordt zo ‘onverslaanbaar’. De AI-techniek Reinforcement Learning werkt op een soortgelijke manier. Lennart van Ham, ook data scientist bij Pipple, schreef hier zijn scriptie over: “Ook het systeem laten we een leercurve doorlopen. Door gewenste en ongewenste uitkomsten als zodanig te classificeren, leert het systeem zichzelf te ontwikkelen.” In de serie wordt Beth pas echt goed door van haar eigen schaakpartijen te leren. “Om beter te worden speelt het systeem oneindig veel partijen, terwijl het continue ervaart wat goed is en wat fout, wat sneller is, beter is. Zo leert het situaties te beoordelen.”

Ontwikkeling van AI
Beth’s tegenstander in de serie is de Russische Borgov. Een schaakgrootmeester die al van kinds af aan stoïcijns leert en traint. Topschakers als hij doen er tientallen jaren over om op hoog niveau te komen. Google’s computerprogramma AlphaZero deed er vier uur over om de regels te leren en op een gelijkwaardig niveau te komen. Maar net als Borgov, zijn AI-systemen vaak weinig creatief, ze leren om te reageren binnen gestelde kaders. Daarbinnen zoeken ze de best mogelijke uitkomst. Het is aan ons om die kaders te creëren.
Het zijn vrij nieuwe technieken, en de ontwikkelingen staan niet stil. Robin: “Bij Pipple zijn we altijd bezig met innovatie. We ontwikkelen deze technieken, passen ze toe en leren iedere keer meer.” Ook buiten het schaakbord kunnen AI-technieken, in de toekomst, zoveel betekenen bij het oplossen van complexe problemen.

Hoe die toekomst eruitziet? Wie weet, maar met steeds slimmere systemen en de menselijke creativiteit kunnen we die toekomst gaan ontdekken en vorm geven.