Bedrijven zoals Google, Facebook, Netflix en Spotify kunnen niet zonder en jij en ik maken er dagelijks gebruik van. Algoritmes. Ze hebben het heden en de toekomst. Maar wat ís een algoritme nou eigenlijk precies? Waarom is algoritmisering cruciaal, waar ligt de (ethische) grens en wat zijn de gevolgen voor de arbeidsmarkt?
Jim Stolze geeft in zijn boek ‘Algoritmisering, wen er maar aan!’ duidelijk antwoord op de eerste vraag en tast af wat de beste antwoorden zijn op de vervolgvragen. De manier waarop hij dat doet, leest lekker weg. Het boek is vlot geschreven en doorspekt met concrete voorbeelden.
Je hoeft geen wiskundeknobbel te hebben om te snappen waar Stolze het over heeft en dat is natuurlijk precies de bedoeling. De meesten van ons is zo’n knobbel tenslotte niet gegeven, maar we hebben wél iedere dag te maken met algoritmes. Als gebruiker, ondernemer, zelfstandige of in loondienst.
Het is voor de maatschappij en het bedrijfsleven van overlevingsbelang om te weten wat algoritmisering is en hoe het werkt, wat je ermee kunt doen, wat de waarde daarvan is en waarom het bepaald werk (deels) overbodig zal maken. Alleen al vanuit dat perspectief is dit boek een aanrader.
Hoe werkt een algoritme?
Jim Stolze trapt af met een laagdrempelige uitleg over hoe een algoritme werkt door (hoe kan het ook anders) Google als uitgangspunt te nemen. Zij hebben een imperium gebouwd rondom een overzichtelijke database omdat zij deze dataverzameling relevant wisten te maken met behulp van een algoritme.
Aan de hand van 23andMe gaat hij dieper in op de werking van een algoritme. Dit bedrijf heeft van meer dan 3 miljoen mensen het DNA gedigitaliseerd en beschikt daardoor over een enorme database. En daarin kun je Google’n, zogezegd. Geef een bepaalde DNA lettervolgorde in en hup, 23andMe vindt (in het geval van de auteur) meer dan een handvol nieuwe familieleden.
De meeste mensen gaat het echter om medische inzichten. Zoals of je meer kans hebt op suikerziekte en Alzheimer. 23andMe laat het je weten, geeft je levensstijltips en stuurt je updates als er nieuwe medische rapporten verschenen zijn die relevant zijn voor jouw genenpakket. Wow…
Toen Stolze in 2011 zijn DNA liet digitaliseren koste hem dat trouwens 6.000,- dollar. Tegenwoordig betaal je er rond de 100,- dollar voor. Wat te danken is aan de Wet van Moore over vooruitgang (die inmiddels wel aan het vertragen is).
Wat is een algoritme?
“Een algoritme is niets ingewikkelds,” aldus Jim Stolze. “Het is gewoon een stap voor stap procedure om iets voor elkaar te krijgen.”
Algoritmes bestaan dan ook al héél lang. In onze moderne tijd hebben ze alleen een andere dimensie en invloed gekregen. Het is Artificial Intelligence geworden (kunstmatige intelligentie), omdat de mens niet meer nodig is om berekeningen uit te voeren en voorspellingen te doen.
Wat is algoritmisering?
In een enorme warboel duidelijke patronen ontdekken en daar vervolgens waardevolle inzichten uit destilleren. Dat is algoritmisering in een notendop.
.
Data zijn overal om ons heen. De patronen daarin ontdekken en die vertalen naar relevante oplossingen is de nieuwe heilige graal.
.
Als data de nieuwe olie zijn, dan is algoritmisering het ultieme boorplatform.
Digitale transformatie
En passant legt Stolze ook nog even de vinger op een gevoelige plek in het bedrijfsleven. Tegenwoordig verkeert iedereen in ‘digitale transformatie’, waar volgens hem iets heel anders mee bedoeld wordt, namelijk:
We beseffen dat de buitenwereld sneller gaat dan onze binnenwereld, maar weten niet wat we daarmee aan moeten, dus zeggen we maar dat we in digitale transformatie verkeren. Herkenbaar? 😉
Wat is machine learning?
Binnen het vakgebied machine learning wordt er gewerkt aan computers die kunnen leren zonder dat ze expliciet ergens voor geprogrammeerd worden.
Welke algoritmen daarvoor worden gebruikt, welke vragen daarmee beantwoord worden en hoe dat in de praktijk werkt, laat Stolze zien door naar twee bij uitstek algoritmische organisaties te kijken: Netflix en Google.
Weapons of Math Destruction
Cathy O’Neil heeft geschreven over kwaadaardige wiskundige modellen in haar boek Weapons of Math Destruction. Systemen die leren van voorbeelden in plaats van softwareregels zijn natuurlijk erg afhankelijk van wie er wat in stopt.
Mensen hebben bij algoritmes vaak het idee of het gevoel dat die neutraal zijn, maar dat is alles behalve waar. De voorkeuren, vooroordelen en onvolkomenheden van wie zich met machine learning bezighoudt, worden ongemerkt meegenomen.
Helaas zijn daar talloze voorbeelden van, zoals het algoritme dat duizenden strafdossiers heeft geanalyseerd en op basis daarvan voorspellingen doet over het recidive risico van mensen die gearresteerd worden.
Dit computersysteem is een commercieel product en daarom geven de bouwers hun algoritme niet prijs. Het is een handelsgeheim. Maar bij dit soort dingen zou je natuurlijk willen dat rechters kunnen nagaan hoe het in elkaar zit.
In dit geval bleek dat dus niet zo best te zijn. Stolze laat 6 van de 134 vragen zien van de vragenlijst waarop de score bijna volledig gebaseerd is. Je schrikt ervan, want met dat soort vragen wordt jouw afkomst omgezet in kwalijke ongelijkheid.
Responsible Data Science (RDS)
RDS is een samenwerkingsverband van Nederlandse universiteiten, die dit soort misstanden wil voorkomen. Zij willen studenten laten zien dat het om FACT gaat:
Fairness
voorbeelden of datapunten moeten een evenwichtig beeld van de werkelijkheid geven
Accuracy
wees je bewust van het verschil tussen correlatie en causaliteit als je op zoek gaat naar verbanden in datasets
Confidentiality
een gevonden verband, mag niet klakkeloos gebruikt worden – je mag persoonsgegevens alleen gebruiken waarvoor je ze hebt ingewonnen (AVG)
Transparancy
gebruik liefst inzichtelijke algoritmen, zoals de beslissingsboom, want bij een systeem zoals deep learning weten zelfs de ontwikkelaars niet hoe de conclusie bereikt is
Jim Stolze voegt er Accountability aan toe. Hij ziet een belangrijke, nieuwe rol weggelegd voor accountants: organisaties behoeden voor het gebruiken van knowledge without understanding (deep learning). Alles wat je doet, moet je kunnen uitleggen aan klanten en andere stakeholders. Je kunt je niet (meer) verschuilen achter “tja, dit is wat de computer zegt…”
Neurale netwerken – deep learning
Deep learning algoritmen zijn min of meer gebaseerd op hoe hersenen informatie verwerken, via neurale netwerken. Hoe dit in z’n werk gaat legt de auteur wederom heel laagdrempelig uit.
De essentie is dat je een inputlaag (pixels) en een outputlaag (classificatie) hebt met daartussen een (enorm) groot aantal verborgen lagen.
In tegenstelling tot de eerste machine learning systemen kunnen de huidige deep learning modellen prima uit de voeten met ongestructureerde data. De software zoekt zelf uit wat de juiste parameters zijn.
Deep learning heeft niets te maken met diepe, mysterieuze krachten. Het is gewoon het stapelen van wiskundige formules teneinde zo nauwkeurig mogelijk een voorspelling te doen op basis van data.
Hoe deep learning in de praktijk kan werken, maakt Stolze duidelijk aan de hand van twee zorg voorbeelden: diabetische retinopathie opsporen en hartritmestoornissen die tot een hartaanval kunnen leiden signaleren met een wearable.
Het wordt steeds duidelijker wat de rode draad is in dit boek: als er een database is met genoeg voorbeelden, wordt er een specifiek algoritme ontwikkeld dat de achterliggende patronen omzet in een waardevolle dienst.
Maar de auteur waarschuwt ook voor de AI-hype, die met extreme beloftes gepaard gaat, zowel positief als negatief. De waarheid sneuvelt binnen no-time als er sprake is van zo’n polarisatie, die aan de ene kant een doemscenario versterkt en aan de andere kant een utopisch idee. Als je je er dus niet verder in verdiept, word je zó op het verkeerde been gezet.
Spraakherkenning
Met verbijstering lees ik wat spraakherkenning mogelijk maakt. Dat gaat veel verder dan Siri of Alexa. Zo vertelt de app Moodies je in wat voor emotionele toestand iemand verkeert. Stolze ziet het binnenkort gebruikt worden tijdens verkiezingsdebatten.
Eén ding is zeker: in beroepen waarin liegen nog normaal is, zal veel veranderen.
Wat er in callcenters hier ver vandaan gebeurt, wil je ook niet weten. Of juist wel, beter gezegd. “Dit gesprek kan voor trainingsdoeleinden worden opgenomen”, dekt in ieder geval absoluut niet de lading…
Algoritmisering in Nederland
In de hoofdstukken ‘AI in bedrijf’ en ‘AI bij de overheid’ bespreekt Jim Stolze (te) kort een aantal concrete toepassingen van algoritmisering in Nederland:
- onderhoudspreventie van treinrails verbeteren door een deep learning model in een bestaand computerprogramma in te bouwen
- kwaliteitsinspectie door de bloemenveiling verhogen door middel van image processing
- creativiteit in de bouw dankzij robots en computational design
- onjuiste of onterechte (her)registraties opsporen in een beroepsregistratiesysteem
- bijstandsfraude sneller opsporen met een algoritme
- criminaliteit voorspellen op basis van data en criminelen digitaal opsporen
Chinese toestanden
Onder de kop ‘Chinese toestanden’ gaat Stolze in op de sociale en financiële kredietsystemen die in China ontwikkeld worden.
Er zijn mensen die zich storen aan de negatieve berichtgeving hierover van het westen, omdat Chinezen systemen die het onderlinge vertrouwen en de integriteit vergroten toejuichen. Wat te maken heeft met één van de issues die in hun top 3 van nationale zorgen staat: moreel verval.
Nu zijn er elders ook ‘Chinese toestanden’ te vinden. Er zijn veel meer landen die massasurveillance toepassen, schrijft Stolze terecht. Kijk maar naar de opmars van camera’s met gezichtsherkenning technologie.
Grote hoeveelheden telefoongesprekken, e-mails en app’s analyseren met een algoritme… ook dat is allemaal mogelijk. Jij en ik hebben nauwelijks zicht op wanneer dat gebeurt, door wie en wat er met al die data gedaan wordt.
Jim Stolze haalt het veel gehoorde “ik heb toch niets te verbergen” aan, in reactie op het inleveren van privacy om bijvoorbeeld terroristische aanslagen te voorkomen. Als je in een redelijk goed functionerende democratie leeft, lijkt dat misschien een prima argument. Maar wie garandeert dat we daar ook in de toekomst in zullen leven?
De toekomst
Na een hoofdstuk waarin Terminator robotangst ontzenuwt wordt, richt Jim Stolze zijn blik op de toekomst van Artificial Intelligence en de rol die Nederland daarin zou kunnen spelen. Hij denkt dat fatsoenlijk omgaan met persoonsgegevens en het respecteren van digitale burgerrechten de norm zal worden.
Als dat zo is, dan kan wat internationaal gezien wordt als Europa’s obsessie met privacy, wat volgens tegenstanders innovatie zou vertragen of belemmeren, ons in de toekomst juist op een voorsprong zetten. Stolze beveelt Nederland aan om de koploper te worden wat betreft uitlegbare AI:
Niet klakkeloos een black box accepteren, maar ernaar streven om liefst alleen algoritmen te gebruiken die uitlegbaar zijn. En geen datadrain naar elders, maar eigen platformen ondersteunen, zodat Nederlandse burgers baas kunnen zijn over hun eigen data.
De nieuwe wereld heeft volgens Jim Stolze datamanagers nodig die verstand hebben van explainability.
Robots gaan ons werk helemaal niet overnemen
Herinner je je al die artikelen nog over hoe de helft van alle banen zou verdwijnen door robotisering? Sindsdien zijn er meer onderzoeken gedaan en die komen op veel lagere percentages uit. Helaas heeft de media daar niet diezelfde intense aandacht voor…
Stolze denkt dat de inschatting verschillen veroorzaakt worden door de verschillende definities van wat een ‘baan’ is. Hij ziet een baan als een bundeling van taken en één of meer van die taken kunnen door een computer overgenomen worden. Een hele baan verdwijnt dus niet zomaar.
Daarnaast doen veel mensen met een baan iets wat computers buitengewoon slecht afgaat: met andere mensen omgaan. Daarentegen is een computer veel beter dan wij in het opzoeken en (re)organiseren van informatie. Daardoor meer kunnen doen van waar je als mens goed in bent, lijkt mij geen slechte uitruil.
Algoritmisering, wen er maar aan!
Dit nieuwe boek van schrijver, ondernemer en technologie optimist Jim Stolze leest als een trein, ik was er in een paar avonden doorheen. Tegelijkertijd leer je wel echt iets over hoe algoritmen werken en waarom ze zo cruciaal zijn voor onze (technologische) toekomst. Er was geen moment dat m’n gebrek aan wiskundige kennis me aanvloog. 😉
Ook niet onbelangrijk: het boek ziet er mooi uit dankzij de frisse vormgeving en ligt lekker in de hand. Het enige waar ik wat op aan te merken heb, zijn de voorbeelden van concrete Artificial Intelligence toepassingen in Nederland. Die hadden wat mij betreft uitgebreider besproken mogen worden.
Kortom, ‘Algoritmisering, wen er maar aan!’ van Jim Stolze is echt een aanrader voor alle niet-engineers onder ons die geïnteresseerd zijn in kunstmatige intelligentie. Want hoe je het ook wendt of keert, we zullen er alleen maar meer mee te maken krijgen. Wel zo slim dus om je er in ieder geval een beetje in te verdiepen.
.
Kitty Kilian zegt
‘Hij denkt dat fatsoenlijk omgaan met persoonsgegevens en het respecteren van digitale burgerrechten de norm zal worden.’ >>? Helaas, dat lijkt mij een naief standpunt. Zeker gezien alle mogelijkheden die je in eerdere alinea’s beschrijft. Luister, als je zin hebt, ook eens naar deze podcast van de NYTimes: ‘The ebola of privacy’. > The Business of Selling Your Location buff.ly/2LgMhlP
Sonja van Vuren zegt
Jim Stolze is een optimist. Moet zeggen dat het wel een verademing was, om ook eens zoiets optimistisch te lezen, want lees/hoor/zie eigenlijk alleen maar dingen zoals waar jij nu naar verwijst.