Begrijpt een AI-bot daadwerkelijk wat ik bedoel?

Nee, technisch gezien is dat een illusie. Wat wij ervaren als begrip, is een geraffineerde 'lachspiegelpaleis van statistiek'. De AI begrijpt concepten niet zoals wij dat doen, maar zet woorden om in reeksen getallen (embeddings). Op basis daarvan berekent het razendsnel wiskundige relaties en statistische waarschijnlijkheden, waardoor het een voorspellingsmachine is, geen bewust wezen.

Waarom maakt een AI soms rekenfouten, terwijl computers van nature goed zijn in rekenen?

Omdat grote taalmodellen (LLM's) niet ontworpen zijn voor deterministische logica (waarbij 2+2 altijd 4 is), maar voor waarschijnlijkheid. Ze berekenen het antwoord niet, maar proberen te voorspellen welk getal statistisch het meest waarschijnlijk volgt op de reeks woorden. Deze op correlatie gebaseerde aanpak leidt vaak tot fouten bij complexe sommen.

Hoe kan een AI lange teksten onthouden en samenvatten zonder de draad te verliezen?

Dit komt door de Transformer-architectuur en het zogeheten attention-mechanisme. In plaats van de tekst woord voor woord te lezen (als door een rietje), bekijkt het model de hele tekst in één keer. Het berekent gelijktijdig de relevantie tussen alle woorden, waardoor het verbanden kan leggen over lange afstanden binnen de tekst.

Logica faalt, AI ziet nu patronen

Waarom je denkt dat een AI-bot plotseling begrijpt wat je bedoelt

We leven met een hardnekkig misverstand over wat computers doen. Vraag een willekeurige voorbijganger hoe een computer werkt, en het antwoord draait bijna altijd om ‘rekenen’. We zien de processor als een briljante wiskundige die binaire berekeningen maakt met razendsnelle snelheid: nullen en enen, strikte logica, zwart of wit. Als A gebeurt, volgt B. Dit beeld van de computer als ultieme rekenmachine klopte decennialang. Maar precies dit beeld staat ons nu in de weg om te begrijpen waarom kunstmatige intelligentie plotseling zo menselijk aanvoelt.

De werkelijkheid is verrassend: de moderne grote taalmodellen (LLM’s) die ons dagelijks verbazen, zijn juist behoorlijk slecht in dat traditionele rekenwerk. Vraag een taalmodel om een complexe optelsom en de kans is groot (medio 2025) dat het struikelt. Waar ze wél in uitblinken, is iets wat voor een machine eerder onmogelijk leek: het vangen van nuance. Dit is niet alleen een triomf van snellere processoren, maar van een fundamentele verschuiving in strategie: we zijn overgestapt van logisch redeneren naar probabilistisch denken, een weerspiegeling van bredere trends in AI.

Door een rietje kijken, de oude manier

Om deze sprong te waarderen, moeten we terug naar hoe ‘oudere’ systemen tekst lazen. Tot voor kort werkten taalmodellen strikt sequentieel. Je kunt dit vergelijken met een boek lezen door een rietje. Je ziet woord één, dan woord twee, dan woord drie.

Stel dat een computer de zin leest: “De man die zijn sleutels was vergeten, kon zijn huis niet binnenkomen.”

Een traditioneel model moest de informatie van “De man” onthouden terwijl het zich een weg baande door “die zijn sleutels was vergeten”. Tegen de tijd dat het model bij “kon zijn huis niet binnenkomen” aankwam, was de context van die eerste woorden vaak al vervaagd in het geheugen. Dit seriële proces is traag en foutgevoelig bij lange teksten. Het model ‘begreep’ de zin niet als geheel, maar als een rij dominostenen die één voor één moesten omvallen.

De Transformer, alles meteen op tafel

De revolutie begon in 2017 met de introductie van de Transformer-architectuur [1]. Dit veranderde alles. In plaats van door een rietje te kijken, legt een Transformer de hele tekst meteen open op tafel.

Het geheim hierachter heet het attention-mechanisme. Dit is de motor die het mogelijk maakt om niet alleen woorden te zien, maar ook de onzichtbare draden ertussen. Wanneer een LLM een zin verwerkt, berekent het voor elk woord hoe relevant alle andere woorden in die zin zijn. Het kijkt niet naar de volgorde, maar naar de relatie.

Neem het klassieke voorbeeld van ambiguïteit: “De bank stond op de oever van de rivier.”

Een oud model zou twijfelen. Is “bank” hier een zitmeubel of een financiële instelling? Een Transformer ziet echter direct de woorden “rivier” en “oever” verderop in de zin. Via het attention-mechanisme krijgen die woorden een zwaarder gewicht in relatie tot het eerste woord “bank”. De AI-bot negeert de betekenis van ‘financiële instelling’ en begrijpt direct, zonder menselijke tussenkomst, dat het om een geografisch object gaat. Dit vermogen om context over lange afstanden in een tekst vast te houden, is waarom deze modellen plotseling lange artikelen kunnen samenvatten zonder de draad te verliezen.

Voorspellen is niet rekenen

Toch is de architectuur maar het halve verhaal. De echte paradigmaverschuiving zit in het doel van de machine. Hier wordt het voor velen abstract.

Traditionele computers zijn gebouwd voor determinisme. Ze voeren binaire logica uit. 2 + 2 moet altijd 4 zijn. Er is geen ruimte voor discussie of interpretatie. Het is goed of het is fout.

LLM’s werken fundamenteel anders. Hun doel is niet precisie, maar waarschijnlijkheid. Een AI-assistent is in de kern een ongelooflijk geavanceerde voorspellingsmachine. Het probeert niet het ‘juiste’ antwoord te berekenen op basis van logische wetten; het probeert te voorspellen welk woord statistisch het meest waarschijnlijk volgt op de reeks woorden die het net heeft gezien.

De machine redeneert niet: “Omdat A waar is, moet B waar zijn” (causale deductie). In plaats daarvan ziet het patronen: “In 99% van de teksten waarop een LLM is getraind, volgt woord B na deze context.” Deze vorm van automatisering is gebaseerd op correlatie, niet op het begrijpen van oorzaak en gevolg. Dat klinkt als een zwakte, maar bij taal, die per definitie vloeiend en ambigu is, is dit juist een enorme kracht. Taal laat zich niet vangen in binaire regels, maar wel in statistische patronen.

De taal van getallen: embeddings

Maar hoe ‘ziet’ een computer die patronen? Het leest immers geen Nederlands of Engels. Voordat een AI-bot iets met je tekst doet, vindt er een vertaling plaats naar de enige taal die machines werkelijk spreken: getallen.

Dit proces heet het creëren van embeddings [2]. Elk woord (of deel van een woord) wordt omgezet in een lange reeks getallen, een zogeheten vector. Je kunt dit zien als coördinaten in een gigantische, multidimensionale ruimte.

Het fascinerende is dat de betekenis van woorden vastligt in hun positie in die ruimte. Woorden die qua betekenis op elkaar lijken, zoals “hond” en “pup”, krijgen coördinaten die dicht bij elkaar liggen. Woorden die niets met elkaar te maken hebben, liggen ver van elkaar af. Het LLM voert daarna razendsnelle matrixberekeningen uit op deze vectoren. Hier komen de krachtige GPU’s (graphics processing units) om de hoek kijken [3]. Zij kunnen deze complexe, parallelle berekeningen uitvoeren op een schaal die voorheen ondenkbaar was.

Door te rekenen met de afstand en richting tussen deze vectoren, kan het model verbanden leggen die voor ons logisch aanvoelen, maar voor de machine pure wiskundige nabijheid zijn. Het ‘snapt’ niet wat een pup is, maar het weet wiskundig precies waar ‘pup’ zich bevindt ten opzichte van ‘hond’.

De illusie van intelligentie

Is dit dan intelligentie? Dat is een filosofische vraag, maar technisch gezien kijken we naar een lachspiegelpaleis van statistiek. Omdat het model getraind is op een onvoorstelbare hoeveelheid tekst (praktisch het hele publieke internet), zijn de voorspellingen zo accuraat geworden dat ze niet meer te onderscheiden zijn van menselijk inzicht.

De kracht van deze technologie zit in de combinatie: de Transformer-architectuur die parallelle verwerking mogelijk maakt, gekoppeld aan het probabilistische model dat rigide logica loslaat. Dit stelt ons in staat om samen te werken met systemen die niet alleen onze opdrachten uitvoeren, maar ook lijken aan te voelen wat we bedoelen.

De volgende stap in innovatie is niet dat deze modellen beter leren rekenen, maar dat wij beter leren hoe we deze statistische motoren kunnen aansturen. We hebben geen superrekenmachine gebouwd, maar een universele vertaler van menselijke patronen. En in die vertaling ligt de sleutel tot het oplossen van vraagstukken die voor binaire logica altijd onbereikbaar bleven.

Gerelateerde signalen

World Models, Beyond Autoregressive Illusions - Laat zien waarom grounding en latente simulatie ertoe doen wanneer next-token-voorspelling geen echte causaliteit kan modelleren.
AI Tokens: The Secret Economics - Legt de tokenisatie- en prijsmechanismen uit die bepalen waarom LLM’s waarschijnlijkheid optimaliseren, niet deterministische berekening.
AI Costs Plummet 1000% As Tech Giants Race to Zero - Verbindt probabilistische inferentie met de race in hardware en software die AI-output steeds goedkoper maakt.

Referenties

[1] Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez AN, et al. Attention Is All You Need. arXiv. 2017. https://arxiv.org/abs/1706.03762

[2] Mikolov T, Sutskever I, Chen K, Corrado GS, Dean J. Distributed Representations of Words and Phrases and their Compositionality. arXiv. 2013. https://arxiv.org/abs/1310.4546

[3] NVIDIA. What Is a GPU and How Does It Work? NVIDIA Blog. https://www.nvidia.com/en-us/geforce/news/what-is-a-gpu/