Naar de hoofdinhoud

Als TenderB iets verzint — wat hallucinaties zijn, waarom ze gebeuren en hoe je met AI werkt zonder je vingers te branden

Soms zegt TenderB met volle overtuiging iets feitelijks — een adres, een naam, een capaciteit, een datum — en blijkt dat feit niet te kloppen. Soms blijft het ook na correctie fout staan.

E
Geschreven door Eden Noelle

Dit heet een hallucinatie, en het overkomt elk groot taalmodel: het onze, ChatGPT, Claude, Gemini, allemaal. Het is geen TenderB-specifieke bug, en het is niet helemaal weg te engineeren. Wat je wél kunt doen, is begrijpen hoe het werkt en AI zo inzetten dat je deze fouten vangt vóórdat ze in je aanbesteding belanden.

Het eerlijke verhaal in drie lagen

Drie eigenschappen die elke LLM heeft — inclusief de onze — verklaren waarom hallucinaties ontstaan:

1. Een LLM is een tekstvoorspeller, geen database. Hij vult plausibele woorden in op basis van patronen in trainingsdata. "Aldi + Groningen" zit zo sterk in zijn associaties dat hij bij een vraag naar het DC-adres een plausibel adres invult — ook als dat adres niet in jouw stakeholderlijst staat. Het model weet niet wat hij niet weet.

2. Zelfvertrouwen correleert niet met juistheid. Een mens die twijfelt klinkt anders dan een mens die zeker is. Bij een LLM hoor je dat verschil niet. Een hallucinatie heeft exact dezelfde toon als een correct antwoord. Dit is de gevaarlijkste eigenschap, omdat het je natuurlijke radar voor onbetrouwbaarheid uitschakelt.

3. LLM's zijn sycofantisch. Zeg jij met overtuiging "nee, Rembrandtlaan 2", dan beaamt het model dat. Zeg je "nee, Rembrandtlaan 5", idem. Dat is geen verificatie, dat is instemming. Als het model je correctie "bevestigt", controleert hij niets — hij gaat mee.

Wat dit betekent voor je werkwijze

AI is een uitstekende junior collega die nooit "ik weet het niet" zegt. Dat verandert de manier waarop je hem inzet.

Sterk in:

  • Structuur en opzet

  • Taal, toon, herschrijven, samenvatten

  • Synthese van wat in een door jou aangeleverd document staat

  • Ideeën genereren en eerste versies maken

  • Compliance-mapping van een concept tegen een gegeven criterium

Zwak in:

  • Feitelijke claims die niet expliciet in de bron staan — adressen, namen, bedragen, data, capaciteitscijfers, contactpersonen, specificaties

  • Alles wat in een rechtszaak verifieerbaar moet zijn

De praktische regel die we elke klant meegeven: als het een feit is dat in een rechtszaak verifieerbaar moet zijn, verifieer je het zelf tegen de bron. AI mag het opzoeken, samenvatten, in jouw huisstijl gieten — maar de eindcontrole is van jou.

Wat we als TenderB ertegenover zetten (en wat we níet beloven)

We beweren niet dat we hallucinaties hebben "opgelost". Niemand heeft dat. Wat we wél doen, is de werkomgeving zo inrichten dat de mens op de juiste momenten in de loop zit:

  • Retrieval tegen je eigen documenten. Het model put primair uit jouw projectbestanden en kennisbank in plaats van uit zijn training. Dat reduceert hallucinaties op projectspecifieke feiten drastisch — maar haalt ze er niet helemaal uit, vooral niet als een projectbestand over een vraag zwijgt en het model "iets moet invullen".

  • Bronvermelding per claim (in ontwikkeling). Per zin moet je kunnen zien waar het vandaan komt — en dus ook of het ergens vandaan komt.

  • Gespecialiseerde modellen voor analyse en schrijven, zodat de rolverdeling helderder is.

  • Incident-escalatie. Gesprekken zoals het gesprek dat dit artikel heeft veroorzaakt, gaan terug naar ons team. We kijken waarom het model niet zei "Aldi staat niet in uw stakeholderlijst", en gebruiken dat om de waarborgen aan te scherpen.

We blijven het gat verkleinen. We doen niet alsof het gat nul is.

De mindshift: gebruik AI zoals je een stagiair gebruikt

De zin die we in workshops gebruiken: "Je gebruikt AI zoals je een stagiair gebruikt — met enthousiasme voor het werk dat hij oplevert, en met verstand voor wat je controleert voordat het de deur uitgaat."

De fout met het Aldi-adres zou een stagiair óók kunnen maken. Het verschil: een stagiair wordt na drie keer corrigeren rood en houdt op met raden. Een LLM blijft beleefd doorraden. Dat moet je weten — dan kun je er productief mee werken.

Praktische checklist

Voordat een door AI geschreven passage uit jouw handen gaat naar een inschrijving, doe deze korte check:

  1. Markeer elk concreet feit in de passage: adressen, namen, bedragen, data, capaciteiten, contactpersonen, certificeringsnummers, regelgeving-verwijzingen.

  2. Vraag per feit: "Staat dit in één van de bronbestanden die ik aan TenderB heb gegeven?" Ja → open de bron en check teken voor teken. Nee → check tegen een primaire bron (de bedrijfssite zelf, het KvK-register, de officiële publicatie).

  3. Behandel instemming van de AI als nul bewijs. "Ja, u heeft gelijk" is geen verificatie. Dat is het model dat zich naar jouw toon voegt.

  4. Stapel geen correcties. Heeft TenderB hetzelfde feit twee keer in één gesprek fout? Probeer geen derde correctie. Open zelf de bron, plak het juiste feit in, en zeg tegen TenderB dat hij alleen die mag gebruiken.

  5. Bewaar de broncitaat naast de claim. Bouw de gewoonte: "claim + bron-plak-in". Dan hebben hallucinaties geen plek meer om zich te verbergen.

Was dit een antwoord op uw vraag?