Wie het onderzoek van de afgelopen jaren op een rijtje zet, ziet dat chatbots de afgelopen vijf jaar onvoldoende snel zijn verbeterd om aan klantverwachtingen te voldoen. Ze presteren ondermaats, zorgen tot frustraties en vaak is menselijke interventie nodig. We zetten het beschikbare onderzoek nog een keer op een rijtje.
De afgelopen maanden kwamen chatbots regelmatig in het nieuws. Zo was er onderzoek van zowel Wiep Hamstra en Jules Ernst als van de Nationale Voice Monitor. Beide onderzoeken lieten zien dat chatbots onbetrouwbaar kunnen zijn en een bron van frustratie.
Vanuit de klantcontactsector werd hier en daar meewarig gereageerd: logisch dat de telefoon het voorkeurskanaal is als chatbots niet goed functioneren. En het ‘uitzetten’ van slecht functionerende chatbots zou slechts symptoombestrijding zijn.
Ondertussen riep consumentenprogramma Radar consumenten op om tips de delen over hoe zij chatbots omzeilen. Niet veel later kondigde de Klantenservice Federatie aan om onderzoek te gaan doen naar hoe de kwaliteit van chatbots kan worden verbeterd.
Een paar jaar geleden pleitte customer‑experience‑expert Nienke Bloem voor een tweede generatie chatbots die relationeel is ontworpen en het klantbelang centraal stelt; bots zouden bijvoorbeeld proactief moeten terugbellen wanneer ze falen.
Beloften
“Sneller antwoord voor de klant en minder telefoontjes voor het contactcenter”, dat is vaak de belofte vanuit de leveranciers. Met als bonus: veel chatbots worden na elke interactie beter. Ondanks de gebrekkige prestaties zijn er voldoende prikkels om deze technologie te blijven (ver)kopen én in te zetten: omzet voor de een en besparingen voor de ander. Het ligt in ieder geval ‘niet aan de technologie’ als chatbots deze beloften niet waarmaken.
De verbeterslagen moeten dus aan de kant van CX-specialisten en contactcentermanagers plaatsvinden. Wat die verbeterslag zou moeten inhouden, wil de KSF met eigen onderzoek in kaart brengen. Wie de discussie rondom onderpresterende rulesbased chatbots heeft gevolgd, kan al enigszins uittekenen welke kant op het opgaat qua uitdagingen.
Nummer 1: de informatiehuishouding (met een gebrek aan governance, regie en eigenaarschap als problemen), nummer 2: de implementatie (te snelle uitrol, te weinig testen, te weinig resources voor beheer) Een succesvolle pilot is net altijd voldoende voor opschalen. En nummer 3: de verkeerde prikkels en verwachtingen.
Het vervelende voor de klant is dat ze alle drie onderling samenhangen. Als het contactcenter wil of moet scoren met kostenreductie, is de druk groot om de chatbot al vast aan het werk te zetten. Met een klein beetje training kan de bot immers al een aantal vragen gaan afvangen. De keerzijde van deze inside-out benadering is dat de klant of burger geen idee heeft wat de chatbot kan, maar wel verwachtingen heeft.
De contactcentermanager heeft ook verwachtingen, namelijk dat de chatbot snel beter wordt. Maar als het implementatieteam na de eerste weken weer iets anders op z’n bordje krijgt, wordt de chatbot (die net als een medewerker steeds moet worden bijgepraat over de laatste informatie) een kansloze missie.
Lessen trekken uit chatbot 1.0
Het potentieel is groot: er zijn veel rules-based chatbots die vervangen zouden kunnen worden door een betere AI-gebaseerde variant. De kunst is dan om bij de tweede generatie chatbots niet dezelfde fouten te maken als bij de eerste. Als de prikkels om snel te implementeren niet worden weggenomen, blijft ook chatbot 2.0 problematisch. Het zijn dus niet zo zeer de kennishuishouding en de snelle implementatie zelf, als wel de drijfveren die op orde moeten zijn. Is het doel te komen tot een betere (of eventueel gelijkblijvende) dienstverlening tegen lagere kosten, of is lagere kosten het primaire doel en mag dat ten koste gaan van de dienstverlening? Dat laatste is wat er nu gebeurt in gemeenteland.
Succesfactoren
Die samenhang van succesfactoren – informatiehuishouding, implementatietempo en verkeerde prikkels – is ook terug te vinden het onderzoek van het Smooth Operators‑programma (van de universiteiten Utrecht, Tilburg en VU). De onderzoekers stellen dat organisaties vaak alleen naar callreductie kijken, terwijl metrics als gesprekskwaliteit en bruikbaarheid veel relevanter zijn.
Door de wol geverfde chatbot-gebruikers begrijpen dat als een chatbot vandaag goed werkt, dat niet betekent dat hij morgen ook goed werkt. Een chatbot moet voortdurend worden bijgewerkt om relevant te blijven. KPN meldde bijvoorbeeld dat de generatieve chatbot Dot voor ongeveer 10% callreductie zorgt en een derde van de opgestarte sessies zelfstandig afhandelt. Maar handmatige kwaliteitscontroles blijven noodzakelijk en kennisvoorziening is een bottleneck, aldus KPN.
Zelflerend? Vergeet het maar
Het idee dat chatbots vanzelf steeds beter worden, wordt door de feiten weerlegd. In de afgelopen vijf jaar laten verschillende onderzoeken zien dat chatbots tekortschieten. Sinds 2021 is het beeld tamelijk consistent: het tempo waarmee chatbots worden uitgerold ligt hoger dan de snelheid waarmee de prestaties en waardering omhooggaan. Hoewel de belofte van chatbots een afname van klantcontact via de telefoon of andere ‘dure’ kanalen is, blijft onderbelicht wat de negatieve opbrengsten van chatbots zijn. Dit is dan ook iets wat opgepakt zou moeten worden in gedetailleerd onderzoek: wat is de impact op klantbeleving en op het contactcenter als chatbots ondermaats presteren?
In de hiernavolgende twee delen gaan we in op onderzoek over zowel de prestaties van chatbots als de klantvoorkeuren inzake chatbots.
Wat zegt onderzoek over de prestaties van chatbots?
In een telecomonderzoek gaf 66% van de klanten het gebruik van chatbots het rapportcijfer 1 (op een schaal van 1 tot 5); een enquête van de Consumentenbond (2021) stelde vast dat 66% van meer dan 10.000 deelnemers ontevreden is over chatbots en slechts 10% vertrouwen heeft in de technologie.
Een internationaal onderzoek onder 1.700 consumenten, in 2022 uitgevoerd door contactcenterplatform UJET, toont dat 80% van de chatbotgebruikers na een gesprek méér frustratie ervaart. 78% voelde zich genoodzaakt om alsnog een medewerker te contacteren omdat de chatbot het probleem niet oploste en bijna driekwart vond het gebruik van een chatbot ‘verspilde tijd’. Meer dan de helft van de respondenten meent dat bellen met een medewerker het snelst tot een oplossing leidt.
Een onderzoek uit 2022 van Cyara laat zien dat 80 procent van de klanten ervaart dat chatbots geen antwoord kunnen geven op eenvoudige vragen. 76 procent meldt dat ze worden doorgestuurd naar een medewerker en vervolgens alles opnieuw moeten uitleggen. 76 procent zegt dat het gebruik van de chatbot te veel tijd kost. Twee derde (65 procent) zegt dat het gesprek onvoldoende relevant is voor het werkelijke probleem.
In State of Chatbots and Conversational AI (2023), georganiseerd en gesponsord door TeamDynamix en gepubliceerd in InformationWeek, spreken IT‑professionals zich uit over de inzet van chatbots in de IT‑servicemanagement (ITSM). Het gaat hier weliswaar om een kleine respondentengroep (N=98), voornamelijk CIO/CTO of VP IT en helpdesk‑ of ITSM‑managers. Slechts 5% van de respondenten gaf aan dat hun chattool meer dan de helft van de interacties oplost, maar 40% verwachtte dit niveau in 2026 te halen. Iets minder dan de helft (48%) vindt dat de tools vragen niet goed oplossen of de intentie verkeerd interpreteren, en 38 % noemt het beheer tijdrovend doordat de bots niet zelflerend zijn. Bijna een op de drie IT‑afdelingen moet intent/antwoord‑paren nog handmatig invoeren. Respondenten noemen als top‑oorzaken voor falende gesprekken het niet begrijpen van de vraag (61%), foutieve of onnauwkeurige antwoorden (45%) en onvoldoende begrip van natuurlijke taal (43%).
In 2023 bleek uit de Nationale Voice Monitor dat slechts 10% van de Nederlanders vertrouwen heeft in chatbots (tegenover 64% in menselijke medewerkers).
Uit het vervolgonderzoek van de Nationale Voice Monitor 2024 bleek dat nog maar 8% van de consumenten enthousiast is over chatbots en dat eveneens 8% van de chatbotvragen correct wordt beantwoord; slechts 1% van de consumenten prefereert geautomatiseerde chat. Qua rapportcijfer eindigen menselijke gesprekken (telefonisch of livechat) op een 8 of hoger, terwijl chatbots een 5 of lager haalden.
Een onderzoek van Conclusion Mission Critical (2025) onder 1.012 Nederlanders laat zien dat 68% vindt dat geautomatiseerde systemen (waaronder chatbots) goed werken. Meer dan de helft (51%) heeft liever snel antwoord van een chatbot dan lang wachten, maar 48% ergert zich aan slecht functionerende bots.
In 2025 constateren Wiep Hamstra en Jules Ernst dat de 36 gemeentelijke chatbots die zij aan een reeks vragen onderwierpen, zelfs op eenvoudige vragen – zoals openingstijden – foute antwoorden geven of naar webpagina’s verwijzen zonder antwoord.
In een analyse van meer dan veertig chatbots op B2B websites rapporteerde het rapport Death by Chatbot (2025) dat bij 15% van de gesprekken het probleem onopgelost bleef, dat 86% van deze sessies alsnog moest worden overgedragen aan een mens, en dat gemiddeld slechts vier tot zes berichten werden uitgewisseld voordat gebruikers gefrustreerd raakten. Meer dan de helft van de gebruikers achtte de bots onbetrouwbaar, aldus een rapport van chatbotplatform Breakout AI.
In 2026 werd het onderzoek van Hamstra en Ernst herhaald en bleek dat de prestaties van gemeentelijke chatbots eerder achteruit waren gegaan dan vooruit.
De ontwikkelaars van Gem erkenden daarop dat chatbot Gem fouten maakt, maar benadrukken dat hij toch circa 62% van de vragen beantwoordt. En tot slot: de resultaten van de laatste editie van de Nationale Voice Monitor (2026) laten zien dat de chatbot als contactkanaal geen verbetering heeft geboekt: slechts in 12% van de gevallen krijgen consumenten een bruikbaar antwoord.
Wat zegt onderzoek over klantvoorkeuren en ervaringen met chatbots?
Uit onderzoek van de Nationale Voice Monitor 2024 onder Nederlandse consumenten blijkt dat de telefoon nog altijd het voorkeurskanaal is; slecht functionerende chatbots (40 %) horen tot de top drie frustraties. Chatbots worden nuttig gevonden voor simpele vragen, maar als onpersoonlijk ervaren.
Van 5.728 ondervraagde Amerikaanse consumenten geeft 64% te kennen bij de klantenservice liever geen gebruik te maken van chatbots of AI, aldus Gartner (2024).
CivicScience (2024) liet zien dat 45% van de Amerikaanse volwassenen chatbots onaangenaam vindt; slechts 19% is positief gestemd. 43% van de Amerikaanse volwassenen belt liever, slechts 17% gebruikt bij voorkeur chat of chatbots. Van de ondervraagden die een chatbot gebruikten, vond 44% deze nuttig; in 2022 was dat 34%.
Volgens een enquête onder 600 Amerikaanse consumenten uitgevoerd door Acquire AI (2024) zijn consumenten zijn 2,5 keer positiever over een gesprek met een mens (82% positief) dan met een bot (33% positief); ongeveer 5 % verkiest bots boven mensen. En uit een onderzoek van SurveyMonkey (2025) kwam naar voren dat vier op de vijf Amerikaanse consumenten (79%) de voorkeur geeft aan menselijke interactie boven een AI agent.
Conclusies
Na vijf jaar ‘chatbots in klantcontact’ is het beeld consistent: de prestaties stijgen niet tot nauwelijks mee met de verwachtingen. De problemen rond chatbots liggen niet primair bij de technologie, maar in de manier waarop organisaties chatbots inzetten. De druk om snel te implementeren en te besparen heeft geleid tot structureel onderpresterende oplossingen die klanten frustreren en het telefoonkanaal juist zwaarder belasten.
De overstap naar generatieve AI brengt dezelfde risico’s met zich mee. Wie bij chatbot 2.0 opnieuw kiest voor snelheid boven kwaliteit, een gebrekkige informatiehuishouding voldoende acht en succes meet in callreductie in plaats van klantbeleving, komt over vijf jaar terecht in een vergelijkbaar overzicht als dit.
De vraag voor contactcentermanagers en CX-directeuren is niet óf ze overstappen op AI-agents, maar of ze van te voren eerlijk willen zijn over het primaire doel van de tweede generatie chatbots: is het doel betere dienstverlening, of goedkopere dienstverlening?
(Ziptone/Erik Bouwer)
Customer Experience, Featured


