AI in het contactcenter: grip houden op de token-factuur

by Ziptone

AI in het contactcenter: grip houden op de token-factuur

by Ziptone

by Ziptone

Beeld: Ziptone/AI

In het eerste deel van dit tweeluik over de kosten van GenAI in klantcontact bespraken we hoe AI-kosten zijn opgebouwd. In dit tweede deel gaan we concreter in op de hoogte van die kosten – wat betaal je per toepassing?

 

In dit artikel:

  • niet alle tarieven zijn zichtbaar;
  • de ene AI-toepassing kost meer dan de andere AI-toepassing;
  • tips om de verbruikskosten van AI in klantcontact te beheersen.

Aanbieders van AI-tools brengen hun kosten in rekening op basis van aantallen tokens, soms in combinatie met vereiste licenties of afnamepakketten. Het verbruik van tokens varieert per AI-toepassing en hangt af van onder meer de lengte en complexiteit van prompts en de lengte van de output/respons. Een korte respons kan nog steeds relatief duur zijn als de prompt of de verwerking daarvan veel tokens vereist. En tot slot kan de inzet van technieken zoals RAG of het betrekken van zware zoekopdrachten en (tekst)bestanden in prompts de kosten opdrijven. Disclaimer: de tarieven van LLM-providers – de grondstoffenleveranciers – kunnen zich de komende tijd sterk ontwikkelen.

Niet alle prijskaartjes zijn zichtbaar

Welke bedragen brengen aanbieders in rekening bij verschillende toepassingen? Niet alle aanbieders van AI-oplossingen hebben hun prijzen online staan. Vaak worden kosten in rekening gebracht op basis van het verbruik (in bundels), waarbij voor verschillende toepassingen verschillende bundels en kostensoorten bestaan.

Enkele voorbeelden: reken 0,6 dollarcent voor een gesprekssamenvatting en ga uit van twee dollarcent per chatbotgesprek (50 gesprekken in één token van 1 dollar bij bulkafname van tokens). Ook tarieven van 72 dollarcent voor een chatbotdialoog van begin tot eind komen voor. Omgerekend komen chatsessies bij OpenAI neer op 1 dollarcent voor vijf tot tien sessies.

Een voicebotdienst is duurder dan een gesprekssamenvatting

Beeld: Ziptone/AI

Bij de inzet van voicebots en spraakherkenning gaan de kosten per sessie omhoog en wordt er per gespreksminuut gerekend, met kosten van enkele dollarcenten per minuut. Ook realtime agent assist toepassingen en analytics toepassingen zijn vaak iets duurder en worden ook regelmatig op basis van een flat fee per agent aangeboden, al dan niet als add-on op bepaalde pakketten van CCaaS-aanbieders. Soms zijn er gecombineerde tarieven: een starttarief per agent of seat per jaar en daar bovenop verbruikskosten per gesprek. Ondanks verschillende modellen (per minuut, per bericht, per sessie of per agent), liggen de variabele kosten voor agent-assist tussen enkele centen tot enkele dubbeltjes per interactie.

De inzet van GenAI-toepassingen verhoogt de totale kosten van een klantcontact met minimale bedragen: enkele centen tot enkele dubbeltjes. Daar tegenover staan besparingen per interactie die al snel oplopen tot meerdere euro’s. Wil de claim van Gartner, dat een AI-gesprek duurder zou kunnen worden dan het commercieel uurtarief van een menselijke agent uit een lagelonenland (rond de 12 euro) werkelijkheid worden, dan moeten de kosten van AI-toepassingen met duizenden procenten stijgen.

Hoe worden tokens gefactureerd?

  • de kosten kunnen per interactie (chatbotgesprek, telefoongesprek, geautomatiseerde samenvatting, gespreksanalyse) in rekening worden gebracht;
  • soms worden starttarieven per interactie berekend;
  • soms worden jaarlijkse licentiekosten plus maandelijkse verbruikskosten in rekening gebracht;
  • veel aanbieders factureren tokens per volume (duizend, een miljoen) ofwel in pakketten van verschillende formaten;
  • op basis van input (de prompt) of output (de respons van een LLM). Sommige API’s combineren beide kosten;
  • soms zijn er limieten voor het aantal gecombineerde tokens (input en output) en gaan de kosten omhoog als deze grens wordt overschreden;
  • er kan worden gefactureerd op feitelijk verbruik;
  • er kan per maandelijkse bundel worden gefactureerd;
  • de factuur kan uit een combinatie van bundels en extra kosten (zoals bij een belbundel) bestaan;
  • sommige pakketten worden vooraf betaald (prepaid).

Hoe kun je sturen op kosten?

  • bewustwording: gebruikers zo veel mogelijk inzicht geven in de kosten;
  • gebruik maken van dynamic model switching: voorzieningen die ervoor zorgen dat wordt aangestuurd op het gebruik van goedkope modellen en dat duurdere modellen alleen worden ingezet voor complexe taken;
  • optimaliseren van prompts door prompt trimming: het inkorten van prompts zonder aan effectiviteit in te boeten;
  • content (kennisbanken et cetera) optimaliseren voor RAG en AI-toepassingen, denk aan het opknippen van grote kennisdocumenten in kleinere delen;
  • prompt caching, waarmee je het aantal API-calls voor terugkerende AI-prompts kunt beperken;
  • softwarematige beperkingen opleggen aan de promptlengte;
  • AI gateways die de kosten van het gebruik van verschillende LLM’s bijhouden;
  • maatwerk-software toepassen met deterministische regels voor workflows waarbij AI specifieke, afgebakende opdrachten krijgt (custom rule engines);
  • vooraf gebruikmaken van kostencalculators zoals pricepertoken.com;
  • achteraf gebruik maken van tools zoals Stripe Metered Billing, Helicone of LangSmith.

Ontsporende kosten?

Kosten die dreigen te ontsporen? Dat lijkt tot nu toe vooralsnog mee te vallen. De cijfers van dit moment laten zien dat GenAI per interactie nog altijd een fractie kost van wat het oplevert aan efficiencywinst: veelal gaat het om kortere en/of betere gesprekken.

Bij die productiviteitswinst valt ook een kanttekening te plaatsen. De inzet van GenAI in klantcontact is niet voor iedere medewerker per definitie een verbetering. Daarnaast staat de klantcontactsector aan het begin van een complexere fase. Als agentic AI wordt opgepakt in klantcontact, stijgen de governance- en validatiekosten. Dat maakt het belang van een strak kostenraamwerk – met monitoring, prompt-optimalisatie en heldere afspraken met leveranciers over facturering – groter.

Kijk voor de kosten naar aparte use cases

Beeld: Ziptone/AI

Voor contactcentermanagers begint het inzetten van AI dan ook niet bij de vraag welk model het goedkoopst is, maar bij de vraag welke toepassing in de praktijk bestuurbaar, schaalbaar en rendabel is en blijft. Dat laatste is vooral relevant omdat de LLM’s zich nog steeds verder ontwikkelen en er in de toekomst mogelijk andere tarieven kunnen komen. Daarbij verschillen de kosten van AI-toepassingen voor klantcontact bovendien sterk per use case: een samenvattingstool na afloop van een gesprek heeft een heel ander kosten- en risicoprofiel dan een voicebot aan de voorkant of een agent assist-toepassing die tijdens live gesprekken meeluistert en suggesties doet.

Gezien de verschillen tussen use cases ligt het voor de hand om te werken met verschillende businesscases en budgetten, waarbij bewaakt moet worden dat succesvolle toepassingen ongemerkt gaan zorgen voor sterk oplopende kosten. Een goede houvast hier is uiteraard (per use case) een koppeling van de kosten met aantoonbare opbrengsten. Ofwel metrics en KPI’s voor de inzet van AI.

Ook metrics en KPI’s per use case

Metrics (bedoeld om het proces te monitoren) en KPI’s (bedoeld om bij te houden of je je strategische doelen bereikt) verschillen per use case. Bij geautomatiseerd samenvatten ligt de nadruk vaak op reductie van ‘after call work’. Bij agent assist kan het gaan om een kortere afhandeltijd, hogere kwaliteit, minder fouten en betere ondersteuning van nieuwe medewerkers. Bij chatbot- en voicebottoepassingen draait het eerder om deflection rates of het percentage vragen dat een AI-bot een klantvraag autonoom oplost, escalatiepercentage, herhaalcontact, klanttevredenheid en first time resolution.

Lage kosten per interactie is niet hetzelfde als lage kosten voor de gehele klantcontactoperatie.

De KPI’s brengen ons terug bij de opbrengstenkant, dat deel van de inzet van AI dat meestal goed zichtbaar is in klantcontact. De kosten die daar tegenover staan, zijn diffuus. Lage kosten per interactie is niet hetzelfde als lage kosten voor de gehele klantcontactoperatie. In het eerste deel werd zijdelings melding gemaakt van de kosten voor churn door een slechte chatbot. Een agent assist-toepassing die voortdurend moet worden gecorrigeerd, levert in eerste instantie niet alleen minder op dan verwacht, maar kan ook tot frustraties bij medewerkers leiden.

Kortom, alle redenen om bij de inzet van AI in klantcontact verder te kijken dan de kosten per token en het aantal seconden of minuten dat bespaard kan worden op de AHT.

(Ziptone/Erik Bouwer)

Lees ook deel 1 van dit artikel: 

Opbrengsten van AI? Check. Maar wat zijn de kosten van AI in klantcontact?

Follow by Email
Whatsapp
LinkedIn
Share

Ook interessant

Featured, Kennisbank, Technologie

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Top