Met GPT Builder, onderdeel van ChatGPT van OpenAI, kan iedereen met een betaald ChatGPT-account een ‘custom GPT’ maken. Leuk om mee te experimenteren, maar kan je zo’n ‘eigen GPT’ ook beschikbaar maken voor je medewerkers of klanten, bijvoorbeeld bij je FAQ’s of voor je chatbot? Nee, zeggen specialisten, gebruik liever de API van OpenAI.Â
GPT Builder, onderdeel van de algemeen verkrijgbare versie van ChatGPT, is een verleidelijk en laagdrempelig tool. Maar computerwetenschappers maken zich zorgen over de privacy. Zo zou een customized GPT gevoelig zijn voor het zichtbaar maken van de specifieke trainingsdata die de kern van een maatwerk-ChatGPT vormen. Hoewel bouwers van een aangepaste GPT gebaat zijn bij transparantie ten aanzien van het trainingsmateriaal, kan dat ook gegevens bevatten waarvan de ontwikkelaars willen dat die niet naar buiten komen.
Informatie terughalen
Jiahao Yu, een computerwetenschapper aan de Northwestern University, testte samen met collega’s meer dan 200 aangepaste GPT’s. Het bleek “verrassend eenvoudig” om er gevoelige informatie uit te halen die niet voor derden bedoeld is. Zo kon het team van Yu delen van bestanden ophalen systeemprompts extraheren. “Het team deed dit door zelf gebruik te maken van eenvoudige prompts waarvoor geen specialistische kennis nodig is op het gebied van prompt engineering of red-teaming (het nabootsten van tactieken en technieken van potentiële aanvallers – red.)”, aldus Yu.
KlantcontactGPT – Maatwerk-GPT’s zijn met ChatGPT heel eenvoudig te realiseren. Ook Ziptone waagde een poging en zette op basis van een betaald account bij OpenAI in nog geen half uur een goed werkende ‘KlantcontactGPT’ op. Deze maatwerk GPT-oplossing kreeg daarbij de instructie om bij het formuleren van antwoorden op vragen naar begrippen en definities uit het klantcontact-domein eerst naar het woordenboek van Ziptone en daarna naar de kennisbank van Ziptone te kijken. Daarnaast werd de laatste uitgave van het boek #Contact geüpload. Ook werden aanvullende instructies gegeven over hoe om te gaan met bepaalde prompts en concepten. Bovendien werd het vinkje verwijderd bij de optie ‘Use conversation data in your GPT to improve our models’.
Een custom GPT kan op drie manieren worden ingezet: voor persoonlijk gebruik, gebruik door personen die over een link beschikken en delen in het openbaar. In alle gevallen heeft de gebruiker een actief ChatGPT Plus-abonnement nodig. OpenAI heeft aangekondigd begin 2024 een GPT Store te openen waar alle openbare GPT’s zijn te vinden.
Wat verzamelt een maatwerk GPT?
Een maatwerk GPT-oplossing verzamelt invoergegevens van gebruikers, zoals vragen, antwoorden en mogelijk ook IP-adressen of gebruikers-ID’s. Wie (in Europa) een customized versie van ChatGPT bouwt die daarna algemeen beschikbaar wordt gesteld, moet bij de dataverwerking voldoen aan GDPR. Dat vraagt om specifieke maatregelen.
Nikos Karampinas, Software Engineer bij OBI4wan, legt uit dat alleen de generieke versie van ChatGPT4.0 de mogelijkheid biedt om een custom GPT te ‘ontwikkelen’. De custom GPT-variant kan je beperkt configureren, maar wel voorzien van instructies om de werking te beïnvloeden. Wat Karampinas betreft is de GPT Builder, in tegenstelling tot de API van Open AI – niet GDPR compliant. “OpenAI is gevestigd in de VS; ook hun servers staan daar en het is tevens de locatie waar data worden verwerkt. Voor bedrijven die actief zijn in Europa, betekent dit dat ze moeten voldoen aan de GDPR. Uiteraard moet je bij gebruik van een custom GPT een privacy policy opstellen, waarin je duidelijk uitlegt aan je gebruikers, hoe je omgaat met data, wat je er mee doet, en wat er meer gebeurt als data worden gedeeld met OpenAI.”
Het is verstandig om op dit vlak juridisch advies in te winnen, benadrukt Karampinas, want zowel de vereisten kunnen per gebruikstoepassing, per situatie en per organisatie verschillen.
Maak gebruik van ‘regex’
De combinatie van ChatGPT met de API van OpenAI biedt meer configuratiemogelijkheden om compliant te zijn. Daarnaast zijn er technische maatregelen die je kunt nemen, zoals het op voorhand uitsluiten dat bepaalde data niet naar OpenAI gaan. Dat kan je regelen via zogenaamde reguliere expressies (in IT-jargon: ‘regex’), een manier om patronen te beschrijven waardoor een computer softwarematig tekst kan herkennen. “Denk aan het herkennen van postcodes of BSN-nummers waarvan je niet wil dat ze op de servers van OpenAI terecht komen. Ook kan je op deze manier specifieke data anonimiseren. Dit filterproces kan je al laten uitvoeren door je eigen NLP-applicaties, nog voordat ChatGPT input krijgt,” legt Karampinas uit.
Via de API kan je uitsluiten dat OpenAI de data niet langer dan 30 dagen mag bewaren en niet mag gebruiken om het eigen LLM te trainen. Bij het standaard ChatGPT platform is dit precies omgekeerd, zo benadrukt Karampinas: je kunt ervan uitgaan dat jouw input bewaard wordt en trainingsmateriaal is. Juist daarom is GPT Builder niet compliant.
Het recht op vergeten
Het voorkomen dat data bij OpenAI belanden is een ding. Maar ingewikkelder wordt het als jouw klant, medewerker of eindgebruiker bepaalde GDPR-rechten zou willen uitoefenen. Denk aan het opvragen van persoonlijke gegevens die bij OpenAI zijn opgeslagen of het ‘recht om vergeten te worden’: het verwijderen van alle opgeslagen informatie over een gebruiker.
De algemene webversie van ChatGPT biedt enkele besturingselementen waarmee deze dingen handmatig kunnen worden geregeld. Wanneer je echter van de OpenAI API gebruik maakt, worden de gegevens 30 dagen bewaard of helemaal niet als je kiest voor ‘geen gegevensbehoud’. “Bij een inzage- of verwijderingsverzoek moet je ook zelf als organisatie kunnen ‘leveren’,” benadrukt Karampinas. ‘Je zult dus voorzieningen moeten treffen zodat je in je eigen logs relevante data kan terugvinden die je zelf hebt opgeslagen en bewerkt als onderdeel van het gebruik van ChatGPT.”
Maak gebruik van de API
Kortom: wie een custom GPT wil ontwikkelen en inzetten voor klanten of voor medewerkers, doet er verstandig aan de GPT Builder te negeren en te kiezen voor de API van OpenAI. Daarnaast: zorg voor een goed filter voordat data naar OpenAI gaan. En tot slot: beschrijf dit proces uitvoerig zodat je klanten weten hoe je te werk gaat. Alle drie de stappen zijn maatwerk: in het ene geval zal je meer eisen moeten stellen aan de data die de deur uitgaan dan in een ander geval.
Tips voor het inzetten van ChatGPT bij klantcontact
- Baken het werkgebied af. Geef duidelijk aan dat een maatwerk ChatGPT een AI-gestuurde chatbot is, die is ontworpen om informatie te verstrekken over een afgebakend onderwerpsgebied. Omschrijf dit gebied.
- Geef gebruikers instructies over hoe ze vragen moeten formuleren en geef uitleg over het type vragen dat ze kunnen stellen. Maak duidelijk wat de beperkingen van de kennis van de GPT zijn. Geef aan dat gebruikers geen gevoelige data over bedrijven of personen moeten invoeren.
- Biedt een supportkanaal of een escalatiemogelijkheid voor gebruikers die aanvullende vragen hebben of die vastlopen in het gebruik.
- Moedig gebruikers aan om feedback te geven over de kwaliteit van de antwoorden, wat helpt bij het verbeteren van de prestaties van de GPT.
- Formuleer een aparte privacy policy die omschrijft welke gegevens van de gebruikers tijdens hun interactie met je maatwerk GPT worden opgeslagen en verwerkt. Leg uit waar deze gegevens worden vastgelegd, voor welke tijdsduur en waarom. Beschrijf de beveiliging rondom de gegevensopslag. Besteed ook aandacht aan het beleid rondom het delen gegevens en maak duidelijk welke rechten de gebruiker heeft ten aanzien van verstrekte gegevens, waaronder het recht op toegang, correctie of verwijdering van hun gegevens. In de privacy policy moet ook omschreven zijn dat gebruikers zich ervan bewust zijn dat ze instemmen met de gebruiksvoorwaarden als ze de maatwerk ChatGPT gebruiken en geef opties voor gebruikers om zich af te melden. Informeer gebruikers over de manier waarop ze op de hoogte worden gehouden over veranderingen in de policy en hoe ze contact kunnen opnemen.
- Implementeer voorzieningen die het mogelijk maken om GDPR-compliant te zijn. Om gebruikers in staat te stellen controle te hebben over hun eigen gegevens (inzien, corrigeren of verwijderen) is het noodzakelijk om te werken met gebruikersidentificatie en -authenticatie en een backend systeem op te tuigen dat gebruikersgegevens kan ophalen. Daarnaast heb je een interface op je website nodig waar gebruikers een verzoek rondom hun gegevens kunnen indienen. Dat kan een formulier zijn of een e-mailadres, maar ook een onderdeel van de selfservice-pagina. Een verzoek tot inzage, aanpassing of verwijdering van ingevoerde gegevens moet volgens de GDPR binnen een maand worden gehonoreerd.
(Ziptone/Erik Bouwer)