Mira Murati, CTO van OpenAI, heeft vandaag in een online presentatie het nieuwe model ChatGPT4o gedemonstreerd. Dat model rekent af met een aantal oude beperkingen en maakt nieuwe toepassingen mogelijk, waaronder realtime vertalen en uitleg geven over informatie op het scherm.
Een van de eerste zaken die Murati bekend maakte, was dat er een desktop app van ChatGPT komt. Daarmee krijgt ChatGPT4o (het laatste karakter is geen nul maar de letter o van Omnimodel) een eigen plek op de desktop, waardoor gebruikers niet meer naar een website hoeven. Bovendien is de user interface vereenvoudigd, zodat de interactie met de app vergemakkelijkt wordt.
ChatGPT4o is gebaseerd op ChatGPT4, maar is sneller en heeft verbeterde competenties op het vlak van tekst, video en audio. Het nieuwe model is een paradigmaverschuiving in de samenwerking tussen mens en machine, aldus Murati.
“Wanneer we met elkaar omgaan, zijn er veel dingen die we als vanzelfsprekend beschouwen. Je kent het gemak van onze dialoog als we elkaar onderbreken, de achtergrondgeluiden, de meerdere stemmen in een gesprek en het begrijpen van de intonatie. Al deze dingen zijn behoorlijk complex. Tot nu toe hadden we met onze spraakmodus drie modellen die werden gecombineerd om deze ervaring te leveren: transcriptie, intelligentie en text to speech. Nadeel van deze orkestratie is dat het veel vertraging in de ervaring oplevert en afbreuk doet aan de samenwerking met ChatGPT. Met GPT-4o gebeurt dit allemaal realtime,” legde Murati uit.
Afrekenen met latency
In de demo werd getoond hoe je ChatGPT4o kunt onderbreken en direct een nieuwe opdracht kunt geven. Tijdens de demo bleek de spraakrespons op gesproken opdrachten realtime of vrijwel realtime; er was niet of nauwelijks latency waarneembaar. Ook kan ChatGPT4o emoties in stemmen en gezichten herkennen – dus zowel in audio als video. De stem waarmee ChatGPT4o communiceert, kan ook – op verzoek – verschillende emoties laten horen. In de demo werd zelfs de opdracht gegeven om de laatste zinnen van een ter plekke bedacht spannend verhaal te zingen.
Betekenis voor de klantcontactsector

Voor de klantcontactsector is realtime over en weer vertalen van spraak (van Engels naar Italiaans en vice versa) een van de belangrijkste onderdelen die werd getoond. ChatGPT4o kan bovendien realtime interacteren met de inhoud van het beeldscherm waarop de desktop-app op actief is – denk aan het geven van uitleg over een grafiek of de betekenis van computercode. Ook dat biedt mogelijkheden voor een klantcontactomgeving.
Volgens Murati worden de nieuwe functies de komende weken uitgerold en komen ze beschikbaar voor alle gebruikers van ChatGPT.
Featured, Technologie



