Spraakherkenningsmodellen hebben aan kwaliteit gewonnen, maar zijn in hun functioneren nog steeds afhankelijk van zaken als spreektempo, achtergrondgeluid, accenten en jargon. De Israëlische startup aiOla zegt hier een oplossing voor te hebben.
Jargonic is de naam van de nieuwe spraakherkenningsoplossing voor zakelijk gebruik. Het model zou moeten kunnen omgaan met jargon, lawaaierige omgevingen en een breed scala aan accenten. Om het jargon toe te voegen kunnen gebruikers volstaan met het aanleveren van een lijst met termen. De oplossing hoeft niet getraind te worden, maar gebruikt een eigen trefwoordzoeksysteem.
In benchmarktests liet Jargonic een gemiddelde woordfoutmarge (WER) van 5,91% zien in vier toonaangevende Engelse academische datasets, waarmee het beter presteerde dan concurrenten zoals Eleven Labs, Assembly AI, OpenAI’s Whisper en Deepgram Nova-3. Er zijn nog geen benchmarkdata beschikbaar voor OpenAI’s GPT-4o-transcribe, dat half maart werd gelanceerd.
Volgens het bedrijf daalt de herkenningsnauwkeurigheid vaak met 20% wanneer er intensief gebruik wordt gemaakt van zwaar jargon. Jargonic zou in die situatie op een nauwkeurigheid van 95% uitkomen. (aiOla)
Technologie



