Een nieuwe AI-tool voor het klonen van stemmen van een Brits bedrijf beweert een reeks Britse accenten nauwkeuriger te kunnen reproduceren dan sommige van zijn Amerikaanse en Chinese concurrenten. Dat meldt de BBC.
Omdat veel van de gegevens die traditioneel worden gebruikt om AI-producten met stemmen te trainen, afkomstig zijn uit Noord-Amerika of Zuid-Engeland, klinken veel kunstmatige stemmen vaak hetzelfde. Om dit tegen te gaan, heeft het bedrijf Synthesia een jaar lang gewerkt aan het samenstellen van een eigen database met Britse stemmen met regionale accenten, door mensen in studio’s op te nemen en online materiaal te verzamelen.
Volgens Synthesia zijn klanten op zoek naar nauwkeurigere regionale weergaven. Zo zouden consumenten problemen hebben met synthetische stemmen omdat daar bepaalde standaarden in voorkomen waardoor ze minder echt lijken. Datasets die worden gebruikt, zijn vaak een weerspiegeling van een specifieke bevolkingssamenstelling. Daardoor vallen regionale accenten juist weg.
Het omgekeerde komt ook voor: spraakherkenners die, doordat ze te eenzijdig getraind zijn, moeite hebben met verschillende accenten. De BBC noemt ook de aanpak van Sanas die tools voor callcenters ontwikkelt waarbij de accenten van Indiase en Filipijnse medewerkers worden weggepoetst. Synthesia wil met de regionale accenten juist inspelen op het feit dat het voortbestaan van meer dan de helft van de ruim zevenduizend talen wordt bedreigd. Minder dan 2 procent wordt bijvoorbeeld ondersteund door Google Translate; die score is nog lager bij GPT-4. (BBC)
Technologie


