Tot nu toe was spraakherkenning afhankelijk van cloudservers en complexe software. Twentse onderzoekers hebben laten zien dat het ook anders kan. Ze combineerden een Reconfigurable Nonlinear Processing Unit (RNPU), ontwikkeld aan de Universiteit Twente, met een nieuwe IBM-chip.
Samen verwerken deze apparaten geluid net zo soepel en dynamisch als het menselijk oor en brein. In tests bleek deze aanpak minstens zo nauwkeurig als de beste softwaremodellen – en soms zelfs beter. Prof. Wilfred van der Wiel en collega’s slaagden er in hun resultaten vorige week gepubliceerd te krijgen in het prestigieuze wetenschappelijke tijdschrift Nature.
De vinding gaat uit van het principe van edge computing: input daar verwerken waar het wordt opgevangen (dus dicht bij de sensor). Hiermee kan worden bespaard op tijdrovende, onveilige en kostbare communicatie met een gecentraliseerde computerfaciliteit of cloudomgeving. Moderne processors kunnen echter vaak niet voldoen aan de beperkte stroom- en tijdbudgetten van edge-systemen.
Hier hebben de onderzoekers nu een oplossing voor gevonden, onder meer door ‘in materia computing’ toe te passen. Hierbij worden berekeningen niet in een processor uitgevoerd (CPU/GPU) aan de hand van data die in een apart geheugen staat, maar worden de fysische eigenschappen van het materiaal zelf gebruikt om berekeningen uit te voeren. Bijvoorbeeld door ervoor te zorgen dat die materialen zelf direct reageren op inputsignalen (bijvoorbeeld spraak, spanning, licht, magnetische velden). Daarbij vormt de reactie zelf de basis voor de berekening, waardoor er geen aparte rekenstappen nodig zijn in een processor.
Latency minder dan een milliseconde
Het voordeel van deze nieuwe technologie is een enorme tijdbesparing, omdat verwerking vrijwel onmiddellijk gebeurt. De onderzoekers van de Universiteit Twente hebben een latency gerealiseerd van minder dan een milliseconde. Dit maakt de toepassing geschikt voor realtime scenario’s waarbij milliseconden of zelfs microseconden bepalend zijn voor het succes.
De onderzoekers zelf wijzen op toepassingen zoals hoortoestellen die bijna geen energie verbruiken, spraakassistenten die geen gegevens meer naar de cloud sturen, of auto’s met directe spraakbesturing. “Dit is een nieuwe manier van denken over intelligentie in hardware”, zegt prof. Wilfred van der Wiel. “We laten zien dat het materiaal zelf kan worden getraind om te luisteren.”
Vooral in realtime spraakvertalen is de latency op dit moment nog het belangrijkste obstakel voor grootschalige toepassing. In traditionele VoIP-systemen wordt een latency van 20–150 milliseconden als algemeen aanvaardbaar gezien; voor realtime spraakvertalen gelden vergelijkbare waarden als grens voor een succesvolle toepassing. Met de vinding van het team van Van der Wiel zou in een keer afgerekend kunnen worden met die grens.
Niet alleen spraak
De technologie is niet beperkt tot spraak. In principe kan het elk tijdsafhankelijk signaal verwerken. Video, afbeeldingen of continue datastromen van sensoren zijn even geschikt. Denk aan sensoren die voortdurend hun omgeving meten en autonoom kunnen reageren, zonder dat ze om de paar dagen een nieuwe batterij nodig hebben of sterk afhankelijk zijn van een internetverbinding. Veel rekenkundige taken kunnen lokaal en energiezuinig worden uitgevoerd, waardoor apparaten slimmer en onafhankelijker worden.
De chips zijn gebaseerd op standaard silicium en werken bij kamertemperatuur. Daardoor is het haalbaar om ze in bestaande halfgeleiderfabrieken te produceren. “Dat maakt opschaling naar praktische toepassingen veel realistischer”, legt Van der Wiel uit.
AI-taken versnellen
Hetzelfde principe zou ook kunnen worden gebruikt om veeleisende AI-taken te versnellen. Specifieke delen van complexe algoritmen zouden rechtstreeks in materialen kunnen worden ingebed, waardoor conventionele chips worden ontlast. Deze hybride aanpak zou traditionele digitale schakelingen in staat stellen om samen te werken met in-materia-componenten die bepaalde taken veel efficiënter uitvoeren.
In de afgelopen vijf jaar zijn er twee gevallen geweest waarin een UT-onderzoeker de eerste auteur was van een Nature-artikel. In 2020 was dat Tao Chen en in 2025 Violetta Sharoglazova. In beide gevallen waren alle auteurs verbonden aan de Universiteit Twente. (Universiteit Twente).
Technologie


