Gemini van Google laat zien hoe snel GenAI zich ontwikkelt

by Ziptone

Gemini van Google laat zien hoe snel GenAI zich ontwikkelt

by Ziptone

by Ziptone

GeminiMet de komst van Google’s AI-model Gemini 1.0 is een nieuwe fase ingeluid in de AI-wedloop tussen Microsoft/OpenAI, Meta en Google. Ook Elon Musk mengt zich in de strijd.

 

 

Waar de vorige versie van Google’s AI-chatbot Bard nog relatief slecht scoorde, lijkt de opvolger van Bard veelbelovend. Hoewel eerder uitgesteld tot begin 2024 is Google nu versneld naar buiten getreden met een nieuwe versie van de eigen GenAI onder de naam Gemini. Het lijkt er sterk op dat Gemini zelfs de laatste versie van ChatGPT inhaalt, vanwege de opvallende multimodale prestaties.

Multimodaal: kansen voor customer service

Multimodaal en generatieve AI betekent in het geval van Google Gemini dat de AI-oplossing kan meekijken en meeluisteren met de gebruiker, maar ook zelf allerlei vormen van audio produceren. Daarbij kan de gebruiker ook vragen stellen aan Gemini over stilstaande en bewegende beelden, waarbij Gemini ook logisch redeneert. Zo is Gemini in staat het spelletje “balletje balletje” op te lossen.

Dit logisch redeneren wordt interessant voor klantcontact als er een koppeling met een kennisbank met daarin ook video’s en foto’s kan worden gemaakt; de chatbot zou dan bijvoorbeeld zelfstandig een klant kunnen helpen bij het oplossen van technische vraagstukken zoals het aansluiten van een router.

Lees ook:

Google demo-video over Gemini blijkt deels nep

 

 

Nano, Pro en Ultra

Gemini is gebaseerd op het PaLM 2-model, een eigen LLM van Google. Gemini wordt uitgebracht in drie verschillende versies, waarvan Nano (de lichtste variant) kan draaien op smartphones, Pro wordt gepresenteerd als schaalbare versie en Ultra als topvariant. Daarvan zegt Google zelf dat dit model het is dat “beter presteert dan menselijke experts op het gebied van MMLU (massive multitask Language Understanding), dat 57 onderwerpen combineert, waaronder wiskunde, natuurkunde, geschiedenis, rechten, geneeskunde en ethiek, voor het testen van zowel algemene kennis als het probleemoplossend vermogen.” Deze laatste variant moet nog verder getest worden en wordt door Google gepresenteerd als de enterprise-oplossing.

Gefaseerde uitrol

Ook chatbot Bard zal vanaf heden draaien op Gemini Pro, waardoor die op een hoger niveau kan redeneren, plannen en begrijpen, maar voorlopig alleen in het Engels. Gemini zal ook worden geïntegreerd in andere Google-diensten zoals search en worden toegevoegd aan de Pixel smartphones van Google. Daarmee komen direct functies beschikbaar zoals Samenvatten in de Recorder-app en Smart Reply voor WhatsApp. Met dit soort functionaliteiten komt Gemini in de buurt van Copilot van Microsoft.

Gemini 1.0 is vanaf 13 december beschikbaar voor ontwikkelaars. toevoegen aan eigen AI-producten via de Gemini API in Google AI Studio of Google Cloud Vertex AI.

AI-wedloop

Ondertussen breidt de AI-wedloop zich uit. Naast de LLM’s van Google, Meta (LLaMA) en OpenAI (ChatGPT) mengt ook Elon Musk zich in de strijd. Hij heeft een financieringsronde aangekondigd met een beoogde omvang van 1 miljard dollar. Dat geld is nodig voor xAI, een start-up waarmee Musk de concurrentie wil aangaan met de andere spelers. Ook Amazon is recentelijk gestart met een eigen platform: Amazon Q.

General purpose technologie

Dat generatieve AI steeds beter wordt, leidt ook tot hernieuwde discussies over de impact op werkgelegenheid. Volgens de Utrechtse hoogleraar en econoom Anna Salomons leidt de komst van taalmodellen als ChatGPT en Bard een nieuw tijdperk in. Ze maken van AI een general purpose-technologie, net als eerder de stoommachine: met minimale aanpassingen kan deze voor uiteenlopende doeleinden worden ingezet. Daarbij zal, zo verwacht Salomons, AI vooral een nivellerend effect hebben: een positieve impact op lager opgeleiden en een negatieve impact op (het werk van) hoger opgeleiden. (Ziptone/Google)

Ook interessant

Featured, Technologie
Top