Google Gemini pakt de troon
PLUS: Gemini 2.5 verpulvert alle benchmarks, OpenAI’s nieuwe plaatjesmaker verbluft het internet, en Claude leert eindelijk surfen
De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.
🗞️ Het belangrijkste nieuws
Leuke header, hè? Die hebben we met de nieuwe ChatGPT-plaatjesgenerator gemaakt
De AI-wereld staat in lichterlaaie sinds dinsdagnacht. OpenAI heeft nogal een bommetje gedropt: de nieuwe beeldgenerator in ChatGPT.
Onze tijdlijn staat vol met Ghibli-transformaties van profielfoto’s en fotorealistische afbeeldingen met – eindelijk! – leesbare tekst. Dit is geen kleine update, dit is weer zo’n klassiek ‘ChatGPT-moment’ waarbij iedereen collectief zijn koffie over het toetsenbord spuugt van verbazing.
Wat maakt het zo bijzonder? GPT-4o (de opvolger van DALL-E) levert niet alleen betere afbeeldingen, maar kan ook:
tot twintig verschillende attributen correct koppelen aan objecten (probeer dat maar eens met andere AI’s);
eindelijk tekst fatsoenlijk weergeven in afbeeldingen;
consistente personages creëren over meerdere beelden heen;
jouw foto’s transformeren naar compleet nieuwe stijlen.
Wil je meer weten? Het nieuws was zo opzienbarend dat we gisteren in allerijl een spoednieuwsbrief hebben uitgestuurd. Mocht je hem hebben gemist, check hem hier.
Voor wie heimwee heeft naar de jaren negentig: we hebben voor de grap onze website een Windows 95-make-over gegeven. ChatGPT blijkt namelijk ook verrassend vaardig in het ontwerpen van interfaces uit het dial-up-tijdperk.
Google Gemini 2.5: de feniks is uit zijn as herrezen
Google haalt de rest rechts in met de verrassend snelle lancering van Gemini 2.5 Pro. De zoekgigant, die lange tijd achterliep in de AI-race, staat nu ineens vooraan in het peloton. Een onverwachte positiewisseling, want niemand had zien aankomen dat Google zó snel na Gemini 2.0 al met een nieuw vlaggenschip zou komen – laat staan een dat momenteel het krachtigste AI-model op de markt is.
Wat is er aan de hand?
Gemini 2.5 Pro is Googles nieuwste AI-model met – net als zijn voorganger – ingebouwde redeneercapaciteiten. Het neemt de tijd om na te denken en zichzelf te controleren voordat het antwoord geeft. Alleen doet het dat aanzienlijk sneller en krachtiger dan eerdere versies. Het resultaat? Het model domineert vrijwel alle relevante ranglijsten en verslaat daarmee zelfs de concurrentie van OpenAI en Anthropic.
Onze Wietse vat het kernachtig samen: ‘The incumbent has awoken.’ Hij testte Gemini 2.5 gisteravond en merkte vooral bij programmeren een duidelijk verschil.
De lancering dreigt bijna ondergesneeuwd te raken door alle ophef rond OpenAI’s nieuwe beeldgeneratiemodel, maar de impact is minstens net zo groot: Google heeft nu officieel het beste AI-taalmodel in handen.
Indrukwekkende cijfers
De benchmarkscores liegen er niet om. Gemini 2.5 Pro behaalt recordscores op vrijwel alle fronten:
Humanity’s Last Exam: 18,8 procent (tegenover 14 procent voor OpenAI’s o3-mini).
AIME 2024, wiskunde: 92 procent bij de eerste poging (tegenover 87,3 procent voor o3-mini).
Beeldherkenning (MMMU): 81,7 procent (waar o3-mini dit niet eens ondersteunt).
Lange-contextbegrip (MRCR): 94,5 procent (tegenover slechts 61,4 procent voor o3-mini).
Volgens onafhankelijke beoordelaar Artificial Analysis behaalt het model ‘alltime highscores’ op MMLU-Pro en GPQA Diamond van respectievelijk 86 en 83 procent. Bijzonder indrukwekkend is ook de snelheid: 195 outputtokens per seconde – ruim twee keer zo snel als Gemini 1.5 Pro.
De kracht van Gemini 2.5
De magie van het nieuwe model schuilt in verschillende factoren:
Een enorm contextvenster van 1 miljoen tokens (ongeveer 750.000 woorden) – dat is ruwweg de complete Lord of the Rings-trilogie in één keer. Binnenkort verdubbelt Google zelfs de context naar 2 miljoen tokens. Dat is ongeveer vijf keer zoveel als wat de miniversie van OpenAI’s o3-model aankan.
Superieure visuele capaciteiten: als eerste AI-model komt het in de buurt van menselijke prestaties bij het begrijpen en analyseren van afbeeldingen, grafieken en tabellen.
Indrukwekkende codeervaardigheden: met één simpele prompt kan het model een complete interactieve webapplicatie of zelfs een werkend spelletje bouwen.
Experts zijn onder de indruk
De reacties in de techwereld zijn overweldigend positief. Aaron Levie, CEO van Box, tweet: ‘Googles Gemini 2.5-update is niet aan het klieren. Ongelooflijk hoe snel we nieuwe niveaus van mogelijkheden zien in AI. Niets lijkt te vertragen.’
Ontwikkelaar Haider vat de situatie treffend samen: ‘Gemini 2.5 Pro domineert elke AI-benchmark en -ranglijst. Geen verrassing: het is het eerste model van Google dat echt intelligent aanvoelt – en het toont betere redeneercapaciteiten dan Claude 3.7 Sonnet. Google staat nu op de sterkste positie ooit in de AI-race.’
De grotere vraag: worden AI-modellen een bulkproduct?
Deze ontwikkeling past in een interessante trend. Microsoft-CEO Satya Nadella beweerde onlangs dat AI-modellen steeds meer een bulkproduct worden. Hij stelt dat bedrijven als OpenAI niet meer zijn dan ‘productbedrijven die een ervaring verkopen’ zonder enig geheim recept voor AGI (kunstmatige algemene intelligentie).
De prestaties van Gemini 2.5, samen met de nieuwe modellen van DeepSeek, lijken dit beeld te bevestigen. De scores van topmodellen beginnen steeds dichter bij elkaar te komen. Met een vergelijkbare computerkracht behaal je vergelijkbare resultaten, ongeacht welk bedrijf het model heeft gebouwd.
Kanttekeningen
Natuurlijk is het niet alles goud wat er blinkt. OpenAI’s volledige o3-model moet nog verschijnen – de huidige benchmarkvergelijkingen zijn met de miniversie. Ook zijn de benchmarks zelf soms misleidend: sommige bedrijven gebruiken trucs zoals majority voting (meerdere antwoorden genereren en het beste kiezen) om betere scores te behalen.
Bovendien is de experimentele versie van Gemini 2.5 momenteel gratis te gebruiken, maar dat zal niet lang duren. Google heeft al aangekondigd dat dit het eerste experimentele model wordt met hogere API-limieten én bijbehorende prijskaartjes.
Prijsvoordeel mogelijk doorslaggevend
Een factor die de impact van Gemini 2.5 nog kan vergroten, is de verwachte prijsstelling. Volgens Artificial Analysis: ‘Als Google Gemini 2.5 Pro prijst op een vergelijkbaar niveau als Gemini 1.5 Pro (1,25 of 5 dollar per miljoen input-of outputtokens), zal Gemini 2.5 Pro aanzienlijk goedkoper zijn dan toonaangevende modellen van OpenAI en Anthropic (15 of 60 dollar voor o1, en 3 of 15 dollar voor Claude 3.7 Sonnet).’
Waarom is dit belangrijk?
Voor jou als AI-gebruiker betekent deze ontwikkeling drie dingen:
Google heeft nu echt een plekje verdiend op je shortlist van AI-tools, vooral voor taken die visueel begrip of programmeren omvatten.
De keuze tussen AI-aanbieders wordt steeds meer een kwestie van persoonlijke voorkeur, gebruikerservaring én prijs, niet zozeer van fundamentele capaciteitsverschillen.
Met de nieuwe ‘denkende’ modellen krijg je betere antwoorden, maar je betaalt er ook meer voor – zowel in tijd als in geld.
Voor nu is Gemini 2.5 Pro gratis beschikbaar via Google AI Studio en in de Gemini-app voor abonnees van Gemini Advanced (20 dollar per maand).
⚡ AI Pulse
Ook Claude kan nu eindelijk het web doorzoeken. Na een eindeloos lange wachttijd heeft Anthropic websearch toegevoegd aan Claude. De AI-assistent krijgt hiermee toegang tot actuele informatie. Dat werd ook wel tijd – concurrenten als ChatGPT en Gemini konden dit in AI-jaren al decennia. Het systeem bepaalt zelf wanneer internettoegang nodig is en geeft netjes bronvermeldingen. De functie is momenteel beschikbaar voor betalende Claude-gebruikers in de VS. Hier in Nederland moeten we nog even geduld hebben. Maar wees gerust: tegen de tijd dat wij het krijgen, heeft de concurrentie waarschijnlijk al weer drie nieuwe functies gelanceerd.
OpenAI omarmt Anthropics universele stekkerdoos voor AI. Zoals onze trouwe lezers en luisteraars vast al weten, is MCP (Model Context Protocol) de universele stekkerdoos die Anthropic heeft bedacht voor het koppelen van AI-modellen aan gegevensbronnen. In een verrassende wending heeft OpenAI-CEO Sam Altman nu aangekondigd dat zijn bedrijf dit opensourceprotocol gaat ondersteunen. ‘Mensen zijn dol op MCP en we kunnen niet wachten tot we het in al onze producten hebben geïntegreerd,’ aldus Altman op X. De ondersteuning is vanaf vandaag beschikbaar in de Agents SDK. De ChatGPT-desktop-app en Responses API volgen ‘binnenkort’. Antropics productchef Mike Krieger reageerde sportief: ‘Geweldig om te zien dat de MCP-liefde zich uitbreidt naar OpenAI – welkom!’ Een mooi (en zeldzaam) staaltje samenwerking in Silicon Valley.
🛠️ AI Toolkit+ XL Editie
AI-vibe-codingtools: de democratisering van programmeren (deel 2)
Welkom bij het tweede deel van onze speciale AI Toolkit XL-editie over vibe-codingtools. Afgelopen dinsdag introduceerden we het revolutionaire concept van programmeren zonder zelf een regel code te schrijven. We bespraken ook de eerste drie tools.
Vandaag duiken we in de resterende vier platforms en geven we je een praktisch stappenplan waarmee je zelf met deze tools aan de slag kunt gaan. Want zoals Alexander in onze podcast opmerkte:
‘En zoals dat gaat met elke revolutie, brengt het opwinding en een zekere onzekerheid met zich mee. Want wat betekent het als iedereen zijn eigen digitale wereld kan vormgeven?’
Laten we de reis door de wereld van AI-gedreven softwareontwikkeling voortzetten.
Keep reading with a 7-day free trial
Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.